일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- pandas
- 정보처리기사실기
- 데이터입출력구현
- 운영체제
- 코딩테스트
- 컴퓨터구조
- CSS
- 정수와유리수
- 딥러닝
- C++
- SQL
- 컴퓨터비전
- 파이썬
- 자바 실습
- 중학수학
- 데이터베이스
- 중학1-1
- JSP/Servlet
- 텍스트마이닝
- numpy/pandas
- 데이터분석
- 머신러닝
- CNN
- 영어공부
- 정보처리기사필기
- html/css
- 자바
- 혼공머신
- 파이썬라이브러리
- 연습문제
- Today
- Total
목록pandas (14)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
오늘은 잠이 잘 오지 않아서 평소보다 일찍 일어나서 새벽 공부를 시작해본다. 앞으로 5시간이나 더 공부할 수 있어서 정말 기쁘다. 2시간 정도는 판다스 공부를 하고 이제 오늘부터는 데이터 시각화 공부를 시작해보려고 한다. 이와 함께 데이터 분석 공부도 하게 될 것 같다.사실 그동안 데이터 분석이 정말 지루하고 재미없는 분야라고 생각했는데 공부해보니 별로 그렇지 않다는 걸 알게 되었다. 오히려 수학을 좋아하는 내게 흥미로운 분야였다. 이제 공부를 시작해볼 것이다. 실습 6 - 데이터 정제하기 특정 이벤트가 있는 날짜의 입장객 수가 평범한 날들에 비해 월등히 높은 것을 알 수 있다. 최하위권에 2018년 1월 24일부터 25일까지가 위치해있는데, 날씨가 맑음임에도 불구하고 아무리 평일이라..
오늘의 마지막 개발 공부가 될 것 같다. 어제부터 다시 영어공부를 시작해서 하루에 적어도 30분은 공부하기로 다짐했다. 마지막 공부라니 아쉬움이 든다. 이번에는 데이터를 추출하는 방밥을 배우게 된다. 먼저 개념을 한번 정리해보기로 하자. 실습 5 - 데이터 추출하기 A:B로 슬라이싱을 하면 A 부터 B까지, 즉 B포함한 범위를 인덱싱한다. 예를들어 3:6 의 범위를 지정한다면 인덱스가 3부터 6까지인 데이터, "어른":"외국인" 의 범위를 지정한다면 "어른"부터 "외국인" 까지의 데이터를 지정하게 된다.또한 이렇게 슬라이싱을 활용해 추출한 데이터들은 복수의 데이터이므로, 시리즈 혹은 데이터프레임 형태라는 사실을 알아두자. iloc은 위치 기반 인덱싱을 사..
네번째 실습을 진행해본다. 하나의 실습을 진행하는데 30분 정도 걸리는 것 같다. 실습 4 - 데이터 요약하기 학습을 마치고이렇게 해서 네번째 실습도 무사히 잘 마쳤다. groupby 하는 법과 집계함수에 대해서 잘 이해하며 배울 수 있었다. 이제 실습을 한 개만 더 진행하고 오늘 하루를 마무리하려고 한다.슬슬 졸음이 몰려오며 취침 준비를 해야 할 것 같다.
2시간 안에 4개의 실습을 진행할 수 있을까? 하는데까지 최대한 빠르게 학습을 진행해보자. 이번에도 데이터 변환 실습이다. 실습 3 - 데이터 변환하기 2 눈/비로 통합되었다. 학습을 마치고람다함수를 그동안 써보기는 했어도 제대로 사용할지는 몰랐는데 이 수업을 통해 어느정도 잘 사용할 수 있게 되었다. 조건문보다 훨씬 더 간단하게 쓸 수 있는 좋은 기능인 것 같다. apply 함수도 배웠고 오늘 들은 수업에서도 등장하는 개념들이 있어 도움이 많이 되었다.다음 실습도 진행해봐야지.
운동을 갔다와서 샤워하고 나서 저녁을 먹기 전에 잠시 시간이 있어 공부하고 싶은 생각이 제일 먼저 들었다. 이젠 그 어더일보다 개발 공부하는 일이 가장 즐거워졌다.판다스 두번째 실습을 진행해본다. 실습 2 - 데이터 변환하기 1 데이터 타입은 아직 바뀌지 않았다. 타입이 하나도 바뀌지 않았다. 데이터프레임에 뭔가 변형을 가하거나 작업하는메서드들은 데이터프레임 자체를 변환하지 않고 변환된 새로운 데이터프레임을 반환한다. df의 "어른" 컬럼을 정수형으로 변환하기는 하지만, 그냥 정수형으로 바뀐 "어른" 컬럼을 시리즈 형태로 나타낼 뿐 df의 "어른" 컬럼 그 자체가 바뀌는 것이 아니다. df의 "어른" 컬럼을 바꾸고 싶다면 astype()을 활용해 변환하여 생성한 "어른" ..
세 달 전에 엘리스 자체 프로그램으로 실습해보았던 내용을 오늘 다시 한번 처음부터 다시 실습해보기로 했다. 내용 정리는 지난 번에 정리한 것을 읽어보는 것으로 충분한 것 같아 이해가 되지 않는 부분만 영상을 다시 시청해볼 것이다. 대신 실습은 중요하고 혼자서는 어려우니 영상을 함께 시청하며 공부하기로 했다.조금 전에 주피터 노트북으로 실행할 수 있는 모든 세팅을 완료했다. 필요한 자료도 모두 받아놓았으니 이제 실습을 해보는 것만 남아있다. 공부가 요즘 참 재미있다. 하기 싫은 순간을 이기면 충분히 즐길 수 있다는 걸 요즘 느꼈다. 실습 1 - 데이터 살펴보기 학습을 마치고첫번째 실습을 완료하였다. 처음 학습할 때 정리했던 학습일지를 살펴보며 그때 내가 어떤 ..
실습 과제는 강의 영상이 따로 없어서 혼자서 코드를 읽고 학습을 진행하려고 한다. 선생님이 코드를 틀리셔서 이 오류를 잡는데 한참의 시간이 걸렸다. 그래도 이렇게 찾을 수 있다는 게 얼마나 놀라운 발전인지 모른다. result라는 변수에 담아야 하는데 그렇지 않으면 value 오류가 뜬다. 콤마 대신에 |을 써도 잘 출력이 된다. not-null 데이터가 비어있지 않는 것을 말한다. 결측치가 있는 것을 확인해야 하는데, 가슴 둘레와 머리 둘레에 결측치가 있다. 결측치가 현재 데이터보다 많을 때는 어떻게 해야 하는지도 배우게 될 것이다.데이터 정보에서 확인해야 할 것은 두 가지이다. 하나는 결측치가 있는지, 데이터 타입이 숫자 형태인지이다. object는 문자열 형태인데 이 타입..
판다스 기초 수업이 얼마 남지 않았으니 조금 더 힘을 내서 공부를 진행해보자. 특정 데이터를 잘라서 가져올 때 loc, iloc 인덱서를 자주 사용한다. 독립적이지 않고 의존된 것을 파생 변수라고 한다. 나머지 값은 뒤로 밀려난다. 계속해서 value오류가 떠서 왜 그런지 한참 고민했다. 선생님은 21개의 열이라고 했지만 len을 출력해보니 22개였다. 설명을 잘못하신 거였다.이 부분을 이렇게 수정했다. 이제 잘 불러왔고 마지막 5개의 데이터만 가져왔다. 학습을 마치고판다스에 대한 기초는 여기서 마치려고 한다. 나머지는 실습 과제인데 이 부분은 다음 포스트에서 이어서 학습하려고 한다. 내용이 많이 지루해서 수업을 듣기 힘들었..
판다스 수업이 정말 많이 지루해서 그만하고 싶은 마음이 많이 들지만 그래도 다시 마음을 잡고 공부해보기로 했다. 이제 2시간만 있으면 오전 수업도 끝이 난다. 이 두 시간 동안 판다스까지는 공부를 마쳐야겠다. 시리즈 연산은 각각의 인덱스를 찾아가며 하는 연산이다. 공백으로 대체한다. 학습을 마치고이번 수업은 영상이 빠진 부분이 많아서 그냥 혼자서 코드를 읽고 정리한 부분이 많았다. 잘 이해되지 않는 부분도 있었는데 선생님 두 분이서 진행하니 서로 다른 스타일과 내용을 배울 수 있어서 더 좋은 것 같다.다음에는 불리언 인덱싱과 데이터를 추가하는 방법에 대해서 학습해보려고 한다. 아직도 공부하기 싫은 마음과 많이 싸우고 있지만 말이다.
이번에는 일주일 정도 강의를 하시고 훌쩍 떠나신 선생님의 영상을 다시 들으며 내용을 정리해보려고 한다. 넘파이는 어제 정리했고 판다스만 하면 될 것 같다. 어제는 인터넷이 정말 안되서 공부하는데 많이 힘들었지만 오늘은 나름 괜찮은 것 같다. 이어서 공부를 시작해보자. object는 객체 타입이다. 문자열로 받으면 컴퓨터는 어떤 타입으로 지정해야 할지 잘 모르기에 object로 받아들인다. 학습을 마치고중간에 영상이 없어서 그냥 내용만 붙여넣어본다. 지금은 무슨 말인지 이해가 되지 않는 것도 있지만 나중에 더 공부하다보면 알게 될 것 같다.분량이 정말 많아서 언제 다 정리할까 싶다. 확실히 데이터 분석 수업은 지루하다. 그래도 난 지금 공..