일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- html/css
- 컴퓨터구조
- rnn
- 자바
- 자바스크립트심화
- 디버깅
- c언어
- 컴퓨터비전
- 딥러닝
- 자바스크립트
- 파이썬
- 혼공머신
- 정보처리기사실기
- 상속
- 중학1-1
- JSP
- JDBC
- 중학수학
- 자바 실습
- SQL
- 오블완
- 연습문제
- 개발일기
- JSP/Servlet
- 데이터분석
- 정보처리기사필기
- 데이터베이스
- CSS
- 머신러닝
- 순환신경망
- Today
- Total
목록기술통계 (3)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
이어서 기술 통계 관련 내용을 학습하고 정리해보는 중이다. 여기까지만 학습하고 이제 판다스로 돌아와서 다른 공부를 진행해야지. 얼마 남지 않았으니 좀더 힘을 내보자! 결측치를 채울 때 박사학위를 딴 사람을 5000만원으로 하게 되면 큰 오차가 발생한다. 두 범주가 그룹으로 묶여 고등학교 졸업부터 박사.. 학사까지 각각 출력되고 있다. 그룹별로 서로 다른 값을 보고 싶을 때 사용한다. 파이썬에서 corr을 입력하면 숫자 형태로 출력된다. 수치가 -1에 가까울수록 음의 상관관계, 1에 가까울수록 양의 상관관계이다. 내림차순으로 정렬할 때는 절대값을 띄워야 한다. 양이 중요한 것이지 숫자의 부호는 중요하지 않기 때문이다. 자료가 너무 많을 때는 상관관계가 ..
이제 오후 공부를 시작해보려고 한다. 조금 전에 보안 특강이 있어서 한 10분 정도 수업을 들었는데 별로 들을만한 내용이 없어서 수업 도중에 나와 자율학습을 하는 중이다. 점심시간에 학습했던 내용에 이어서 기술통계 공부를 하려고 한다. value_counts()는 비율을 구할 때 많이 사용한다. 앞의 1년 쪽의 데이터가 많이 분포되어 있음을 볼 수 있다. 근속연수가 비어있을 때 평균으로 할지 중앙값으로 할지 고민해봐야 한다. True와 False로 출력되고 있다. 여기서 True만 가져오면 된다. 반복문을 쓸 때 하나만 우선 해보고 적용하면 쉽게 할 수 있다. 학습을 마치고분량이 많으니 그룹화에 관한 다른 내용은 다음 포스트에서 이어서 하려고 한다. 이제 기초..
이번에는 기초 통계 수업 내용을 다시 들으며 정리하려고 한다. 오늘은 점심시간을 이용해 공부를 더 해볼 것이다. 기술 통계는 기술하다의 약자로 어떤 것을 묘사하는 것이다. 기술 통계 이론 개념 학습 문제 데이터를 독립 변수, 정답 데이터를 종속 변수라고 한다. 머신러닝은 통계학, 데이터마이닝 같은 분야에서 응집해서 나온 분야이다. 대표값과 평균값, 중앙값 중앙값은 오름차순으로 정렬한 후 가장 가운데 있는 값, 최빈값은 가장 많이 나온 빈도수의 값이다. 이상치는 제거하고 데이터 분석을 한다. 사분위수 예를 들어 값이 이렇게 된다면 우리는 여기서 이 값들이 뒤쪽으로 많이 몰려있음을 알 수 있다. 중위수는 왼쪽 5..