클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

기초통계 분석 2 - 데이터 그룹화를 통한 통계 분석 본문

인공지능/Numpy & Pandas

기초통계 분석 2 - 데이터 그룹화를 통한 통계 분석

huenuri 2024. 9. 10. 15:14

이제 오후 공부를 시작해보려고 한다. 조금 전에 보안 특강이 있어서 한 10분 정도 수업을 들었는데 별로 들을만한 내용이 없어서 수업 도중에 나와 자율학습을 하는 중이다. 

점심시간에 학습했던 내용에 이어서 기술통계 공부를 하려고 한다.


 

 

 

 

 

value_counts()는 비율을 구할 때 많이 사용한다.


 

 

 

 

앞의 1년 쪽의 데이터가 많이 분포되어 있음을 볼 수 있다. 근속연수가 비어있을 때 평균으로 할지 중앙값으로 할지 고민해봐야 한다. 


 

 

 

 

True와 False로 출력되고 있다. 여기서 True만 가져오면 된다.

 

 

 

 

 

 

반복문을 쓸 때 하나만 우선 해보고 적용하면 쉽게 할 수 있다.


 

 

 

 

 

 

 


 

 

 

학습을 마치고

분량이 많으니 그룹화에 관한 다른 내용은 다음 포스트에서 이어서 하려고 한다. 이제 기초 통계 수업도 얼마 남지 않았다. 모든 공부는 하나로 연결되어 있음을 느낀다. 이 내용은 사실 데이터베이스에서 학습했던 내용인데 파이썬 수업에서도 응용이 되고 있다.

그러니 기초를 탄탄히 다져야 한다.