클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

데이터 전처리 3 - 데이터 전처리의 정렬과 재구조화에 대하여 본문

인공지능/Numpy & Pandas

데이터 전처리 3 - 데이터 전처리의 정렬과 재구조화에 대하여

huenuri 2024. 9. 10. 17:24

지난 시간까지 데이터의 전처리 과정 중에서 병합하는 과정에 대해서 학습해보았다. 이번에는 정렬과 재구조화, 데이터 처리에 대해서 학습해보려고 한다. 한 시간이라는 짧은 시간동안 이 모든 진도를 나갔었는데 분량이 많으면 둘로 나누어서 정리해보려고 한다.

이제 마지막 교시만 남아있다. 남은 시간 열심히 공부해보자!


 

 

 


 

 

 

 

컬럼을 기준으로 정렬하려면 축을 바꾸어주면 된다.

 

 

 


 

 

 


 

 

정렬된 것은 원래 상태로 돌아가있다. 이 원본 데이터를 바꾸어주는 속성이 inplace이다. inplace = True로 하면 출력문이 나오지 않는다.


 

 


 

 

 

 

7번 그룹이 1등이라는 것을 알 수 있다. 여기에 새로운 컬럼을 하나 만들어 몇 위인지 출력해준다.


 

 

 

 

오른쪽 끝에 rank가 출력되고 있다.


 

 

 

 


 

 

 

여기서 월급을 제외한 컬럼을 꺼내볼 것이다.


 

이렇게 3개의 정보를 가져왔는데 이제 피벗 테이블로 만들어보려고 한다.


 

 

 

 

 

 

 

엑셀 파일 없이도 피벗 테이블을 만들 수 있다.


 

 

이제 비슷한 연봉끼리 합쳐줄 것이다.


 

 

melt 함수를 사용해 가로로 정렬해주었다.

 


 

 

 

학습을 마치고

이렇게 해서 정렬과 재구조화에 대해서 학습을 진행해보았다. 데이터 처리 부분은 다음 포스트에서 이어서 정리하려고 한다. 이것까지 하면 분량이 너무나 많아질 것 같다.

오늘 하루만에 이틀치 16시간의 수업을 정리해보는 중이다. 이제 얼마 남지 않은 부분도 잘 정리해봐야지!