클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

영어 단어 모음으로 시작하는 텍스트 파일 분석 4 - 데이터 정렬하기 본문

인공지능/파이썬 데이터 분석

영어 단어 모음으로 시작하는 텍스트 파일 분석 4 - 데이터 정렬하기

huenuri 2024. 9. 12. 12:47

이번에는 데이터를 정렬하는 방법에 대해서 학습해보겠다.


 

 

 

이론 4 - 데이터 정렬하기

 

절대값 순서대로 정렬하고 싶을 때 abs를 사용한다.

 

 

 

 

 

 

 

reverse는 순서를 뒤짚어주는 함수이다.


 

 

 

 

실습 4 - 데이터 정렬하기 : sorted()

 


 

 

튜플로 키와 value값을 넣는 것은 조금 어려운 것 같다. 아직 pair[1]이 무엇을 의미하는지 잘 이해가 되지 않았다. 이 코드를 분석해보면 다음과 같다.

 

  1. pairs 리스트

각각 단어와 그 단어의 빈도수를 나타내는 튜플((단어, 빈도수))로 구성되어 있다. 예를 들어, 'time'이라는 단어는 8번 등장했고, 'turbo'는 1번 등장했다는 의미이다

 

  2. get_freq 함수

 

  • 이 함수는 (단어, 빈도수)로 이루어진 튜플을 받아서 해당 튜플의  두 번째 값(빈도수)을 반환한다.
  • 예를 들어, ('time', 8)이 입력되면 8을 반환한다.

  3. sort_by_frequency 함수

 

 

  • 이 함수는 pairs 리스트를 받아서, 빈도수를 기준으로 정렬한 새로운 리스트를 반환한다.
  • sorted(pairs, key=get_freq)는 get_freq 함수를 key로 사용하여 리스트의 각 튜플에서 빈도수를 기준으로 정렬한다.
  • 예를 들어, 위의 pairs 리스트를 정렬하면 빈도수가 낮은 순서대로 ('turbo', 1), ('time', 8), ('the', 15)로 정렬된다.

 


 

 

학습을 마치고

튜플과 리스트로 작성된 것을 정렬하는 함수에 대해서 배웠다. pair[1]은 두번째 요소인 빈도수를 의미했다. 모르는 내용은 이렇게 찾아보면서 공부하면 많은 것을 알 수 있게 된다. 귀찮다고 그냥 넘어가면 더 알아야 할 것들을 놓치게 된다.

다음에는 시간이 걸리더라도 모르는 건 이렇게 찾아보면서 공부해보려고 한다.