클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

트럼프 대통령 트윗으로 시작하는 데이터 처리 1 - 리스트 순회 및 문자열 인덱싱 본문

인공지능/파이썬 데이터 분석

트럼프 대통령 트윗으로 시작하는 데이터 처리 1 - 리스트 순회 및 문자열 인덱싱

huenuri 2024. 9. 11. 11:06

이제 본격적인 1주차 학습에 들어가보자. 이번 수업 강사님은 자신의 얼굴을 공개하며 대면으로 수업을 하셔서 더욱 친근감이 느껴졌다. 대부분의 수업은 그냥 PPT만 보여주는 식으로 진행이 되는데 이 수업은 조금 달랐다.

이제 리스트 순회부터 학습을 진행해볼 것이다.


 

 

이론 1 - 리스트 순회하기

 

fruits 안에 사과, 바나나, 키위가 한번씩 저장된다.

 

 

 

 

0부터 9까지의 리스트를 생성한다.

 

 

 

 

range(3) = [0, 1, 2]가 되어 과일이 하나씩 출력된다.


 

 

 

실습 1 - 문장의 단어를 하나씩 가져오기


 

 

 

 

이 실습은 트럼프 대통령의 트윗 3개를 리스트의 각 원소로 저장된 것을 출력하는 내용이다. 트윗은 텍스트 형식으로 리스트에 담겨 있으며, 각각 1월 1일, 2일, 3일의 트윗으로 처리된다.


 

 

 

 

이론 2 - 문자열 인덱싱

 

 

 

이 내용은 모두 아는 거라 기록을 별로 하지 않았다.


 

 

 

 

실습 2 - 단어의 일부분 가져오기 : 인덱싱


 

 

 


 

 

 

이 함수는 리스트를 입력 받아 특정 조건을 만족하는 단어를 출력한다.

 

  • for word in text: 이 구문은 text(즉, trump_tweets) 리스트를 순회하면서, 리스트의 각 단어를 word라는 변수에 순차적으로 할당한다.
    • word 변수 정의: for 반복문에서 text 리스트에 있는 각 원소가 차례대로 word라는 변수에 할당됩니다. 이때, word라는 변수는 반복문 내부에서 자동으로 정의되는 것이므로 따로 word를 선언할 필요가 없다. 따라서 for word in text에서 word는 리스트의 각 단어를 가리키게 된다.
  • if word[0] == 'k': word의 첫 번째 문자가 'k'인 경우, 해당 단어를 출력합니다. 즉, 단어가 'k'로 시작하는지 확인하는 조건이다.

 

 

학습을 마치고

이처럼 간단한 코드는 엘리스 프로그램에서 바로 작성을 하는 것이 훨씬 간편하고 공부 시간도 단축할 수 있었다. 그래프를 그리는 등의 복잡한 코드가 나올 때 그때 주피터 노트북으로 따로 작성해보려고 한다.

지난주부터 파이썬 공부를 하면서 모두 공부했던 내용이라 별로 어렵지 않았다. 그냥 복습한다는 느낌으로 학습을 이어갈 것이다.