클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

텍스트 마이닝 5 - 텍스트 마이닝 기초 실습 5 : 이모지 제거 및 형태소 분석하기 본문

인공지능/머신러닝

텍스트 마이닝 5 - 텍스트 마이닝 기초 실습 5 : 이모지 제거 및 형태소 분석하기

huenuri 2024. 9. 19. 16:43

이제 불용어 처리는 마쳤고 이모지를 제거하고 형태소 분석을 실습을 진행하려고 한다.


 

 

이모지 제거하기

 


 

 

 

조금 전에 불용어 처리한 단어를 형태소로 분석해본다.

 

 

 


 

 

형태소 분석기 품사 태그

 

GitHub - bab2min/Kiwi: Kiwi(지능형 한국어 형태소 분석기)

Kiwi(지능형 한국어 형태소 분석기). Contribute to bab2min/Kiwi development by creating an account on GitHub.

github.com

 

 

 

너무 많아서 이 정도만 소개해본다. 이중에서 우리는 일반 명사, 동사, 형용사를 필터링해볼 것이다.

 

 

 

 

 

 


 

 

 

이 실습은 혼자서 진행해보라고 과제로 내주셨다. 지금은 말고 나중에 하고 싶을 때 해봐야겠다. 지금은 수업만 듣는 것도 버겁다.

 


 

 

 

학습을 마치고

여기까지 해서 텍스트 마이닝 기초 실습을 모두 마쳤다. 아직 3일 정도의 수업 분량이 남아있는데 내일까지 다 마치려는 목표를 세웠다. 오늘로서 머신러닝 공부한지 일주일째이다. 보통 일주일 정도 하면 한 과목에 질리게 되고 다른 걸 하고 싶은 욕구가 생기곤 한다.

그래도 내일까지만 참고 학습을 마무리해볼 것이다. 오후 공부도 이제 1시간 정도 남았다. 잠시 쉬었다가 공부를 다시 시작해볼 것이다.