관리 메뉴

클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지

순환 신경망(RNN) 8 - 자연어 처리 6 : 한국어 감성 분석 5 <KoBERT 토그나이저> 본문

인공지능/딥러닝

순환 신경망(RNN) 8 - 자연어 처리 6 : 한국어 감성 분석 5 <KoBERT 토그나이저>

huenuri 2024. 12. 19. 12:25

실행하는 코드마다 안돼서 너무 화가 난다. 공부를 다 때려치우고 싶은 심정이지만 그래도 다시 한번 공부를 진행해 보기로 했다. 정말 하고 싶은 공부만 하고 싶지만 세상 일은 그렇지 못하다.

하기 싫어도 해야 하는 것이 있다. 어쨌든 잘 되지 않아도 시도는 해볼 것이다.


 

 

 

 

 

한국어 감성 분석 마지막

 

KoBERT 토크나이저

SK T-Brain에서 한국어 성능 향상을 위해 개발한 KoBERT 토크나이저가 있다. 덕분에 쉽게 한국어 사전에 학습된 모델과 토큰화를 활용할 수 있다. 순환신경망 모델은 그대로 활용하고 토크나이저만 KoBERT를 적용한다. 먼저 SK T-Brain 깃허브에서 KoRERT를 다운로드해 설치한다.

 

 

 

오류 메시지를 보면, onnxruntime 라이브러리가 requirements.txt에서 지정된 버전(<=1.8.0, ==1.8.0)과 맞지 않아서 설치가 실패했어. 따라서 이 문제를 해결하려면 onnxruntime의 버전 요구 사항을 조정하거나, 설치 가능한 버전을 확인한 뒤 적절히 수정해야 한다.

 

 

설치 가능한 onnxruntime 버전 확인

!pip install pip-review
!pip-review --list | grep onnxruntime

 

이 명령어는 설치 가능한 모든 패키지와 현재 버전의 정보를 출력하며, onnxruntime 패키지와 관련된 설치 가능한 버전을 필터링해 보여준다.

 

 

 


 

 

 

특정 버전 설치하기

 

 

 

라이브러리가 불러와지지 않아 다른 것도 여러 가지 설치해주었다.

 

 

 

 

 

 


 

 

 

 

 

하지만 그래도 코드 오류가  뜬다. 오류 메시지를 보면 numpy의 np.bool이 더 이상 사용되지 않기 때문에 발생하는 문제야. 이 문제는 gluonnlp 라이브러리와 관련된 것으로, 최신 버전의 numpy와 호환되지 않는 상태에서 발생했다.

 

 

 

 

numpy 버전 다운그레이드

gluonnlp와 호환되는 이전 버전의 numpy를 설치하면 이 문제가 해결될 가능성이 높다.

 

 

다운그레이드를 해도 업그레이드를 해도 그 어떤 것도 되지 않았다. 


 

 

 

 

학습을 마치고

이건 버전이 맞지 않아서 실습이 되지 않는 문제이니 그냥 넘어가기로 했다. 더 했다가는 완전히 공부 의욕이 꺾일 것 같았다. 적당히 포기하고 넘어가는 것도 미덕인 것 같다.

아무튼 너무 힘들다..