일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 운영체제
- 머신러닝
- 자바 실습
- 정수와유리수
- CNN
- JSP/Servlet
- 코딩테스트
- C++
- 영어공부
- 데이터분석
- 데이터베이스
- 중학1-1
- 혼공머신
- SQL
- 딥러닝
- 중학수학
- numpy/pandas
- html/css
- CSS
- 정보처리기사실기
- 파이썬
- 텍스트마이닝
- pandas
- 자바
- 데이터입출력구현
- 정보처리기사필기
- 컴퓨터구조
- 파이썬라이브러리
- 연습문제
- 컴퓨터비전
- Today
- Total
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
허깅페이스 2 - 한국어를 영어로 번역하고 요약하며 텍스트를 음성으로 들려주는 허깅페이스 모델 사용해보기 본문
이어서 허깅페이스로 모델을 가져와서 한글을 번역하는 실습 등을 진행해보려고 한다. 지금 인터넷 환경이 조금 불안정해서 코랩을 사용하는데 불편함이 있지만 그래도 이런 부분을 감수하며 공부를 진행해보려고 한다.
허깅페이스 사용하기 두번째 실습
1. 번역하는 모델 가져와서 사용하기
먼저 허깅페이스에 들어가서 translate 메뉴를 선택하고 거기서 한글을 영어로 번역하는 모델을 가져온다. ko-en이라고 검색하면 된다.
이 모델을 사용해보려고 한다.
이 모델을 사용하게 된다. 그리고 구글 코랩에 와서 조금 전처럼 모델 이름을 작성해준다.
처음에는 이 코드를 실행할 때 오류가 떴는데, 그 이유는 파이프라인으로 임포트를 하지 않았기 때문이다. 매번 프로젝트를 다시 실행하게 되면 맨 처음 코드는 반드시 실행해주어야 한다는 걸 알게 되었다.
이렇게 여러 가지 문장을 써보면서 번역을 시켜보았는데, 잘 번역이 되지 않는 한국어도 있었다. 예를 들면 열공하자를 치면 Let's go가 10번 출력되고 있었다.
이제 새로운 실습을 진행해보자.
2. 요약을 해주는 기능
이번에는 summarization에서 요약을 할 수 있는 다음과 같은 모델을 가져온다.
그런 다음에 여기 짜여져 있는 코드를 가져다가 그대로 복사한다.
서울대학교에 만든 모델로 한글에 대한 형태소 분석이 잘 되어 있으나 너무 세분화하여 오류가 많이 날 수도 있다. 사용하는 언어에 따라 토근화가 다르게 사용된다.
드디어 토크나이저가 제대로 되었다. 분명 두 달 전에는 잘 되었던 코드인데 다시 실행하니 안 되었다. 그 이유는 인터넷이 불안정하면 그럴 수 있다고 한다. 다시 끄고 해보니 이번에는 잘 되었다.
요약이 잘 되는 것을 볼 수 있다.
3. 글자를 음성으로 변환하는 기능
단어를 쓰면 음성으로 들려주는 기능을 구현해볼 것이다.
이 모델은 음성이기 때문에 설치해 주어야 하는 부분이 있다.
here라고 있는 부분을 클릭하면 설치하는 링크로 이동한다.
설치하는 이 코드를 복사해준다.
소스 코드 다운로드하기
앞의 느낌표를 하고 붙여 넣으면 소스 코드를 다운로드할 수 있다.
여기 파일에 들어가 있음을 볼 수 있다. 그리고 다음 줄도 실행해준다.
설치하는데 굉장히 시간이 많이 걸린다. 그리고 처음에 실행하면 오류가 뜨면서 커널을 재시작하라는 표시가 나타나기도 한다. 이때 당황하지 말고 한번 껐다가 켜서 다시 실행하면 잘 되는 걸 확인할 수 있다.
근데 여기서부터는 영상이 없어서 그냥 코드를 보면서 혼자서 분석해야 할 것 같다.
두번째 코드는 MeloTTS를 찾을 수 없다는 코드인데 이건 없어도 될 것 같아 삭제했다. 왜 썼는지 모르겠다.
소스 코드 네 줄을 실행한 다음에는 사이트에 있는 한국어 견본 코드를 가져와 실행해주었다. 마지막 코드는 음성 파일을 저장할 경로를 kr.wav로 설정하고 음성의 속도를 기본 속도로 저장한다는 뜻이다.
이 폴더에 가면 kr.wav를 찾아 클릭하면 다운로드가 되고 이걸 실행시켜보았다. 정말 텍스트로 변환되어 음성이 나와 신기했다.
학습을 마치고
이번에는 허깅페이스에서 3가지 모델을 가져와서 여러 종류의 실습을 진행해보았다. 문장을 번역해주는 기능, 요약해주기, 음성으로 들려주는 기능까지 사용해보았다.
이 프로젝트의 마지막 실습이 남아있지만 학습일지가 많이 길어질 것 같아 그 내용은 다음 포스트에 이어서 학습해보려고 한다. 조금 전에 모니터도 듀얼로 사용할 수 있도록 꾸며보았고 며칠 동안 집에서 공부할 환경이 잘 갖추어져서 정말 감사하다. 이제 밤 11시가 다 되어서 슬슬 잠이 몰려오지만, 오늘 공부를 별로 하지 못한 것 같아 정말 아쉽다.
오늘 허깅페이스를 다 하고 플라스크 실습까지 하는 건 무리인 것 같다. 그래도 첫번째 프로젝트까지는 마무리를 해보려고 한다.
'인공지능 > 머신러닝' 카테고리의 다른 글
허깅페이스 4 - 파인 튜닝 모델 사용해보기 1 : 파인 튜닝의 개념 및 학습 데이터 로딩하고 전처리하기 (0) | 2024.09.15 |
---|---|
허깅페이스 3 - 객체 탐지 기능 사용해보기 : Yelo 모델 (0) | 2024.09.14 |
허깅페이스 1 - 구글 코랩으로 허깅페이스 모델 사용해보는 실습해보기 (0) | 2024.09.14 |
Orange 10 - 영화 리뷰 텍스트 분석 실습해보기 두번째 (2) | 2024.09.14 |
Orange 9 - 영화 리뷰 데이터로 텍스트 분류하는 실습해보기 (0) | 2024.09.14 |