일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- ChatGPT
- JDBC
- 순환신경망
- 머신러닝
- 디버깅
- 자바스크립트
- 딥러닝
- rnn
- JSP
- 개발일기
- 혼공머신
- c언어
- 상속
- 중학1-1
- 데이터분석
- 데이터베이스
- 자바
- 자바스크립트심화
- 연습문제
- JSP/Servlet
- SQL
- 컴퓨터구조
- 정보처리기사필기
- 정보처리기사실기
- 파이썬
- html/css
- 컴퓨터비전
- CSS
- 자바 실습
- 중학수학
- Today
- Total
목록텍스트마이닝 (14)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
이어서 텍스트 마이닝 학습을 진행해보겠다. 분량이 생각보다 많은데 과연 오늘 안에 이틀치 수업을 모두 학습하고 내용을 정리할 수 있을지 의문이지만 열심히 해볼 것이다. 이제 아침 공부 시간도 20분도 남지 않았다. 다 하지 못한 건 오후에 이어서 해볼 것이다. 한국어 혐오 표현 텍스트 마이닝 실습 두번째 단어 추출하기 중복되는 단어도 많으므로 이런 작업을 할 때는 전처리 작업을 해주는 것이 좋다. 띄어쓰기와 오타도 교정한 후에 빈도 분석을 해야 올바른 결과를 얻을 수 있다. 여기서는 빈도수가 높은 100개의 단어를 보여주도록 했다. 워드 클라우드 설치 및 한글 폰트 설정 설치한 다음에는 다시 실행되지 않도록 주석 처리를 해준다. 그리고 원드 클라우드가 한글을 지원하지 않아 깨질 수도 있..
머신러닝에서 이 단원만 학습하면 이제 끝이 날 것 같다. 오늘과 내일 이틀에 걸쳐 머신러닝을 모두 마치고 주말에는 딥러닝을 공부해볼 예정이다.이제 거의 끝이 보이는 것 같아 무척 만족스럽다. 처음 이 공부를 시작했을 때 얼마나 두렵고 걱정이 되었는지 모른다. 하지만 파이썬을 공부해놓으니 데이터 분석도 머신러닝도 모두 할만해졌다. 이 모든 것은 그동안 포기하지 않고 공부한 결과이다. 6월부터 난 나름 목표를 정해 단계와 분야로 개발 공부에 집중했다. 아마도 7월에 공부했던 정보처리기사 필기와 데터베이스도 지금의 공부에 많은 도움이 되었다. 이제 텍스트 마이닝 공부를 본격적으로 시작해보자. 아직 쉬는 시간을 갖지 못했지만 조금만 하고 쉬어볼 것이다. 텍스트 마이닝의 개념 텍스트 마이닝은 글자와 캐다라는 ..
늦었지만 새벽 루틴도 실천했고 이제 다시 아침 공부를 시작해볼 것이다. 오늘은 아침을 먹지 않을 것이고(먹는 날은 별로 없지만) 점심 때까지 열심히 공부해보자. 조금 전에 승차권 예매도 했고 이제 아침 공부를 하는 일만 남아있다. 이번에는 조금 전에 학습했던 텍스트 마이닝을 실습하는 시간을 갖기로 하자. 텍스트 분류하는 실습해보기영화 인사이드 아웃2의 영화 리뷰를 가져와서 이 리뷰에 대한 평점을 분석해볼 것이다. 먼저 텍스트 패키지를 설치해준다. 그런 다음 Corpus 파일을 하나 만들고 영화 리뷰를 다음과 같이 작성한다. 10개의 리뷰를 작성하는데 긍정과 부정이 모두 섞이도록 한다. 1. 영화 리뷰 데이터 가져와서 분석하기 Corpus Viewer에도 연결해주는데 1에서 10까지 내용이 잘 보이는지 확..
이번에는 텍스트 마이닝이라고 해서 텍스트를 분류하는 방법에 대해서 알아보고 실습도 함께 진행해볼 것이다. 먼저 텍스트 마이닝이란 무엇인지 살펴보기로 하자.모두 한번 들었던 수업이지만 처음 들었을 때는 무슨 말인지 거의 이해하지 못했다. 오늘 다시 들어보니 무척 신기했고 이런 식으로 데이터를 분류한다는 것을 알게 되었다. 텍스트 마이닝이란 무엇인가? 자연어는 컴퓨터가 알아들을 수 없는데 이를 알아들을 수 있도록 변경하는 작업을 거쳐야 한다. 이런 식으로 활용된다. 텍스트 마이닝을 하는 과정 이번에 실습해볼 것은 감성 분석이다. 텍스트 마이닝을 위해서는 전처리 과정이 필요하다. 한국어는 형태로 단위로 분석을 하는 편이다. 1. 텍스트 데이터 수집 2. 텍스트 전처리..