일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- numpy/pandas
- C++
- SQL
- 운영체제
- pandas
- 코딩테스트
- 연습문제
- CNN
- 컴퓨터비전
- 자바
- 파이썬라이브러리
- 영어공부
- 중학수학
- 자바 실습
- 데이터베이스
- 딥러닝
- 머신러닝
- 컴퓨터구조
- 중학1-1
- 정수와유리수
- 데이터분석
- JSP/Servlet
- 혼공머신
- 데이터입출력구현
- CSS
- 정보처리기사필기
- 파이썬
- 정보처리기사실기
- html/css
- 텍스트마이닝
- Today
- Total
목록인공지능/머신러닝 (113)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
늦었지만 새벽 루틴도 실천했고 이제 다시 아침 공부를 시작해볼 것이다. 오늘은 아침을 먹지 않을 것이고(먹는 날은 별로 없지만) 점심 때까지 열심히 공부해보자. 조금 전에 승차권 예매도 했고 이제 아침 공부를 하는 일만 남아있다. 이번에는 조금 전에 학습했던 텍스트 마이닝을 실습하는 시간을 갖기로 하자. 텍스트 분류하는 실습해보기영화 인사이드 아웃2의 영화 리뷰를 가져와서 이 리뷰에 대한 평점을 분석해볼 것이다. 먼저 텍스트 패키지를 설치해준다. 그런 다음 Corpus 파일을 하나 만들고 영화 리뷰를 다음과 같이 작성한다. 10개의 리뷰를 작성하는데 긍정과 부정이 모두 섞이도록 한다. 1. 영화 리뷰 데이터 가져와서 분석하기 Corpus Viewer에도 연결해주는데 1에서 10까지 내용이 잘 보이는지 확..
이번에는 텍스트 마이닝이라고 해서 텍스트를 분류하는 방법에 대해서 알아보고 실습도 함께 진행해볼 것이다. 먼저 텍스트 마이닝이란 무엇인지 살펴보기로 하자.모두 한번 들었던 수업이지만 처음 들었을 때는 무슨 말인지 거의 이해하지 못했다. 오늘 다시 들어보니 무척 신기했고 이런 식으로 데이터를 분류한다는 것을 알게 되었다. 텍스트 마이닝이란 무엇인가? 자연어는 컴퓨터가 알아들을 수 없는데 이를 알아들을 수 있도록 변경하는 작업을 거쳐야 한다. 이런 식으로 활용된다. 텍스트 마이닝을 하는 과정 이번에 실습해볼 것은 감성 분석이다. 텍스트 마이닝을 위해서는 전처리 과정이 필요하다. 한국어는 형태로 단위로 분석을 하는 편이다. 1. 텍스트 데이터 수집 2. 텍스트 전처리..
수업 시간에 만들었던 작업을 그래도 붙여 넣어 학습일지를 쓰는 것보다 처음부터 다시 해보는 게 더 도움이 되는 것 같다. 사실 이렇게 하면 시간이 많이 걸릴까봐서 하지 않으려 했는데 조금 전에 오류가 생겨서 새로 파일을 만들어서 하나하나 따라서 해보니 더 잘 기억이 되었다. 이번 실습부터는 모든 예제를 혼자서 직접 따라해보려고 한다. 이번에는 이미지 관련 실습이다. 이미지 분류 실습 - 사진 추출 및 유사도 검사이미지를 사용하기 위해서는 먼저 이미지를 처리하는 패키지를 설치해주어야 한다. option에서 add를 클릭한 후 image를 검색해서 다음과 같은 설치를 진행한다. 처음에는 잘 되지 않아서 정말 여러 번 시도한 끝에 마침내 해결했다. 텍스트와 이미지 데이터는 컴퓨터가 인지하는 것과 사람이 인지하..
집에 와서 이어서 8교시때 마무리하지 못한 와인 실습을 진행해보려고 한다. 여기까지 모두 학습을 마치고 저녁 운동을 하러 가야겠다. 집에 도착하자마자 바로 운동을 하면 좋은데 오자마자 공부를 먼저 해야 저녁에도 공부하는 것을 더 쉽게 할 수 있게 된다. 이것이 지난 한 달 동안의 나의 루틴이다. 정말 하기 싫은 날도 집에 오자마자 공부부터 하면 머리도 마음도 한결 가벼워진다. 이제 나머지 공부를 시작해보자! 와인 분류 실습 두번째 - 전처리를 했을 때 train 데이터와 test 데이터를 각기 연결해준다. 중요한 점은 앞부분은 데이터를 가져와야 하니 Data Sample에서 오지만, 뒷 부분은 예측을 해야 하니 Remaining Data에 넣어주어야 한다는 것이다. 데이터의 70%가 잘 들어가있음을 확인..
BMI 실습이 끝나고 두번째로 와인을 분류하는 실습을 진행해볼 것이다. 오늘 하루가 언제 지나가나 싶었는데 이제 마지막 교시가 50분도 남지 않았다. 아마 다 정리하지는 못하고 집에 가서 이어서 해야 할 것 같다.오늘 아침에는 정말 공부하기가 싫어서 이 마음과 싸우는데 많은 시간을 보냈다. 어떤 과목이든 그 수업에 매력을 느끼게 되기까지 적어도 몇 시간의 시간은 걸리는 편이다. 이렇게 마음과 싸우고 고분고투하는 동안 그 과목과 많이 친해지게 된다. 따라서 이 시간은 결코 아까운 시간이 아니다. 오늘 목표했던대로 하루만에 Orange를 모두 다 학습하는 건 정말 무리였다. 하지만 내일 새벽까지 해서 왠지 다 할 수 있을 것 같다는 생각이 든다.그리고 내일부터 시작될 추석 명절이 정말 기대된다. 명절에도 난..
지금까지 배운 내용을 머신러닝 내용을 한번 정리하는 시간을 갖기로 하자. 첫날 수업의 영상이 없어 걱정이었는데 이렇게 선생님이 한번 복습으로 정리해주시니 이해가 잘 되었다. 1. 머신러닝 개념 정리하기 머신러닝은 새로운 데이터가 들어왔을 때 이전 데이터에서 이 데이터를 예측하는 과정을 말한다. 학습 알고리즘을 통해서 성능을 높여나가는 것이 우리의 최종 목적이 된다. 클래스의 개수에 따라 달라지는데 2개이면 이진분류, 3개 이상이면 다중 분류라고 한다. 이번에는 머신러닝 7 과정에 대해서 정리해보기로 하자. 전처리 과정을 통해 이상치나 결측치를 채워준다. 단위변환은 KNN 모델에서 많이 사용하는데, 이 모델은 새로 들어온 데이터와 원래 있는 데이터의 최근 거리를 계산한다. 그렇기에 데이터들의 단위가 중요하..
머신러닝 4단계 과정이 끝난줄 알았는데 아직 몇 가지 과정이 남아있었다. Data Sampler로 훈련용과 평가용을 분리하는 일이다. 그럼 나머지 학습을 이어서 시작해보자!다시 머신러닝 공부가 재미있어졌다. BMI 예측 실습해보기 2 4. Data Sampler (Train/Test 분리) 훈련 데이터(Train Data)와 평가용 데이터(Test Data)로 나뉘는 과정과 각각의 세부 내용을 보여주는 자료이다. 이 과정을 통해 머신러닝 모델을 학습시키고 평가할 수 있게 된다.Orange의 Data Sampler를 통해 전체 데이터를 70%는 훈련 데이터, 30%는 테스트 데이터로 나누었다. Train Data (훈련 데이터)350개의 인스턴스가 훈련 데이터로 사용됨이 데이터는 머신러닝 모델이 ..
오렌지 프로그램의 첫번째 실습을 진행해보겠다. 수업 영상이 없어서 그냥 파일만 보고 어떤 내용인지 스스로 추측하며 학습일지를 정리해보려고 한다. BMI 예측 실습해보기 1. 문제 정의 및 데이터 수집 1. 문제 정의목표: 500명의 키와 몸무게 데이터를 바탕으로 BMI(체질량지수)를 예측하는 문제를 해결하는 것 각 컬럼(열)에는 데이터 유형과 역할을 정의한다. Gender (성별) Type: 범주형(Categorical) 데이터로 설정되었다. 이 열은 'Female', 'Male' 두 개의 값으로 구분된다. Role: skip으로 설정되어, 성별 데이터는 모델 학습에 사용되지 않는다. 성별은 BMI를 예측하는 데 중요한 역할을 하지 않기 때문에 학습에 포함하지 않은 것으로 보인다. Height (키) T..
오늘은 공부가 잘 안되는 것 같다. 내일부터 쉬는 날이라서 그런지 마음이 조금 들떠있는지도 모르겠다. 그래도 오늘까지는 열심히 공부해야 한다.다시 머신러닝 학습을 이어가기로 하자. 별로 재미있는 내용은 아니라서 지루할 수 있겠지만 공부란 게 원래 재미있는 건 아니다. 필요하니까 하는 거지. 머신러닝 모델 훈련과 테스트 과정 1. 문제 데이터 (Feature, Input Data)Feature (입력특성): 머신러닝 모델이 학습할 때 사용되는 독립 변수(Feature), 즉 입력 데이터이다. 문제를 해결하기 위해 제공되는 데이터의 속성 또는 특성이라고 할 수 있다. 예를 들어, 집값 예측 문제에서는 '집 크기', '방 개수' 등이 Feature에 해당된다.Label (종속 변수): 입력 특성(Fea..
이제 오늘의 아침 공부를 시작해보려고 한다. 아침에 보통 9시 5분이 조금 넘어서 도착하는데 공부할 준비하면 10분, 그리고 공부할 마음의 준비까지 하며 진짜 본격적인 학습에 들어가기까지 20분이 더 걸리는 것 같다. 이제 9시 반이 다 되어 오늘의 공부를 진짜 시작할 수 있을 것 같다. 아침에 이틀치 수업 분량을 정리하고, 오후와 저녁에는 셋째날 수업 내용을 정리해서 오늘 하루만에 오렌지 공부를 다 마치려고 한다. 며칠 전에 넘파이와 판다스 학습할 때도 하루만에 모두 끝냈다. 충분히 가능하리라 믿고 학습을 시작해보자. 그리고 내일부터는 추석 연휴 기간이니 지금처럼 공부를 많이 하지는 못할 것 같다. 머신러닝이란 무엇인가?머신러닝은 데이터를 활용하여 특성(Features)과 패턴(Patterns)을 찾아..