일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 정보처리기사필기
- 핵심프로젝트
- 중학수학
- 선형회귀모델
- html/css
- numpy/pandas
- 이수증
- 데이터시각화
- 머신러닝
- 데이터입출력구현
- 선형분류모델
- Orange
- 정보처리기사실기
- 자바
- 딥러닝
- 디버깅
- C++
- 자바 실습
- 데이터베이스
- pandas
- 데이터분석
- 자연수의성질
- 언리얼프로젝트
- 텍스트마이닝
- 요구사항확인
- 파이썬
- 언리얼학습
- 코딩테스트
- JSP/Servlet
- c언어
- Today
- Total
목록인공지능 (164)
클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지
주피터 노트북 대신 코랩이라는 인터넷 환경에서 사용해보려고 한다. 딥러닝은 GPU 자원이 좋아야 빠르고 정확하게 돌아간다. 코랩은 클라우드 상에 띄어져있는 주피터 노트북을 사용해 훨씬 더 높은 자원을 사용할 수 있도록 한다. 용량이 많아지면 스토리지나 좋은 GPU 자원을 사용하기 위해 추가금을 내야 한다. 또 인터넷이 안 되면 사용할 수 없는 단점도 있다. 하지만 단점보다는 장점이 많은 서비스이므로 한번 사용해보기로 하자. 1. 구글 코랩 사용하기 코랩은 노트북 환경에서 한번 사용한 적이 있어서 그런지 그때 사용했던 기록이 모두 남아있었다. 웹은 보통 리눅스 기반으로 되어 있는데, 코랩의 장점은 모델링할 때 환경구축하는 시간을 단축시켜준다는 것이다. 구글 드라이브에 들어가면 코랩 노트북이라는 폴더가 있는..
영화 리뷰를 분석하는 또 다른 실습 예제를 진행해보려고 한다. 이번 실습은 선생님이 자세한 설명을 해주지 않고 파일부터 생성해서 솔직히 뭘 하는 건지 잘 모르겠다.아무튼 영화 리뷰를 분석하는 또 다른 예제인 것 같다. 수업이 어느 정도 진행되면서 이 예제가 무엇인지 이제야 알게 되었다. 영화 리뷰를 모아놓은 것을 분석하는 실습이다. 영화 리뷰 텍스트 분석 실습해보기1. 말뭉치 만들기 라벨에서 Role을 target으로 지정해준다. 라벨의 feature로 되어 있으면 0과 1로써 0이면 긍정, 1이면 부정인 데이터로 처리된다. 우리는 이것을 정답 데이터인 target으로 지정한 것이다.이것을 Corpus로 설정해 말뭉치로 전달했다. 이를 Corpus Viewer로 확인해보았다. 2. 워드 클라..
늦었지만 새벽 루틴도 실천했고 이제 다시 아침 공부를 시작해볼 것이다. 오늘은 아침을 먹지 않을 것이고(먹는 날은 별로 없지만) 점심 때까지 열심히 공부해보자. 조금 전에 승차권 예매도 했고 이제 아침 공부를 하는 일만 남아있다. 이번에는 조금 전에 학습했던 텍스트 마이닝을 실습하는 시간을 갖기로 하자. 텍스트 분류하는 실습해보기영화 인사이드 아웃2의 영화 리뷰를 가져와서 이 리뷰에 대한 평점을 분석해볼 것이다. 먼저 텍스트 패키지를 설치해준다. 그런 다음 Corpus 파일을 하나 만들고 영화 리뷰를 다음과 같이 작성한다. 10개의 리뷰를 작성하는데 긍정과 부정이 모두 섞이도록 한다. 1. 영화 리뷰 데이터 가져와서 분석하기 Corpus Viewer에도 연결해주는데 1에서 10까지 내용이 잘 보이는지 확..
이번에는 텍스트 마이닝이라고 해서 텍스트를 분류하는 방법에 대해서 알아보고 실습도 함께 진행해볼 것이다. 먼저 텍스트 마이닝이란 무엇인지 살펴보기로 하자.모두 한번 들었던 수업이지만 처음 들었을 때는 무슨 말인지 거의 이해하지 못했다. 오늘 다시 들어보니 무척 신기했고 이런 식으로 데이터를 분류한다는 것을 알게 되었다. 텍스트 마이닝이란 무엇인가? 자연어는 컴퓨터가 알아들을 수 없는데 이를 알아들을 수 있도록 변경하는 작업을 거쳐야 한다. 이런 식으로 활용된다. 텍스트 마이닝을 하는 과정 이번에 실습해볼 것은 감성 분석이다. 텍스트 마이닝을 위해서는 전처리 과정이 필요하다. 한국어는 형태로 단위로 분석을 하는 편이다. 1. 텍스트 데이터 수집 2. 텍스트 전처리..
수업 시간에 만들었던 작업을 그래도 붙여 넣어 학습일지를 쓰는 것보다 처음부터 다시 해보는 게 더 도움이 되는 것 같다. 사실 이렇게 하면 시간이 많이 걸릴까봐서 하지 않으려 했는데 조금 전에 오류가 생겨서 새로 파일을 만들어서 하나하나 따라서 해보니 더 잘 기억이 되었다. 이번 실습부터는 모든 예제를 혼자서 직접 따라해보려고 한다. 이번에는 이미지 관련 실습이다. 이미지 분류 실습 - 사진 추출 및 유사도 검사이미지를 사용하기 위해서는 먼저 이미지를 처리하는 패키지를 설치해주어야 한다. option에서 add를 클릭한 후 image를 검색해서 다음과 같은 설치를 진행한다. 처음에는 잘 되지 않아서 정말 여러 번 시도한 끝에 마침내 해결했다. 텍스트와 이미지 데이터는 컴퓨터가 인지하는 것과 사람이 인지하..
집에 와서 이어서 8교시때 마무리하지 못한 와인 실습을 진행해보려고 한다. 여기까지 모두 학습을 마치고 저녁 운동을 하러 가야겠다. 집에 도착하자마자 바로 운동을 하면 좋은데 오자마자 공부를 먼저 해야 저녁에도 공부하는 것을 더 쉽게 할 수 있게 된다. 이것이 지난 한 달 동안의 나의 루틴이다. 정말 하기 싫은 날도 집에 오자마자 공부부터 하면 머리도 마음도 한결 가벼워진다. 이제 나머지 공부를 시작해보자! 와인 분류 실습 두번째 - 전처리를 했을 때 train 데이터와 test 데이터를 각기 연결해준다. 중요한 점은 앞부분은 데이터를 가져와야 하니 Data Sample에서 오지만, 뒷 부분은 예측을 해야 하니 Remaining Data에 넣어주어야 한다는 것이다. 데이터의 70%가 잘 들어가있음을 확인..
BMI 실습이 끝나고 두번째로 와인을 분류하는 실습을 진행해볼 것이다. 오늘 하루가 언제 지나가나 싶었는데 이제 마지막 교시가 50분도 남지 않았다. 아마 다 정리하지는 못하고 집에 가서 이어서 해야 할 것 같다.오늘 아침에는 정말 공부하기가 싫어서 이 마음과 싸우는데 많은 시간을 보냈다. 어떤 과목이든 그 수업에 매력을 느끼게 되기까지 적어도 몇 시간의 시간은 걸리는 편이다. 이렇게 마음과 싸우고 고분고투하는 동안 그 과목과 많이 친해지게 된다. 따라서 이 시간은 결코 아까운 시간이 아니다. 오늘 목표했던대로 하루만에 Orange를 모두 다 학습하는 건 정말 무리였다. 하지만 내일 새벽까지 해서 왠지 다 할 수 있을 것 같다는 생각이 든다.그리고 내일부터 시작될 추석 명절이 정말 기대된다. 명절에도 난..
지금까지 배운 내용을 머신러닝 내용을 한번 정리하는 시간을 갖기로 하자. 첫날 수업의 영상이 없어 걱정이었는데 이렇게 선생님이 한번 복습으로 정리해주시니 이해가 잘 되었다. 1. 머신러닝 개념 정리하기 머신러닝은 새로운 데이터가 들어왔을 때 이전 데이터에서 이 데이터를 예측하는 과정을 말한다. 학습 알고리즘을 통해서 성능을 높여나가는 것이 우리의 최종 목적이 된다. 클래스의 개수에 따라 달라지는데 2개이면 이진분류, 3개 이상이면 다중 분류라고 한다. 이번에는 머신러닝 7 과정에 대해서 정리해보기로 하자. 전처리 과정을 통해 이상치나 결측치를 채워준다. 단위변환은 KNN 모델에서 많이 사용하는데, 이 모델은 새로 들어온 데이터와 원래 있는 데이터의 최근 거리를 계산한다. 그렇기에 데이터들의 단위가 중요하..
머신러닝 4단계 과정이 끝난줄 알았는데 아직 몇 가지 과정이 남아있었다. Data Sampler로 훈련용과 평가용을 분리하는 일이다. 그럼 나머지 학습을 이어서 시작해보자!다시 머신러닝 공부가 재미있어졌다. BMI 예측 실습해보기 2 4. Data Sampler (Train/Test 분리) 훈련 데이터(Train Data)와 평가용 데이터(Test Data)로 나뉘는 과정과 각각의 세부 내용을 보여주는 자료이다. 이 과정을 통해 머신러닝 모델을 학습시키고 평가할 수 있게 된다.Orange의 Data Sampler를 통해 전체 데이터를 70%는 훈련 데이터, 30%는 테스트 데이터로 나누었다. Train Data (훈련 데이터)350개의 인스턴스가 훈련 데이터로 사용됨이 데이터는 머신러닝 모델이 ..
오렌지 프로그램의 첫번째 실습을 진행해보겠다. 수업 영상이 없어서 그냥 파일만 보고 어떤 내용인지 스스로 추측하며 학습일지를 정리해보려고 한다. BMI 예측 실습해보기 1. 문제 정의 및 데이터 수집 1. 문제 정의목표: 500명의 키와 몸무게 데이터를 바탕으로 BMI(체질량지수)를 예측하는 문제를 해결하는 것 각 컬럼(열)에는 데이터 유형과 역할을 정의한다. Gender (성별) Type: 범주형(Categorical) 데이터로 설정되었다. 이 열은 'Female', 'Male' 두 개의 값으로 구분된다. Role: skip으로 설정되어, 성별 데이터는 모델 학습에 사용되지 않는다. 성별은 BMI를 예측하는 데 중요한 역할을 하지 않기 때문에 학습에 포함하지 않은 것으로 보인다. Height (키) T..