일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 요구사항확인
- 자바 실습
- 이수증
- html/css
- 파이썬
- 데이터분석
- 데이터입출력구현
- 언리얼프로젝트
- Orange
- pandas
- numpy/pandas
- 자바
- 자연수의성질
- 중학수학
- 언리얼학습
- 데이터베이스
- 딥러닝
- 선형분류모델
- 선형회귀모델
- 코딩테스트
- 데이터시각화
- 정보처리기사필기
- 정보처리기사실기
- JSP/Servlet
- 핵심프로젝트
- c언어
- 디버깅
- 머신러닝
- C++
- 텍스트마이닝
- Today
- Total
목록혼공머신 (6)
클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지
이제 앞서 배운 데이터 전처리를 토대로 이상한 도미를 진짜 도미로 예측하도록 만드는 실습을 진행해볼 것이다. 데이터 전처리 실습해보기 하지만 데이터가 잘 섞이지 않았다. 이 부분을 해결해보면 다음과 같다. 이제 잘 섞여서 출력이 되고 있다. 가까운 이웃이 빙어에 몰려있음을 볼 수 있다. 거리가 많이 차이가 나는 것을 확인했다. 이제 기준을 맞출 차례이다. 조금 전에 전처리 코드를 쓰지 않아서 name 오류가 떠서 다시 코드를 쓰며 진행해보았다. 앞선 코드에서 표준편차가 아닌 일반 그래프로 표시가 되어 다시 수정해보았다. 하지만 잘못 쓴 코드는 지우지 않았다. 그래야 이런 과정을 거쳐 코드가 완성되는 것을 볼 수 있고, 나의 실수도 알게 된다.여기까..
이제 다시 공부에 집중해볼 것이다. 오늘부터는 새벽 6시 반에 운동을 하기로 다짐했다. 그러니까 2시간이 조금 안 되는 시간 동안 데이터 전처리 공부를 모두 마칠 생각이다.올바른 결과 도출을 위해 데이터를 사용하기 전에 데이터 전처리 과정을 거친다. 학습 목표전처리 과정을 거친 데이터로 훌련했을 때의 차이를 알고, 표준점수로 특성의 스케일을 변환하는 방법 배우기 시작하기 전에김팀장은 혼공머신에게 길이가 25cm이고 무게가 150g인데 빙어로 예측한다고 말했다. 도미같은데 무슨 일이 일어난걸까? 넘파이로 데이터 준비하기 먼저 도미와 빙어 데이터를 준비해본다. 하지만 이번에는 좀더 세련된 방법을 사용해보았다. 전에는 파이썬 리스트를 순회하면서 원소를 하나씩 꺼내 생선 하나의 길이와 무게를 리스트 안..
이제 주피터 노트북을 열어 어제처럼 실습을 진행해보고 단원을 마무리하려고 한다. 난 이 시간이 정말 기대가 된다. 그럼 시작해보자. 훈련 세트와 테스트 세트 실습해보기 하지만 이상하게도 책과 다르게 정확도가 100%이다. 무엇이 문제인지 살펴보니 난 train 데이터만 가져와서 평가한 거였다. test가 없으니 당연히 1이 나온 것이다. 코드를 수정해보자. 이제 정확도가 0%이다. 데이터 샘플링이 필요한 시점이다. 훈련용 데이터와 테스트용 데이터가 잘 섞여있음을 확인할 수있다. 두 번째 머신러닝 프로그램 모델이 제대로 평가되었다. 단원 마무리하기 확인 문제 풀기 사이킷런은 입력 데이터에서 샘플이 행에 위치하고, 특성이 열에 놓여 있다고 기대한다...
저녁을 먹고 나니 정신이 조금 몽롱하지만 그래도 공부를 시작해본다. 항상 내가 목표한 것의 1/3도 채우지 못할 때가 많아 실망이 크지만 그래도 목표가 있기에 하루하루가 기쁘고 감사하다.이제 새로운 단원에 들어갔다. 이번에는 데이터에 대해서 다루게 된다. 학습 목표지도학습과 비지도 학습의 차이를 배운다. 모델을 훈련시키는 훈련 세트와 모데을 평가하기 위한 테스트 세트로 데이터를 나누어 학습한다. 팀장은 혼공머싱의 보고서를 읽고 무척 의아해했다. 그것은 이미 도미와 빙어를 저장한 상태이기에 100% 정답을 맞추는 것이 당연하다는 것이다. 올바른 평가를 하기 위해서는 평가를 위한 다른 데이터를 준비해서 평가해야 할 것이다. 지도 학습과 비지도 학습머신러닝 알고리즘은 크게 지도 학습과 비지도 학습으로 나..
이제 조금 전에 배웠던 내용을 직접 손코딩을 하며 실습해보는 시간을 갖기로 했다. 4시 반까지는 마치고 단원 마무리를 해볼 것이다. 생선 분류 실습해보기구글 코랩은 주피터 노트북을 설정하지 않았을 때 임시로 쓰는 도구이고, 난 파이썬 환경이 컴퓨터에 모두 세팅되어 있으므로 굳이 불편한 코랩을 사용할 이유가 없었다. 자원도 인터넷이 끊기면 사라지는데 여건이 된다면 이걸 사용할 이유는 없다고 본다. 주피터 노트북으로 실습을 진행해보았다. 도미 데이터가 한눈에 보인다. 도미와 빙어 데이터가 한 눈에 보이고 있다. K-최근접 이웃 알고리즘 사용해보기 이론적인 내용은 모두 앞의 포스트에서 설명했으니 생략하겠다. 단원 정리하기 확인 문제 풀기 이 문제의 답은 n이다. for문에서 ..
점심을 먹고 오후 공부를 시작해본다. 1-3장부터는 본격적으로 머신러닝 프로젝트를 다루게 된다. 하지만 오늘은 왜 이렇게 공부하는 게 더디고 생각도 행동도 느리며 하기가 싫은지 모르겠다.1주일에 한두 번은 이렇게 열정이 낮아지는 시기가 있다. 특히 금요일은 더욱 그런 것 같다. 월요일과 금요일은 내게 열정이 가장 낮아지는 시기같다. 오늘의 이 위기를 잘 극복해보자. 무조건 빨리 하는 건 도움이 되지 않고 천천히 묵묵히 내가 해야 할 일을 하고 적당히 보상을 주는 것.. 그것이 슬럼프를 빨리 극복하는 길이다. 학습 목표가장 간단한 머신러닝 알고리즘 중 하나인 k-최근접 이웃을 사용하여 2개의 종류를 분류하는 머신러닝 모델을 훈련한다. 이번 단원의 미션 한빛마켓은 살아있는 생선을 팔기 시작했는데, 머신..