일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 텍스트마이닝
- 혼공머신
- 데이터분석
- 선형회귀모델
- 딥러닝
- 정보처리기사필기
- 데이터시각화
- 정보처리기사실기
- 언리얼프로젝트
- 코딩테스트
- 데이터입출력구현
- 중학수학
- pandas
- C++
- numpy/pandas
- 선형분류모델
- 언리얼학습
- html/css
- 파이썬
- JSP/Servlet
- c언어
- 요구사항확인
- 이수증
- 자바
- 자바 실습
- 데이터베이스
- 핵심프로젝트
- 머신러닝
- 디버깅
- Orange
- Today
- Total
목록2024/09/28 (4)
클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지
이제 앞서 배운 데이터 전처리를 토대로 이상한 도미를 진짜 도미로 예측하도록 만드는 실습을 진행해볼 것이다. 데이터 전처리 실습해보기 하지만 데이터가 잘 섞이지 않았다. 이 부분을 해결해보면 다음과 같다. 이제 잘 섞여서 출력이 되고 있다. 가까운 이웃이 빙어에 몰려있음을 볼 수 있다. 거리가 많이 차이가 나는 것을 확인했다. 이제 기준을 맞출 차례이다. 조금 전에 전처리 코드를 쓰지 않아서 name 오류가 떠서 다시 코드를 쓰며 진행해보았다. 앞선 코드에서 표준편차가 아닌 일반 그래프로 표시가 되어 다시 수정해보았다. 하지만 잘못 쓴 코드는 지우지 않았다. 그래야 이런 과정을 거쳐 코드가 완성되는 것을 볼 수 있고, 나의 실수도 알게 된다.여기까..
이제 다시 공부에 집중해볼 것이다. 오늘부터는 새벽 6시 반에 운동을 하기로 다짐했다. 그러니까 2시간이 조금 안 되는 시간 동안 데이터 전처리 공부를 모두 마칠 생각이다.올바른 결과 도출을 위해 데이터를 사용하기 전에 데이터 전처리 과정을 거친다. 학습 목표전처리 과정을 거친 데이터로 훌련했을 때의 차이를 알고, 표준점수로 특성의 스케일을 변환하는 방법 배우기 시작하기 전에김팀장은 혼공머신에게 길이가 25cm이고 무게가 150g인데 빙어로 예측한다고 말했다. 도미같은데 무슨 일이 일어난걸까? 넘파이로 데이터 준비하기 먼저 도미와 빙어 데이터를 준비해본다. 하지만 이번에는 좀더 세련된 방법을 사용해보았다. 전에는 파이썬 리스트를 순회하면서 원소를 하나씩 꺼내 생선 하나의 길이와 무게를 리스트 안..
이제 주피터 노트북을 열어 어제처럼 실습을 진행해보고 단원을 마무리하려고 한다. 난 이 시간이 정말 기대가 된다. 그럼 시작해보자. 훈련 세트와 테스트 세트 실습해보기 하지만 이상하게도 책과 다르게 정확도가 100%이다. 무엇이 문제인지 살펴보니 난 train 데이터만 가져와서 평가한 거였다. test가 없으니 당연히 1이 나온 것이다. 코드를 수정해보자. 이제 정확도가 0%이다. 데이터 샘플링이 필요한 시점이다. 훈련용 데이터와 테스트용 데이터가 잘 섞여있음을 확인할 수있다. 두 번째 머신러닝 프로그램 모델이 제대로 평가되었다. 단원 마무리하기 확인 문제 풀기 사이킷런은 입력 데이터에서 샘플이 행에 위치하고, 특성이 열에 놓여 있다고 기대한다...
저녁을 먹고 나니 정신이 조금 몽롱하지만 그래도 공부를 시작해본다. 항상 내가 목표한 것의 1/3도 채우지 못할 때가 많아 실망이 크지만 그래도 목표가 있기에 하루하루가 기쁘고 감사하다.이제 새로운 단원에 들어갔다. 이번에는 데이터에 대해서 다루게 된다. 학습 목표지도학습과 비지도 학습의 차이를 배운다. 모델을 훈련시키는 훈련 세트와 모데을 평가하기 위한 테스트 세트로 데이터를 나누어 학습한다. 팀장은 혼공머싱의 보고서를 읽고 무척 의아해했다. 그것은 이미 도미와 빙어를 저장한 상태이기에 100% 정답을 맞추는 것이 당연하다는 것이다. 올바른 평가를 하기 위해서는 평가를 위한 다른 데이터를 준비해서 평가해야 할 것이다. 지도 학습과 비지도 학습머신러닝 알고리즘은 크게 지도 학습과 비지도 학습으로 나..