일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 자연수의성질
- 파이썬
- 정보처리기사실기
- 데이터분석
- 데이터베이스
- c언어
- 디버깅
- 선형분류모델
- 데이터입출력구현
- Orange
- 정보처리기사필기
- 언리얼프로젝트
- 텍스트마이닝
- pandas
- numpy/pandas
- 딥러닝
- 머신러닝
- 자바
- 이수증
- 언리얼학습
- 선형회귀모델
- 데이터시각화
- 중학수학
- JSP/Servlet
- html/css
- 핵심프로젝트
- 코딩테스트
- C++
- 자바 실습
- 요구사항확인
- Today
- Total
목록2024/09/28 (3)
클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지
이제 다시 공부에 집중해볼 것이다. 오늘부터는 새벽 6시 반에 운동을 하기로 다짐했다. 그러니까 2시간이 조금 안 되는 시간 동안 데이터 전처리 공부를 모두 마칠 생각이다.올바른 결과 도출을 위해 데이터를 사용하기 전에 데이터 전처리 과정을 거친다. 학습 목표전처리 과정을 거친 데이터로 훌련했을 때의 차이를 알고, 표준점수로 특성의 스케일을 변환하는 방법 배우기 시작하기 전에김팀장은 혼공머신에게 길이가 25cm이고 무게가 150g인데 빙어로 예측한다고 말했다. 도미같은데 무슨 일이 일어난걸까? 넘파이로 데이터 준비하기 먼저 도미와 빙어 데이터를 준비해본다. 하지만 이번에는 좀더 세련된 방법을 사용해보았다. 전에는 파이썬 리스트를 순회하면서 원소를 하나씩 꺼내 생선 하나의 길이와 무게를 리스트 안..
이제 주피터 노트북을 열어 어제처럼 실습을 진행해보고 단원을 마무리하려고 한다. 난 이 시간이 정말 기대가 된다. 그럼 시작해보자. 훈련 세트와 테스트 세트 실습해보기 하지만 이상하게도 책과 다르게 정확도가 100%이다. 무엇이 문제인지 살펴보니 난 train 데이터만 가져와서 평가한 거였다. test가 없으니 당연히 1이 나온 것이다. 코드를 수정해보자. 이제 정확도가 0%이다. 데이터 샘플링이 필요한 시점이다. 훈련용 데이터와 테스트용 데이터가 잘 섞여있음을 확인할 수있다. 두 번째 머신러닝 프로그램 모델이 제대로 평가되었다. 단원 마무리하기 확인 문제 풀기 사이킷런은 입력 데이터에서 샘플이 행에 위치하고, 특성이 열에 놓여 있다고 기대한다...
저녁을 먹고 나니 정신이 조금 몽롱하지만 그래도 공부를 시작해본다. 항상 내가 목표한 것의 1/3도 채우지 못할 때가 많아 실망이 크지만 그래도 목표가 있기에 하루하루가 기쁘고 감사하다.이제 새로운 단원에 들어갔다. 이번에는 데이터에 대해서 다루게 된다. 학습 목표지도학습과 비지도 학습의 차이를 배운다. 모델을 훈련시키는 훈련 세트와 모데을 평가하기 위한 테스트 세트로 데이터를 나누어 학습한다. 팀장은 혼공머싱의 보고서를 읽고 무척 의아해했다. 그것은 이미 도미와 빙어를 저장한 상태이기에 100% 정답을 맞추는 것이 당연하다는 것이다. 올바른 평가를 하기 위해서는 평가를 위한 다른 데이터를 준비해서 평가해야 할 것이다. 지도 학습과 비지도 학습머신러닝 알고리즘은 크게 지도 학습과 비지도 학습으로 나..