일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- JSP/Servlet
- 정보처리기사필기
- 자바스크립트
- 혼공머신
- CSS
- 상속
- html/css
- 컴퓨터비전
- JDBC
- 정보처리기사실기
- 머신러닝
- 데이터분석
- 파이썬
- 컴퓨터구조
- 자바스크립트심화
- 순환신경망
- 딥러닝
- SQL
- 오블완
- 자바 실습
- 디버깅
- 중학수학
- 중학1-1
- 데이터베이스
- rnn
- JSP
- c언어
- 연습문제
- 개발일기
- 자바
- Today
- Total
목록선형회귀 (5)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
아침 9시 전까지 3단원을 모두 마치려고 하는데 아직 두 개의 소장이 남아있다. 바로 이어서 학습을 시작해보겠다. 선형 회귀 실습해보기 앞의 코드는 지난 시간에 공부했던 내용과 중복이라 그냥 넘어간다. 50cm의 농어를 1033g으로 예측했는데 이는 실제 이 농어의 무게보다 더 많이 나가는 것이다. 문제가 무엇일까?훈련 세트와 50cm의 농어, 이 농어의 최근접 이웃을 산점도로 표시해보겠다. 길이가 커질수록 농어의 무게가 증가하는 경향이 있다. 하지만 50cm 농어는 가장 가까운 것이 45cm 근방이므로 이들 샘플의 무게를 평균하고 있다. 이웃의 평균과 100cm 농어의 예측이 같다는 것을 확인할 수 있다. 100cm의 농어 이웃과 농어의 그래프를 그려보았다. 이런 식이면 농어의 길이가 ..
이제 특성 공학에 대해서 공부했던 내용을 스스로 실습하며 공부해보는 시간이다. 그래프도 직접 만들어보는 이 시간이 정말 즐겁다. 다중 회귀 실습해보기 이제 특성을 줄여야 한다. 그래프에서 계속 오류가 떠서 한참의 시간이 걸렸다. 그리고 새로운 사실을 알게 되었다. alpha_list와 train_score의 길이가 같아야 한다는 것을.. 그리고 리스트의 for문을 한번 실행시킬 때마다 길이가 6씩 늘어가고 있었다. 코드를 다시 실행시키니 이제 이 문제가 사라졌다. 경고 메시지가 뜨지만 특별히 문제될 것은 없다고 한다. 사이킷런의 라쏘 모델은 최적의 개수를 찾기 위해 반복적인 계산을 수행하는데, 지정한 반복 횟수가 부족할 때 이런 경고가 발생한다. 이 반복..
이제 3장의 마지막 단원 학습이다. 오늘 낮잠을 많이 잤더니 별로 피곤하지 않아 새벽까지 4장의 학습을 마치고 정처기 실기도 어느 정도 공부할 수 있었으면 좋겠다.가능할지 모르겠지만 조금씩 다시 회복해 볼 것이다. 지난 시간 복습 음수가 나오는 문제를 해결하기 위해 원래 특성에 제곱한 특성을 추가해주었다. 학습 목표여러 특성을 사용한 다중 회귀에 대해 배우고, 사이킷런의 여러 도구를 사용해 본다.복잡한 모델의 과대적합을 막기 위한 릿지와 라쏘 회기를 배운다. 시작하기 전에혼공머신은 다중 회귀로 농어의 무게를 어느 정도 예측할 수 있지만, 여전히 훈련 세트보다 테스트 세트의 점수가 높은 것이 왠지 찜찜하다. 이 문제를 해결하려면 어떻게 해야 할까? 다중 회귀여러 개의 특성을 사용한 선형 회귀를 다중..
이제 선형 회귀 실습을 해볼 차례이다. 공부할 때는 너무 어려워서 포기하고 싶다가도 실습하는 시간이 되면 의욕이 샘솟는다. 이래서 난 공부하는걸 멈출 수 없나 보다. 선형 모델 실습해보기 이웃 샘플의 타깃 평균을 구해보자. 단원 마무리하기 학습을 마치고다중 회귀 모델은 수업 시간에도 다루지 않았던 내용이라 조금 어려웠다. 다음에 배우게 될 내용도 처음 들어보는 개념들이나 조금 어려울테지만 그래도 끝까지 열심히 공부해볼 것이다.수업을 듣는 것과 혼자서 공부하는 건 정말 많이 달랐다. 코드를 모두 이해하고 넘어가야 하고 어느 정도 이해를 전제로 한다. 하지만 느리게 공부하는 동안 머신러닝에 대한 관심이 더 깊어지는 걸 느낄 수 있었다.
3장은 세 번째 장까지 있어서 공부를 다 마치려면 한참의 시간이 걸릴 것 같다. 그래도 공부를 해야겠지. 어제와 오늘은 공부할 컨디션이 좋지는 않아서 좀 천천히 하는 중이다. 지난 시간 복습 결정 계수가 1에 가까우면 좋은 모델이고, 0에 가까우면 좋지 않은 모델로 예측한다. 모델의 복잡도가 낮으면 과소적합이고, 높으면 과대적합이다. 이 모델 복잡도를 조절하는 매개변수는 이웃의 개수이다. 학습 목표k-최근접 이웃 회귀와 선형 회귀 알고리즘의 차이를 이해하고, 사이킷런을 사용해 여러 가지 선형 회귀 모델을 만들어보기 시작하기 전에농어 담당 직원은 혼공머신에게 아주 큰 농어를 골라 무게를 예측해 달라고 가져왔다. 무려 길이가 50cm인 농어이다. 혼공머신은 앞서 만든 모델을 사용해 이 농어의 무게를..