클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

데이터 다루기 2 - 훈련 세트와 테스트 세트 2 : 스스로 실습하며 문제 풀어보는 시간 본문

인공지능/머신러닝

데이터 다루기 2 - 훈련 세트와 테스트 세트 2 : 스스로 실습하며 문제 풀어보는 시간

huenuri 2024. 9. 28. 03:51

이제 주피터 노트북을 열어 어제처럼 실습을 진행해보고 단원을 마무리하려고 한다. 난 이 시간이 정말 기대가 된다. 그럼 시작해보자.


 

 

 

훈련 세트와 테스트 세트 실습해보기

 

 

 


 

 

 

 

하지만 이상하게도 책과 다르게 정확도가 100%이다. 무엇이 문제인지 살펴보니 난 train 데이터만 가져와서 평가한 거였다. test가 없으니 당연히 1이 나온 것이다. 코드를 수정해보자.

 

 

이제 정확도가 0%이다. 데이터 샘플링이 필요한 시점이다.


 

 

 

 

 

 


 

 

 

 


 

 

 

 

훈련용 데이터와 테스트용 데이터가 잘 섞여있음을 확인할 수있다.


 

 

 

두 번째 머신러닝 프로그램

 

 

모델이 제대로 평가되었다.


 

 

 

 

단원 마무리하기

 

 


 

 

 

확인 문제 풀기

 

 

사이킷런은 입력 데이터에서 샘플이 행에 위치하고, 특성이 열에 놓여 있다고 기대한다. 3번 문제는 찍었는데 맞았다.

 


 

 

 

학습을 마치고

이렇게 새벽에 2시간이 넘는 시간 동안 2-1장 학습을 모두 마쳤다. 조금 쉬었다가 2-2장 학습을 시작해볼 것이다. 머신러닝을 공부하는 시간이 정말 즐겁다.