관리 메뉴

클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지

회귀 알고리즘과 모델 규제 6 - 특성 공학과 규제 2 : 스스로 실습하고 문제 풀어보는 시간 본문

인공지능/머신러닝

회귀 알고리즘과 모델 규제 6 - 특성 공학과 규제 2 : 스스로 실습하고 문제 풀어보는 시간

huenuri 2024. 9. 29. 01:27

이제 특성 공학에 대해서 공부했던 내용을 스스로 실습하며 공부해보는 시간이다. 그래프도 직접 만들어보는 이 시간이 정말 즐겁다.


 

 

 

다중 회귀 실습해보기

 


 

 

 


 

 

 

 


 

 

 

 

 

 

이제 특성을 줄여야 한다.


 

 

 


 

 


 

 

 

그래프에서 계속 오류가 떠서 한참의 시간이 걸렸다. 그리고 새로운 사실을 알게 되었다. alpha_list와 train_score의 길이가 같아야 한다는 것을.. 그리고 리스트의 for문을 한번 실행시킬 때마다 길이가 6씩 늘어가고 있었다. 코드를 다시 실행시키니 이제 이 문제가 사라졌다.

 

 

 


 

 

 

 

경고 메시지가 뜨지만 특별히 문제될 것은 없다고 한다. 사이킷런의 라쏘 모델은 최적의 개수를 찾기 위해 반복적인 계산을 수행하는데, 지정한 반복 횟수가 부족할 때 이런 경고가 발생한다. 이 반복 횟수를 충분히 늘리기 위해 max_iter 매개변수의 값을 1000으로 지정했다. 필요하면 더 늘릴 수 있지만 이 문제에서는 큰 영향을 끼치지 않는다.


 

 

 

 

 


 

 

 

단원 마무리하기

 

 

 

 

 

 


 

 

 

 

확인문제 풀기

 


 

 

 

학습을 마치고

확실히 실습을 해봐야 공부한 게 이해가 된다는 걸 느끼는 시간이었다. 이제 선형 모델이 무엇인지 조금은 알 것 같다. 새로운 분야와 단원을 배운다는 건 참 신나는 일인 것 같다. 시작하기가 힘들지 한번 시작하면 이제 다시는 이전의 일상으로 돌아가지 못하는 시기가 온다.

이제 다음 포스트에서는 로지스틱 회귀 모델을 학습해보려고 한다.