클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

딥러닝 8 - 이진 분류 실습해보기 : 유방암 분류 본문

인공지능/딥러닝

딥러닝 8 - 이진 분류 실습해보기 : 유방암 분류

huenuri 2024. 9. 22. 14:20

이제 딥러닝 세번째 실습 프로젝트를 시작해본다. 이진 분류로 유방암을 분류하는 수업이다. 이 수업도 역시 한번도 듣지 않은 내용인데 잘 따라갈 수 있으리라 믿는다.


 

 

이진분류 실습해보기

 

 

 

사이킷런에서는 데이터를 이런 형태로 제공한다. 


 

 

 

 

 

데이터에 대한 정보가 출력되고 있다.


 

 

 


 

 

모델링하기

 

 

 

중간층에서의 sigmoid는 역치의 개념을 가져왔다면, 출력층에서는 0부터 1 사이의 값을 해주기 위해 사용한다.

 

 

 

 

 

 

변수에 담아 이후에 그래프도 그려보기로 하자.

 

 

 

과적합이 되지 않으려면 train 데이터와 test 데이터의 loss 함수가 별 차이가 없어야 한다. 학습을 할수록 오차가 적어지면 좋은 것이다.

 

 

 

history를 통해 모델의 손실값을 출력해줄 수 있다.

 

 

 

 

이 손실값을 y축으로 넣어 그래프로 그려보면 줄어드는 것을 알 수 있다. 학습은 초기값을 랜덤으로 잡기 때문에 컴퓨터마다 그래프가 다르게 나올 수가 있다.

 

 

 

 

그리고 런타임에서 모두 실행을 하면 전체 실행이 된다. 난 지금까지 하나씩 클릭해서 실행했는데 이런 간단한 방법이 있었다. 선생님과 수업을 하면 유용한 팁들을 많이 얻을 수 있다.


 

 

 

 

모델의 구조가 복잡해질 때 사용하면 좋다.

 

 

 

합계를 구하는 방식은 이와 같다. 입력 데이터가 30개이고 8개를 곱하니 240이 되고 바이어스 8개를 더해 248개가 되었다. 


 

 

 

학습을 마치고

이진분류 실습을 이렇게 마쳤다. 마지막 부분은 다섯째날 2교시 수업 내용까지 합해서 정리했다. 확실히 현장 수업은 진도가 많이 느리다. 담임선생님이 하시는 수업이라 1교시에는 자리 배치를 바꾸는 시간으로 보내기도 했다. 난 휴게실에서 따로 그 무렵 데이터 분석을 공부하고 있었다.

오늘 딥러닝 공부를 충분히 하고도 남을 것 같다. 이제 잠시 쉬었다가 새벽에 하지 못한 큐티도 하고 요가도 한 후 3시 조금 넘어서 다시 오후 공부를 시작해려고 한다.