관리 메뉴

클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지

딥러닝 8 - 이진 분류 실습해보기 : 유방암 분류 본문

인공지능/딥러닝

딥러닝 8 - 이진 분류 실습해보기 : 유방암 분류

huenuri 2024. 9. 22. 14:20

이제 딥러닝 세 번째 실습 프로젝트를 시작해 본다. 이진 분류로 유방암을 분류하는 수업이다. 이 수업도 역시 한 번도 듣지 않은 내용인데 잘 따라갈 수 있으리라 믿는다.


 

 

이진분류 실습해보기

 

 

 

사이킷런에서는 데이터를 이런 형태로 제공한다. 


 

 

 

 

 

데이터에 대한 정보가 출력되고 있다.


 

 

 


 

 

모델링하기

 

 

 

중간층에서의 sigmoid는 역치의 개념을 가져왔다면, 출력층에서는 0부터 1 사이의 값을 해주기 위해 사용한다.

 

 

 

 

 

 

변수에 담아 이후에 그래프도 그려보기로 하자.

 

 

 

과적합이 되지 않으려면 train 데이터와 test 데이터의 loss 함수가 별 차이가 없어야 한다. 학습을 할수록 오차가 적어지면 좋은 것이다.

 

 

 

history를 통해 모델의 손실값을 출력해 줄 수 있다.

 

 

 

 

이 손실값을 y축으로 넣어 그래프로 그려보면 줄어드는 것을 알 수 있다. 학습은 초기값을 랜덤으로 잡기 때문에 컴퓨터마다 그래프가 다르게 나올 수가 있다.

 

 

 

 

그리고 런타임에서 모두 실행을 하면 전체 실행이 된다. 난 지금까지 하나씩 클릭해서 실행했는데 이런 간단한 방법이 있었다. 선생님과 수업을 하면 유용한 팁들을 많이 얻을 수 있다.


 

 

 

 

모델의 구조가 복잡해질 때 사용하면 좋다.

 

 

 

합계를 구하는 방식은 이와 같다. 입력 데이터가 30개이고 8개를 곱하니 240이 되고 바이어스 8개를 더해 248개가 되었다. 


 

 

 

학습을 마치고

이진분류 실습을 이렇게 마쳤다. 마지막 부분은 다섯째 날 2교시 수업 내용까지 합해서 정리했다. 확실히 현장 수업은 진도가 많이 느리다. 담임선생님이 하시는 수업이라 1교시에는 자리 배치를 바꾸는 시간으로 보내기도 했다. 난 휴게실에서 따로 그 무렵 데이터 분석을 공부하고 있었다.

오늘 딥러닝 공부를 충분히 하고도 남을 것 같다. 이제 잠시 쉬었다가 새벽에 하지 못한 큐티도 하고 요가도 한 후 3시 조금 넘어서 다시 오후 공부를 시작해려고 한다.