일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 코딩테스트
- c언어
- 자바
- 핵심프로젝트
- 데이터시각화
- 텍스트마이닝
- 데이터분석
- 언리얼프로젝트
- 선형회귀모델
- JSP/Servlet
- 디버깅
- 정보처리기사실기
- html/css
- pandas
- 선형분류모델
- 파이썬
- 정보처리기사필기
- 데이터입출력구현
- 이수증
- 요구사항확인
- 자바 실습
- 딥러닝
- numpy/pandas
- 중학수학
- 머신러닝
- 자연수의성질
- 데이터베이스
- 언리얼학습
- C++
- Orange
- Today
- Total
클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지
딥러닝 8 - 이진 분류 실습해보기 : 유방암 분류 본문
이제 딥러닝 세번째 실습 프로젝트를 시작해본다. 이진 분류로 유방암을 분류하는 수업이다. 이 수업도 역시 한번도 듣지 않은 내용인데 잘 따라갈 수 있으리라 믿는다.
이진분류 실습해보기
사이킷런에서는 데이터를 이런 형태로 제공한다.
데이터에 대한 정보가 출력되고 있다.
모델링하기
중간층에서의 sigmoid는 역치의 개념을 가져왔다면, 출력층에서는 0부터 1 사이의 값을 해주기 위해 사용한다.
변수에 담아 이후에 그래프도 그려보기로 하자.
과적합이 되지 않으려면 train 데이터와 test 데이터의 loss 함수가 별 차이가 없어야 한다. 학습을 할수록 오차가 적어지면 좋은 것이다.
history를 통해 모델의 손실값을 출력해줄 수 있다.
이 손실값을 y축으로 넣어 그래프로 그려보면 줄어드는 것을 알 수 있다. 학습은 초기값을 랜덤으로 잡기 때문에 컴퓨터마다 그래프가 다르게 나올 수가 있다.
그리고 런타임에서 모두 실행을 하면 전체 실행이 된다. 난 지금까지 하나씩 클릭해서 실행했는데 이런 간단한 방법이 있었다. 선생님과 수업을 하면 유용한 팁들을 많이 얻을 수 있다.
모델의 구조가 복잡해질 때 사용하면 좋다.
합계를 구하는 방식은 이와 같다. 입력 데이터가 30개이고 8개를 곱하니 240이 되고 바이어스 8개를 더해 248개가 되었다.
학습을 마치고
이진분류 실습을 이렇게 마쳤다. 마지막 부분은 다섯째날 2교시 수업 내용까지 합해서 정리했다. 확실히 현장 수업은 진도가 많이 느리다. 담임선생님이 하시는 수업이라 1교시에는 자리 배치를 바꾸는 시간으로 보내기도 했다. 난 휴게실에서 따로 그 무렵 데이터 분석을 공부하고 있었다.
오늘 딥러닝 공부를 충분히 하고도 남을 것 같다. 이제 잠시 쉬었다가 새벽에 하지 못한 큐티도 하고 요가도 한 후 3시 조금 넘어서 다시 오후 공부를 시작해려고 한다.
'인공지능 > 딥러닝' 카테고리의 다른 글
딥러닝 10 - 다중분류 실습해보기 2 : 학습 방법 및 평가 방법 설정 (0) | 2024.09.22 |
---|---|
딥러닝 9 - 다중분류 실습해보기 1 : 문제 데이터 확인 및 MLP 모델링 (0) | 2024.09.22 |
딥러닝 7 - 딥러닝 기초 학습 4 : 딥러닝 모델링 및 딥러닝 신경망 설계하기 (0) | 2024.09.22 |
딥러닝 6 - 퍼셉트론 이해하기 3 : 다중 퍼셉트론 모델 학습 및 평가해보기 (0) | 2024.09.22 |
딥러닝 5 - 퍼셉트론 이해하기 2 : 퍼셉트론 종류별로 실습해보기 (0) | 2024.09.22 |