일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 딥러닝
- 컴퓨터구조
- 컴퓨터비전
- SQL
- 데이터베이스
- 머신러닝
- JSP/Servlet
- 자바
- 정보처리기사필기
- html/css
- 운영체제
- 텍스트마이닝
- 데이터입출력구현
- 정보처리기사실기
- 정수와유리수
- pandas
- 연습문제
- 파이썬
- 파이썬라이브러리
- numpy/pandas
- 중학1-1
- C++
- 혼공머신
- CSS
- 데이터분석
- 코딩테스트
- 영어공부
- 자바 실습
- CNN
- 중학수학
- Today
- Total
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
딥러닝 8 - 이진 분류 실습해보기 : 유방암 분류 본문
이제 딥러닝 세 번째 실습 프로젝트를 시작해 본다. 이진 분류로 유방암을 분류하는 수업이다. 이 수업도 역시 한 번도 듣지 않은 내용인데 잘 따라갈 수 있으리라 믿는다.
이진분류 실습해보기
사이킷런에서는 데이터를 이런 형태로 제공한다.
데이터에 대한 정보가 출력되고 있다.
모델링하기
중간층에서의 sigmoid는 역치의 개념을 가져왔다면, 출력층에서는 0부터 1 사이의 값을 해주기 위해 사용한다.
변수에 담아 이후에 그래프도 그려보기로 하자.
과적합이 되지 않으려면 train 데이터와 test 데이터의 loss 함수가 별 차이가 없어야 한다. 학습을 할수록 오차가 적어지면 좋은 것이다.
history를 통해 모델의 손실값을 출력해 줄 수 있다.
이 손실값을 y축으로 넣어 그래프로 그려보면 줄어드는 것을 알 수 있다. 학습은 초기값을 랜덤으로 잡기 때문에 컴퓨터마다 그래프가 다르게 나올 수가 있다.
그리고 런타임에서 모두 실행을 하면 전체 실행이 된다. 난 지금까지 하나씩 클릭해서 실행했는데 이런 간단한 방법이 있었다. 선생님과 수업을 하면 유용한 팁들을 많이 얻을 수 있다.
모델의 구조가 복잡해질 때 사용하면 좋다.
합계를 구하는 방식은 이와 같다. 입력 데이터가 30개이고 8개를 곱하니 240이 되고 바이어스 8개를 더해 248개가 되었다.
학습을 마치고
이진분류 실습을 이렇게 마쳤다. 마지막 부분은 다섯째 날 2교시 수업 내용까지 합해서 정리했다. 확실히 현장 수업은 진도가 많이 느리다. 담임선생님이 하시는 수업이라 1교시에는 자리 배치를 바꾸는 시간으로 보내기도 했다. 난 휴게실에서 따로 그 무렵 데이터 분석을 공부하고 있었다.
오늘 딥러닝 공부를 충분히 하고도 남을 것 같다. 이제 잠시 쉬었다가 새벽에 하지 못한 큐티도 하고 요가도 한 후 3시 조금 넘어서 다시 오후 공부를 시작해려고 한다.
'인공지능 > 딥러닝' 카테고리의 다른 글
딥러닝 10 - 다중분류 실습해보기 2 : 학습 방법 및 평가 방법 설정 (0) | 2024.09.22 |
---|---|
딥러닝 9 - 다중분류 실습해보기 1 : 문제 데이터 확인 및 MLP 모델링 (0) | 2024.09.22 |
딥러닝 7 - 딥러닝 기초 학습 4 : 딥러닝 모델링 및 딥러닝 신경망 설계하기 (0) | 2024.09.22 |
딥러닝 6 - 퍼셉트론 이해하기 3 : 다중 퍼셉트론 모델 학습 및 평가해보기 (0) | 2024.09.22 |
딥러닝 5 - 퍼셉트론 이해하기 2 : 퍼셉트론 종류별로 실습해보기 (0) | 2024.09.22 |