일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 자바 실습
- 혼공머신
- 데이터베이스
- 중학수학
- 머신러닝
- 컴퓨터구조
- 자바스크립트
- 중학1-1
- html/css
- ChatGPT
- JDBC
- 개발일기
- 디버깅
- 상속
- JSP
- 정보처리기사필기
- SQL
- 파이썬
- 딥러닝
- 정보처리기사실기
- 순환신경망
- JSP/Servlet
- c언어
- 자바스크립트심화
- 데이터분석
- 컴퓨터비전
- rnn
- CSS
- 연습문제
- 자바
- Today
- Total
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
머신러닝을 위한 데이터 이해하기 4 - 도메인 지식을 늘려 데이터 준비하기 본문
이제 두번째 실습을 진행해보겠다. 먼저 타이타닉 침몰에 대한 동영상도 함께 제공하고 있어 무척 재미있는 수업이 될 것 같다.
실습 1-2 : 타이타닉호 침몰 상황 파악하기
타이타닉 호가 침몰하는 상황을 자세히 보여주고 있는 영상이다. 한국어 자막이 없어서 조금 아쉽지만 말이다.
실습 2-2 : 타이타닉호 침몰과 관련된 도메인 지식을 늘려보기
실습 2-3 : 도메인 지식을 늘려 데이터 준비하기
실습 문제 풀어보기
두번째 지시사항까지 완료한 코드이다. 이제 모델의 성능을 78% 이상으로 높여야 한다. 두번째 지시사항의 값을 변경하여 이 성능을 높여주면 된다.
이제 모델 성능이 78% 이상이 되었다.
채첨하는데 조금 오래 걸리지는 했지만 잘 풀었다.
단원 요약
왜 어떨 때는 성능이 높아지고 낮아지는지 의문이 들 수도 있겠다. 르네상스 시대에 윌리엄 오캄이라는 신학자는 다음과 같은 말을 남겼다고 한다. 어떤 가설이 있을 때 간단한 가설을 선택하는 것이 좋다.
현대 과학의 기조에서도 이러한 오캄's razor가 활용되고 있다. 많은 feature를 넣는다고 해서 모델이 좋아지지 않는다. 우리는 모델을 선택할 때 이 특징을 선택할 때 어떠한 결과가 있을지 생각해야 한다. feature는 데이터에서 시작하며 도메인의 전문성이 더 중요하다는 것을 기억해야 한다.
학습을 마치고
11시 무렵에 3주차 학습을 다 마치려고 했는데 목표한대로 잘 마칠 수 있었다. 실습 문제를 통해 머신러닝이 어떻게 동작하는지 이해할 수 있었고 어떤 feature를 바꾸느냐에 따라 성능이 이처럼 달라질 수 있다는 것도 배울 수 있었다.
그래도 나름 유익한 시간이었다고 생각한다. 이제 남은 아침 공부 시간에는 텍스트 마이닝 학습을 시작해볼 것이다.
'인공지능 > 머신러닝' 카테고리의 다른 글
텍스트 마이닝 2 - 텍스트 마이닝 기초 실습 2 : 워드 클라우드 생성하기 (0) | 2024.09.19 |
---|---|
텍스트 마이닝 1 - 텍스트 마이닝의 개념과 분석할 자료 가져오기(한국어 혐호 표현 데이터) (0) | 2024.09.19 |
머신러닝을 위한 데이터 이해하기 3 - 도메인 지식 없이 Data Processing 하기 (0) | 2024.09.19 |
머신러닝을 위한 데이터 준비하기 2 - 데이터 준비의 중요성과 파이프라인 (0) | 2024.09.19 |
머신러닝을 위한 데이터 이해하기 1 - 머신러닝을 위한 핵심 개념 살펴보기 (0) | 2024.09.19 |