클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

머신러닝을 위한 데이터 이해하기 1 - 머신러닝을 위한 핵심 개념 살펴보기 본문

인공지능/머신러닝

머신러닝을 위한 데이터 이해하기 1 - 머신러닝을 위한 핵심 개념 살펴보기

huenuri 2024. 9. 19. 08:33

오늘은 평소보다 조금 늦게 일어나서 하루를 시작했다. 매일 해야 하는 일들과 새벽에 하는 공부 두 가지를 마치고 나니 벌써 8시가 넘었지만 새벽 공부를 시작해본다.

오늘은 수업 하나만 듣고 인사교 수업에 가려고 한다. 아침 요가는 바빠서 하지 못할 수도 있을 것 같다. 그래도 하는데까지 공부를 진행해볼 것이다. 오늘부터는 텍스트 마이닝 학습에 들어간다. 어떤 수업이 될지 기대가 된다.

이번 시간에는 엘리스로 첫번째 수업을 들어볼 것이다.


 

 

 

이론 1 - 머신러닝을 위한 핵심 개념 살펴보기

 

 

 


 

 

 

머신러닝을 위한 핵심개념 살펴보기 1 : Data, Feature, Target

 

 

 

 

 

 

 

우리가 사는 세상을 퍼즐로 표현했을 때 이러한 것들을 조작하고 현상을 표현하는 것이다. 좋은 데이터가 나오기 위해서는 측정 도구가 신뢰할만한 것이어야 한다.

 

 

 

 

 

객관화된 자료이어야 한다. 데이터 자체는 의미가 없고 내용이 필요하다. 세번째 특징은 실제 세상을 표현하고 표상한다는 것이다. 자연어는 벡터라는 수학적인 공간에서 표현하는 방식인데 이 데이터를 어떻게 표현하는 것이 중요하다.

 

 

 

 

 

 

 

아날로그 형식을 디지털 형식으로 표현하는 것을 feature라고 한다.

 

 

 

feature라는 말을 독립변수, 환경변수, 예측인자, 입력 그리고 데이터베이스에서는 attribute라고도 한다.

 

 

 

 


 

 

 

머신러닝을 위한 핵심개념 살펴보기 2 : Model, Algorithm, Error, Learning

 

모델은 다양한 형태로 사용된다.

 

 

머신러닝 모델은 추상화된 형태로 표현하는 것이다. 

 

 

 

 

 

 

 

 

어떤 알고리즘을 사용하느냐에 따라 다른 값이 된다.

 

 

 

 

머신러닝을 하다보면 예측에서 벗어난 에러가 발생한다.

 

 

 


 

 

 

퀴즈 1 - 데이터 이해하기

 

 

 

이번에는 잘 맞추었다. 데이터는 아날로그도 모두 포함하는 개념이므로 마지막 번호는 틀린 설명이다.


 

 

 

 

퀴즈 2 - 머신러닝 핵심 개념

 


 

 

 

학습을 마치고

시간이 없어도 30분이라도 공부하는 것이 얼마나 중요한지 느끼는 시간이었다. 영어도 수학도 마찬가지이다. 그동안 이러한 공부를 시작하지 못했던 이유는 공부할 시간이 없다는 핑계였다. 하지만 하루에 15분 영어 공부하는 것으로 충분했고 오늘 새벽에도 10분만 수학 문제를 풀어볼까 하다가 50분이나 풀 수 있었다.

매일 수학을 통해 머리가 맑아지고 트이는 기분을 느낀다. 머신러닝 공부도 이제 많이 흥미가 생기며 막바지를 향해 달려가고 있다. 마지막까지 힘을 내서 최선을 다해볼 것이다.