클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

머신러닝과 데이터 과학 이해하기 2 - 머신러닝이란 무엇인가? 본문

인공지능/머신러닝

머신러닝과 데이터 과학 이해하기 2 - 머신러닝이란 무엇인가?

huenuri 2024. 9. 16. 08:08

데이터 과학에 이어 머신러닝에 대한 개념을 이해하는 공부를 진행해보자.


 

 

 

이론 2 - 머신러닝이란 무엇인가?

 

1. 머신러닝과 다른 분석 방법 비교

 

데이터를 분석하는 것은 머신러닝뿐 아니라 다양한 분석이 있다. 각각의 분야에 따라 접근 방법과 목표로 하는 것이 다르다.


 

 

 

빅데이터 분석은 그로스 해킹에서 많이 사용하는 방법으로 프로그래밍을 포함한 기술 분석을 통한 마케팅을 말한다. 이것은 상관관계를 탐지하는 학문이다. 예를 들면 이 그림에서 남자가 머리를 밀면 판매가 좋다고 말하고 있다. 이처럼 A와 B의 상관관계를 찾고 의사결정에 활용하는 것이다.

우리 속담 중에 까마귀 날자 배 떨어진다라는 말처럼 인관관계를 많이 사용한다.


 

 

 

우리 세계를 이해하고 해석하는데 중점을 둔다. 큰 세계를 이해하기 위한 모형을 만든다. 이 모형을 통해 현상을 이해하고, 모형에서 나오는 통계치, 수치, 가정을 중요하게 생각한다. 사용하는 기술이나 기법이 머신러닝과 비슷하나 그 사용목적이 이해와 해석에 있다.


 

 

 

머신러닝의 가장 큰 목적은 예측과 패턴을 분석하는 것이다. 기계가 학습하고 예측을 만들 때 자신이 알고 싶은 패턴을 잘 만드는지가 중요하다. 통계분석과는 달리 모형의 성능, 정확도가 더 중요하다. 이러한 것들을 자동으로 기계학습을 하는데 목표가 있다.

빅데이터나 통계 분석과는 다르게 머신러닝은 많은 데이터가 있다고 가정하고 이 모형의 정확도와 성능을 중시하는 차이점이 있다.


 

 

 

 

2. 머신러닝의 정의와 역사

 

머신러닝은 현상이나 실제 문제에서 가설을 세우고 이를 검증하기 위한 작업이다. 검증하는 과정에 데이터와 프로그래밍을 활용하게 된다. 1995년에 아서 사무엘이 머신러닝에 대해 이야기한 내용을 살펴보면 머신러닝은 기계에게 일일이 설명해주지 않아도 스스로 찾아가도록 하는 일련의 과정이다.

컴퓨터 공학에서는 머신러닝은 하나의 자동화된 시스템이라고 한다. 또한 학습이나 어떠한 작업을 하기 위해 이전의 경험들을 사용해서 성능을 높이는 것을 의미한다.

 

이처럼 머신러닝은 오래 전부터 다루어져왔던 학문임을 알 수 있다.


 

 

 

 

 

1956년 인간처럼 생각하는 기계라는 의미의 인공지능이 등장했으나, 이것이 안된다는 사실에 좌절하고 정부 사업이나 지원 등이 끊기게 됨으로 냉각기를 거치게 되었다. 1980년대 컴퓨터가 발달함으로 컴퓨터에 이러한 지식을 학습시킬 수 있지 않을까 하는 생각에 연구가 재기되었다. 인터넷의 발달로 수많은 데이터를 컴퓨터가 학습함으로 많은 발전을 이룬다.

2000년대에 들어서 딥러닝 방법이 개발됨으로 컴퓨터가 스스로 특징을 찾고 학습할 수 있는 시스템이 발달해왔다.

 

이렇게 발전할 수 있었던 계기는 첫번째, 데이터가 굉장히 많아졌다는 것. 두번째는 컴퓨터의 하드웨어 성능이 좋아져 많은 데이터를 처리하고 분석할 수 있는 시스템이 마련되었다는 것. 세번째는 이들을 다루는 알고리즘이 개선되었다는 점을 들 수 있다.


 

 

 

 

퀴즈 3 - 빅데이터 분석의 목표

 

 

 

수업을 열심히 들었는지 문제를 바로 맞추었다.

 


 

 

 

학습을 마치고

수업이 정말 유익하다. 대부분 강사들이 PPT에 있는 내용을 읽기만 하는데 반해 이 강사님은 정말 성실하게 하나라도 더 알려주려고 하시는 모습이 보였다. 덕분에 머신러닝에 대해 많은 것들을 이해하고 통합적으로 접근할 수 있는 안목이 길러지고 있다.

다음 수업도 정말 기대가 된다.