클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지

머신러닝을 위한 데이터 이해하기 3 - 도메인 지식 없이 Data Processing 하기 본문

인공지능/머신러닝

머신러닝을 위한 데이터 이해하기 3 - 도메인 지식 없이 Data Processing 하기

huenuri 2024. 9. 19. 10:38

두 가지의 실습이 준비되어 있다. 먼저 첫번째 실습부터 진행해볼 것이다.


 

 

 

실습 1-1 데이터 준비가 필요한 타이타닉 데이터

 

 


 

 

 

실습 1-2 도메인 지식 없이 Data Processing 하기


 

 

main.py

 


 

 

 

without_domain.py


 

 

 

elice_utlis.py

 

그리고 데이터에는 png 이미지 파일과 titanic.csv 파일이 들어있었다.

 

 

 

 

csv 파일에는 10명의 탑승객의 정보가 이처럼 테이블 형태로 만들어져 있었다. 이제 본격적인 실습을 해보자!


 

 

 

실습해보기

먼저 실행 결과를 확인해보면 다음과 같다.


 

첫번째 실습

 

결측치의 비율을 확인할 수 있다.

 


 

두번째 실습


 

 

세번째 실습


 

 

네번째 실습

먼저 성별로 변환하는 코드이다.

 

 

탑승한 곳까지 변환해보았다.

 

 

여기까지 실습을 진행해보았다.

 


 

 

 

학습을 마치고

결측치를 처리하고 변환하는 작업을 해보았다. 데이터를 이렇게 바꿀 수 있다는 것을 알게 되었는데 모든 코드를 다 이해하지는 못했다. 설명을 들으며 하나씩 진행해보니 데이터가 조금씩 바뀌어지는 상황을 볼 수 있었다.

다음 포스트에서는 3주차의 마지막 실습을 진행해볼 것이다.