일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- JSP/Servlet
- 데이터분석
- 파이썬
- c언어
- 정보처리기사필기
- 오블완
- 혼공머신
- 순환신경망
- 컴퓨터구조
- 정보처리기사실기
- 머신러닝
- 중학수학
- JSP
- 자바스크립트
- 자바 실습
- 디버깅
- 중학1-1
- 데이터베이스
- 컴퓨터비전
- 개발일기
- SQL
- JDBC
- 자바
- 딥러닝
- rnn
- 연습문제
- html/css
- 자바스크립트심화
- 상속
- CSS
- Today
- Total
목록비지도학습 (6)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
마지막까지 힘내서 달려보자. 비지도 학습 마지막 단원이다. 주성분 분석 실습해 보기 주성분 분석은 데이터가 있는 분산이 큰 방향을 찾는 것으로 이해할 수 있다. 분산은 데이터가 널리 퍼져있는 정도를 말한다. 분산이 큰 방향이란 데이터를 잘 표현하는 어떤 벡터이다. 주성분 벡터는 원본 데이터에 있는 어떤 방향이다. 따라서 주성분 벡터의 원소 개수는 원본 데이터셋에 있는 특성 개수와 같다. 원본 데이터는 주성분을 사용해 차원을 줄일 수 있다. 예를 들면, 다음과 같이 샘플 데이터 s(4, 2)를 주성분에 직각으로 투영하면 1차원 데이터 p(4.5)를 만들 수 있다.주성분은 원본 차원과 같고 주성분으로 바꾼 데이터는 차원이 줄어든다는 점을 꼭 기억하자. 첫 번째 주성분을 찾은 다음 이 벡터에 수직이고 ..
이어서 k-평균에 관한 공부를 진행해 보겠다. k-평균 실습해 보기 먼저 파일을 준비하고 k-평균 모델을 훈련하기 위해 (샘플 개수, 너비, 높이) 크기의 3차원 배열을 (샘플 개수, 너비x높이) 크기를 가진 2차원 배열로 변경한다.KMeans 클래스에서 설정할 매개변수는 클러스터 개수를 지정하는 n_clusters이다. 여기서는 클러스터 개수를 3으로 지정했다. 비지도 학습이므로 fit() 메서드에서 타깃 데이터를 사용하지 않겠다. 군집된 결과는 KMeans 클래스 객체의 labels_ 속성에 저장된다. labels_ 배열의 길이는 샘플 개수와 같다. n_clusters=3으로 지정했기 때문에 labels_ 배열의 값은 0, 1, 2 중 하나이다. 레이블값 0, 1, 2와 레이블 순서에는 어떤..
k-평균 알고리즘에 대한 실습을 진행해볼 것이다. k-평균 알고리즘 실습해보기메모리 누수가 발생하는 경고창이 뜨고 있다. 이 경고 메시지는 KMeans 알고리즘을 사용하는 동안 Windows 운영체제에서 특정 상황에서 메모리 누수(memory leak)가 발생할 수 있음을 알려주는 것이다. 이 문제는 MKL (Intel의 수학 커널 라이브러리, Math Kernel Library)와 관련이 있으며, 특히 사용 가능한 스레드 수보다 처리해야 할 데이터 청크가 적을 때 발생할 수 있다. 그냥 놔두어도 되지만 완벽한 코드 작성을 위해 해결해보기로 했다. 하지만 문제는 해결되지 않았다. 그냥 넘어가지로 했다. 여기에 시간은 많이 투자할 수 없으니까. 하지만 여전히 ..
이번에는 평균 알고리즘에 대해 학습해 보겠다. 학습 목표k-평균 알고리즘의 작동 방식을 이해하고, 과일사진을 자동으로 모으는 비지도 학습 모델을 만들어본다. 시작하기 전에이전 학습에서 사과, 파인애플, 바나나에 있는 각 픽셀의 평균값을 구하서 가장 가까운 사진을 골랐다. 하지만 진짜 비지도 학습에서는 사진에 어떤 과일이 들어있는지 알지 못한다.이런 경우 어떻게 평균을 구할 수 있을까? 바로 k-평균 군집 알고리즘이 평균값을 자동으로 찾아준다. 이 평균값이 클러스트의 중심에 위치하기 때문에 클러스트 정 심 또는 센트로이드라고 부른다. k-평균 알고리즘 소개k-평균 알고리즘의 작동 방식은 다음과 같다.무작위로 k개의 클러스터 중심을 정한다.각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터..
군집 알고리즘에 대한 실습을 진행해볼 것이다. 군집 알고리즘 실습해보기 난 코랩이 아닌 주피터 노트북에서 실행하기에 책과는 다른 방식으로 파일을 다운받아야 했다. 이렇게 하니 잘 되었다. 파일은 맨 아래에 저장이 잘 되어 있다. 이제 데이터를 로드하며 실행해보겠다. 첫번째 이미지는 사과같다. 단원 마무리하기 뭔가 오류가 잔뜩 떴다. 이름을 하나 잘못 지정해서 틀린 거였다. 바나나가 아닌 것 마지막에 2개만 빼고 모두 바나나가 잘 출력되는 것을 볼 수 있다. 학습을 마치고 이렇게 40분만에 모든 실습을 마치고 확인문제까지 풀어볼 수 있어서 좋았다. 왠지 아침 시간에 6단원 학습을 모두 마칠 수 있을 것 같은 예감이 든다. 오늘은 아마도 수학공부는 못..
머신러닝의 마지막 단원 학습이 남아있다. 이것도 세 장으로 나누어져 있으니 공부하는데 한참의 시간이 걸릴 것 같다. 가능하면 오늘 오후 2시 전에는 공부를 다 마칠 생각이다.그럼 군집 알고리즘부터 공부를 시작해 보자. 학습 목표흑백 사진을 분류하기 위해 여러 가지 아이디어를 내면서 비지도 학습과 군집 알고리즘에 대해 이해하기 시작하기 전에한빛 마켓은 낭산물 판매로 확대하며 새 이벤트를 기획하고 있다. 고객이 한빛 마켓에서 사고 싶은 과일 사진을 보내면 그중 가장 많이 요청하는 과일을 판매 품목으로 선정하려 한다. 또 1위로 선정된 과일 사진을 보낸 고객 중 몇 명을 뽑아 이벤트 당첨자로 선정할 것이다. 사진에 대한 정답(타깃)을 알지 못하는데 어떻게 이 사진을 종류대로 모을 수 있을까? 타깃을 ..