일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- html/css
- 영어공부
- 파이썬
- 데이터입출력구현
- 정보처리기사필기
- 혼공머신
- 컴퓨터비전
- 데이터베이스
- 정수와유리수
- 중학수학
- 코딩테스트
- 머신러닝
- 파이썬라이브러리
- 컴퓨터구조
- numpy/pandas
- JSP/Servlet
- 딥러닝
- 텍스트마이닝
- 자바 실습
- 연습문제
- CSS
- CNN
- 운영체제
- 자바
- 정보처리기사실기
- 중학1-1
- SQL
- 데이터분석
- pandas
- C++
- Today
- Total
목록선형회귀모델 (7)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
어제에 이어 오늘도 엄마와 함께 황토길 걷기를 갔다와서 맛있는 점심도 먹고 이제 오후 공부를 시작해보려고 한다. 공부하는 시간이 정말 기대가 된다. 오늘은 또 무엇을 배울 수 있을지 생각하며.. 오후에도 아침에 하다만 수업을 듣고 마무리를 해볼 것이다. 3시간 정도의 분량이 남아있는데 오늘은 집에 가는 날이라 많이는 공부를 하지 못할 것 같다.그래도 할 수 있는데까지 해보고 저녁에 또 이어서 진행해볼 것이다. 집값 예측 선형회귀 실습 마지막 이 코드가 실행되지 않고 계속 오류가 떠서 거의 1시간 가까이 코드를 분석하며 오류를 찾는 작업을 진행했다. 그리고 드디어 찾았다. 입력 특성에서 인코딩한 값을 쓰지 않고 이전의 값을 사용했기 때문이었다. 여기서는 문자열을 받지 못한다고 한다.어쨌든 해결이 되어 정..
이 프로젝트의 마지막 실습 작업이 될 것 같다. 이제 머신러닝의 학습 전처리와 모델 선택 등의 과정이 이어진다. 새벽 공부 마지막 시간인데 남은 시간도 열심히 해보자! 주택 가격 예측 선형회귀 모델 실습 세번째 특성 선택은 계속해서 반복하며 넣고 빼는 작업은 해봐야 한다. 인코딩을 하는 2가지 방법 데이터는 수치형과 문자형으로 나누어진다. 1. 원핫 인코딩 고유 타입을 컬럼 형태로 표현하는 방식이다. type은 h, u, t 타입으로 구성되어 있고, 이 종류마다 컬럼은 파생시킨다. 해당하는 부분은 1로 올리고 나머지는 0으로 만든다.원핫 인코딩의 장점은 모든 데이터의 크기가 동등한 크기를 가진다. 크기를 잘못 기입하면 학습의 방해 요소가 될 수 있다. 원핫 인코딩은 모든 숫자가 1로 통일..
결측치를 채우는 것부터 나머지 머신러닝 프로세스 단계를 학습해보기로 하자. 새벽에 공부하니 저녁에 할 때보다 집중이 훨씬 잘 되고 머리도 맑은 것 같다. 결측치 처리하기 데이터가 많다면 결측치를 제거해도 괜찮지만 데이터가 적으면 결측치를 다른 값으로 채워 결측치를 살려주는 것이 좋다. False면 0을, True면 1을 반환하여 그 컬럼의 세로 총합을 구해본다. 채운 다음에는 원래 값에 넣어준다. 관할구역이 결측치라도 지역 이름은 들어있을 것이다. 이 지역 이름이 어느 관할 구역에 속하는지 파악하고 채워주는 작업을 진행한다. pivot 테이블은 데이터를 재구조화하는 것이다.만약 values에 Price를 넣고, aggfunc에 mean을 넣으면 지역에 따른 가격 평균..
오늘은 저녁에 별로 공부를 하고 싶은 마음이 들지 않았지만 그래도 잠시 운동을 한 후 책상 앞에 앉아 공부를 시작해본다. 저녁에 둘째날 수업을 모두 학습하기는 어렵고 조금이라도 해볼 생각이다. 이어서 선형 회귀 모델에 대해서 학습해보자. 선형회귀 모델 실습해보기지난 시간까지 선형회귀 모델에 대한 개념과 사용방법에 대해 다루어보았다. 이번 시간에는 데이터를 가져와서 주택 가격을 예측하는 실습을 진행해볼 것이다. 6번은 생략하고 하나씩 실습해보기로 하자. 3. 데이터 전처리 및 탐색 방의 수, 가격, 거리, 위도, 경도 등 많은 정보가 들어있는 주택 데이터셋이다. 데이터셋을 요약해서 알려주는 정보를 출력해보자. 데이터 정보 확인21개의 컬럼 중에서 입력 특성으로 사용할만한 것이 무엇이 있는지, ..
조금 전에 썼던 학습일지가 모두 날라가서 무척 속이 상하지만 다시 처음부터 공부한다는 마음으로 기록해보기로 했다. 이제 평균제곱 오차를 구하는 실습을 진행해보자. 평균제곱 오차 구하는 실습해보기 선형 회귀 가설함수 만들기 가중치에 따라 값이 달라지는 가설함수가 만들어졌다. 공부 시간은 판다스의 시리즈 형태로 집어넣었다. 여기에는 4개의 데이터가 들어간다(9, 8, 4, 2시간). 두번째 매개변수로는 숫자값 0.5가 들어간다. 이 둘을 곱하니 하나의 시리즈가 나왔다. 판타스 시리즈에서 요소별 연산이 따라온 것이다. 평균 제곱 오차함수 만들기앞서 만들었던 가설함수를 이용해 평균 제곱 오차함수를 구현해보기로 하자. 오차가 모두 0으로 나오고 있다. 예측값이 시리즈로 나오고, 결과값도 같은 인덱스끼..
이어서 다중 회귀 모델에 대해서 학습해보려고 한다. 1. 다중 선형 회귀 모델 실습해보기 입력 특성에 게임 시간 하나를 추가해보았다. 두 개 이상의 컬럼을 꺼낼 때는 리스트로 묶어서 꺼내면 된다. 다중 선형 회귀 모델링하기 학습할 때는 fit, 예측할 때는 predict라는 단어를 많이 사용한다. 이제 선형 회귀 모델이 어떤 원리에 따라 학습을 하는지 좀더 깊이있는 학습을 해볼 것이다. 공부 시간과 성적을 세 개의 모델이 학습한 결과를 나타내고 있다. 이 중에서 현재의 데이터를 가장 잘 반영하고 있는 그래프는 몇 번 그림일까? 3번이다. 1, 2번은 데이터의 패턴을 잘 파악하지 못하고 있다.선형 회귀 모델에서 모델이 학습을 잘 하고 있는지 그렇지 않은지 알 수 있는 방법이 존재한다. 실제 연..
늦은 점심을 먹고 3시가 훌쩍 넘어서 다시 오후 공부를 시작해본다. 지금부터 3시간 40분 정도 공부를 할 생각이다. 이번에 공부할 단원은 선형 회귀 모델인데 여기서부터는 수업을 하나도 들어본 적이 없어서 과연 잘 따라갈 수 있을지 걱정이 된다.그래도 열심히 공부하고 잘 이해가 되지 않는 건 반복해서 들어보려고 한다. 제발 수업 영상이 중간에 잘리지 않고 다 잘 나오기를 바라면서 공부를 시작해본다. 선형 회귀 모델 개념 학습 가장 오래 사용되어 왔고 딥러닝의 기본 기술이 되는 선형 회귀 모델에 대해서 학습해보겠다. 선형 모델은 선형 수식을 만들어서 예측하는 모델이다. KNN, Tree 모델도 자신만의 고유한 알고리즘을 갖고있는 모델 중 하나이다. KNN은 최근접이웃모델이라고 부른다. 어떤 ..