일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- CSS
- 자바
- 컴퓨터구조
- 딥러닝
- 중학1-1
- 데이터베이스
- 데이터분석
- c언어
- ChatGPT
- 디버깅
- 혼공머신
- JSP
- JDBC
- 개발일기
- html/css
- 순환신경망
- 중학수학
- 자바스크립트
- 상속
- SQL
- 자바스크립트심화
- rnn
- 연습문제
- 정보처리기사필기
- 컴퓨터비전
- 정보처리기사실기
- 파이썬
- JSP/Servlet
- 머신러닝
- 자바 실습
- Today
- Total
목록인공지능 (424)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
어제에 이어 오늘도 엄마와 함께 황토길 걷기를 갔다와서 맛있는 점심도 먹고 이제 오후 공부를 시작해보려고 한다. 공부하는 시간이 정말 기대가 된다. 오늘은 또 무엇을 배울 수 있을지 생각하며.. 오후에도 아침에 하다만 수업을 듣고 마무리를 해볼 것이다. 3시간 정도의 분량이 남아있는데 오늘은 집에 가는 날이라 많이는 공부를 하지 못할 것 같다.그래도 할 수 있는데까지 해보고 저녁에 또 이어서 진행해볼 것이다. 집값 예측 선형회귀 실습 마지막 이 코드가 실행되지 않고 계속 오류가 떠서 거의 1시간 가까이 코드를 분석하며 오류를 찾는 작업을 진행했다. 그리고 드디어 찾았다. 입력 특성에서 인코딩한 값을 쓰지 않고 이전의 값을 사용했기 때문이었다. 여기서는 문자열을 받지 못한다고 한다.어쨌든 해결이 되어 정..
이 프로젝트의 마지막 실습 작업이 될 것 같다. 이제 머신러닝의 학습 전처리와 모델 선택 등의 과정이 이어진다. 새벽 공부 마지막 시간인데 남은 시간도 열심히 해보자! 주택 가격 예측 선형회귀 모델 실습 세번째 특성 선택은 계속해서 반복하며 넣고 빼는 작업은 해봐야 한다. 인코딩을 하는 2가지 방법 데이터는 수치형과 문자형으로 나누어진다. 1. 원핫 인코딩 고유 타입을 컬럼 형태로 표현하는 방식이다. type은 h, u, t 타입으로 구성되어 있고, 이 종류마다 컬럼은 파생시킨다. 해당하는 부분은 1로 올리고 나머지는 0으로 만든다.원핫 인코딩의 장점은 모든 데이터의 크기가 동등한 크기를 가진다. 크기를 잘못 기입하면 학습의 방해 요소가 될 수 있다. 원핫 인코딩은 모든 숫자가 1로 통일..
결측치를 채우는 것부터 나머지 머신러닝 프로세스 단계를 학습해보기로 하자. 새벽에 공부하니 저녁에 할 때보다 집중이 훨씬 잘 되고 머리도 맑은 것 같다. 결측치 처리하기 데이터가 많다면 결측치를 제거해도 괜찮지만 데이터가 적으면 결측치를 다른 값으로 채워 결측치를 살려주는 것이 좋다. False면 0을, True면 1을 반환하여 그 컬럼의 세로 총합을 구해본다. 채운 다음에는 원래 값에 넣어준다. 관할구역이 결측치라도 지역 이름은 들어있을 것이다. 이 지역 이름이 어느 관할 구역에 속하는지 파악하고 채워주는 작업을 진행한다. pivot 테이블은 데이터를 재구조화하는 것이다.만약 values에 Price를 넣고, aggfunc에 mean을 넣으면 지역에 따른 가격 평균..
오늘은 저녁에 별로 공부를 하고 싶은 마음이 들지 않았지만 그래도 잠시 운동을 한 후 책상 앞에 앉아 공부를 시작해본다. 저녁에 둘째날 수업을 모두 학습하기는 어렵고 조금이라도 해볼 생각이다. 이어서 선형 회귀 모델에 대해서 학습해보자. 선형회귀 모델 실습해보기지난 시간까지 선형회귀 모델에 대한 개념과 사용방법에 대해 다루어보았다. 이번 시간에는 데이터를 가져와서 주택 가격을 예측하는 실습을 진행해볼 것이다. 6번은 생략하고 하나씩 실습해보기로 하자. 3. 데이터 전처리 및 탐색 방의 수, 가격, 거리, 위도, 경도 등 많은 정보가 들어있는 주택 데이터셋이다. 데이터셋을 요약해서 알려주는 정보를 출력해보자. 데이터 정보 확인21개의 컬럼 중에서 입력 특성으로 사용할만한 것이 무엇이 있는지, ..
조금 전에 썼던 학습일지가 모두 날라가서 무척 속이 상하지만 다시 처음부터 공부한다는 마음으로 기록해보기로 했다. 이제 평균제곱 오차를 구하는 실습을 진행해보자. 평균제곱 오차 구하는 실습해보기 선형 회귀 가설함수 만들기 가중치에 따라 값이 달라지는 가설함수가 만들어졌다. 공부 시간은 판다스의 시리즈 형태로 집어넣었다. 여기에는 4개의 데이터가 들어간다(9, 8, 4, 2시간). 두번째 매개변수로는 숫자값 0.5가 들어간다. 이 둘을 곱하니 하나의 시리즈가 나왔다. 판타스 시리즈에서 요소별 연산이 따라온 것이다. 평균 제곱 오차함수 만들기앞서 만들었던 가설함수를 이용해 평균 제곱 오차함수를 구현해보기로 하자. 오차가 모두 0으로 나오고 있다. 예측값이 시리즈로 나오고, 결과값도 같은 인덱스끼..
이어서 다중 회귀 모델에 대해서 학습해보려고 한다. 1. 다중 선형 회귀 모델 실습해보기 입력 특성에 게임 시간 하나를 추가해보았다. 두 개 이상의 컬럼을 꺼낼 때는 리스트로 묶어서 꺼내면 된다. 다중 선형 회귀 모델링하기 학습할 때는 fit, 예측할 때는 predict라는 단어를 많이 사용한다. 이제 선형 회귀 모델이 어떤 원리에 따라 학습을 하는지 좀더 깊이있는 학습을 해볼 것이다. 공부 시간과 성적을 세 개의 모델이 학습한 결과를 나타내고 있다. 이 중에서 현재의 데이터를 가장 잘 반영하고 있는 그래프는 몇 번 그림일까? 3번이다. 1, 2번은 데이터의 패턴을 잘 파악하지 못하고 있다.선형 회귀 모델에서 모델이 학습을 잘 하고 있는지 그렇지 않은지 알 수 있는 방법이 존재한다. 실제 연..
늦은 점심을 먹고 3시가 훌쩍 넘어서 다시 오후 공부를 시작해본다. 지금부터 3시간 40분 정도 공부를 할 생각이다. 이번에 공부할 단원은 선형 회귀 모델인데 여기서부터는 수업을 하나도 들어본 적이 없어서 과연 잘 따라갈 수 있을지 걱정이 된다.그래도 열심히 공부하고 잘 이해가 되지 않는 건 반복해서 들어보려고 한다. 제발 수업 영상이 중간에 잘리지 않고 다 잘 나오기를 바라면서 공부를 시작해본다. 선형 회귀 모델 개념 학습 가장 오래 사용되어 왔고 딥러닝의 기본 기술이 되는 선형 회귀 모델에 대해서 학습해보겠다. 선형 모델은 선형 수식을 만들어서 예측하는 모델이다. KNN, Tree 모델도 자신만의 고유한 알고리즘을 갖고있는 모델 중 하나이다. KNN은 최근접이웃모델이라고 부른다. 어떤 ..
새로운 선생님이 오셔서 머신러닝 강의를 하셨는데 이때까지만 해도 머신러닝에 전혀 관심이 없어서 수업을 거의 듣지 않았다. 오늘부터 5일에 걸쳐 이 선생님 수업을 들으며 머신러닝의 기초를 다지는 시간을 갖기로 했다. 아마 3주 정도 되는 수업 분량인 것 같다. 이 많은 것들을 5일 안에 다 마치려고 한다.우선 머신러닝에 대한 복습부터 시작해보자. 머신러닝 복습 인공지능은 사람처럼 흉내내는 모든 것을 말한다. 인공지능 기술의 가장 큰 핵심은 학습이다. 사람은 학습을 통해 발전해왔기 때문이다. 컴퓨터에게 어떻게 학습을 시킬지를 만들어놓은 것이 머신러닝 즉 기계학습이다.머신러닝은 학습 방법이 정말 많다. 최근에 나온 놀라운 결과물은 딥러닝이라는 기술로부터 시작한다. 딥러닝은 머신러닝의 하위 분야이고 학습 방..
지난 맛보기 실습에서 풀었던 문제인데 이번에는 강의 영상과 함께 제공하고 있다. 아침 요가를 마치고 아침을 먹고 나니 벌써 10시가 다 되었다. 아침에는 공부를 30분밖에 하지 못할 것 같지만 이렇게라도 공부하는 시간은 정말 중요하다. 그럼 바로 이어서 문제를 풀어보겠다. 실습 - 타이타닉의 생존자 찾기 굵은 글씨는 컬럼명인데, survived는 생존률을 나타낸다. 1은 생존, 0은 사망을 의미한다. 그리고 NaN은 결측치를 나타낸다.여기 나와있는 생존 규칙을 참고로 하며 자신만의 규칙을 만들어본다. 그런 다음 테스트한 규칙에 대한 테스트 파일을 작성한다. 문제는 지난 포스트에서 소개했으므로 여기서는 생략하고 결과만 첨부해본다. 문제 풀어보기 테스트의 정확도는 10점이 나왔다. 이건 ..
이 수업이 마지막 이론 수업이 될 것 같다. 여기까지 공부하고 새벽 공부를 마치며, 아침 운동을 한 후 아침식사도 하려고 한다. 바로 공부를 시작해보자! 요즘 공부하는 시간이 가장 즐겁고 행복하다. 이론 3 - 머신러닝이 필요한 상황과 핵심 동작 원리머신러닝은 컴퓨터에게 프로그램이나 수학적 방법을 넣어 규칙이나 패턴을 만들어달라고 하는 것이다. 머신러닝이 필요한 시점이 있는데 이러한 3가지 문제를 만족할 때 사용하면 좋다.모든 서비스나 제품에는 운영하기 위한 정책이나 규칙이 굉장히 많다. 예를 들면 블랙 컨슈머를 정의하기 위한 세부적인 내용들이 많이 있다.첫번째, 사람이 손으로 작성한 길고 긴 규칙과 리스트들이 문서화한 것들이 있을 것이다. 이런 것들은 유지 보수하기가 어렵고 관리하기도 어렵다. 이..