일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 정보처리기사필기
- numpy/pandas
- 중학수학
- 정보처리기사실기
- JSP/Servlet
- 연습문제
- 중학1-1
- html/css
- 데이터입출력구현
- 컴퓨터구조
- pandas
- 텍스트마이닝
- 자바
- 파이썬
- 머신러닝
- 운영체제
- C++
- 컴퓨터비전
- CNN
- 딥러닝
- 영어공부
- 혼공머신
- 데이터베이스
- 데이터분석
- 자바 실습
- CSS
- 코딩테스트
- 정수와유리수
- SQL
- 파이썬라이브러리
- Today
- Total
목록2024/09/29 (8)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
이제 결정 트리에 대한 실습을 진행해볼 것이다. 결정 트리 실습해보기 이제 결정 트리로 와인이 잘 분류되었다. 단원 마무리하기 확인 문제 풀기 4번도 답으로 넣을까 많이 고민하다 그래도 답은 2개겠자 하고 썼는데 좀더 생각할걸 그랬다. 1번은 그냥 부모 노드와 자식 노드가 많이 등장하니 함정 같은 답안이었다. 어제 이 문제까지는 풀고 취침하려 했으나 너무 졸려서 다 하지 못하고 다음날 새벽에 일어나 해본다. 학습을 마치고오늘은 너무 졸려서 눈이 감긴다. 확인문제는 다음에 풀고 정리해야겠다. 이렇게 해서 5-1장 결정 트리 학습을 마쳤다. 저녁에 열심히 공부했다면 5단원을 모두 마쳤겠지만 그냥 놀고 싶어서 마지막으로 허용을 했다. 이제 ..
이번에 공부할 단원은 트리 알고리즘이다. 난 아무래도 하나의 과정이 끝나야 다음 분야가 눈에 들어오는 것 같다. 정처기는 잠시 미루고 오늘과 내일 새벽까지 6단원 학습을 마쳐볼 생각이다.그럼 바로 학습을 시작해 보자. 여기서부터는 단 한 번도 들어보지 않은 머신러닝 모델이니 더욱 집중해서 학습해야 할 것이다. 학습 목표결정 트리 알고리즘을 사용해 새로운 분류 문제를 다루어본다. 결정 트리가 머신러닝 문제를 어떻게 해결하는지 이해한다. 시작하기 전에 한빛 마켓에서는 신상품으로 캔 와인을 판매하려고 한다. 입고된 와인을 보니 급하게 제작하는 바람에 레드 와인과 화이트 와인 표시가 누락되었다. 김팀장은 혼공머신을 불러 이 문제를 해결할 것을 부탁한다.혼공머신은 일단 알코올 도수, 당도, pH 값에 로지스틱..
이제 확률적 경사 하강법을 실습해보려고 한다. 확률적 경사 하강법 실습해보기 백 번째 에포크 이후에는 훈련 세트와 테스트 세트의 점수가 조금씩 벌어지고 있다. 이 모델의 반복 횟수를 100에 맞추고 다시 훈련해보겠다. 단원 마무리하기 LinearRegression 클래스는 해석적인 방법으로 선형 방정식의 해를 구하는 구하기 때문에 특성의 스케일에 영향을 받지 않는다. KNeighborsClassifier는 최근접 이웃을 찾기 위해 샘플 간의 거리를 계산한다. 따라서 특성 스케일이 다르면 잘못된 이웃을 선택할 수 있다.Ridge는 가중치를 규제하여 모델의 과대적합을 막는다. 특성의 스케일이 달라지면 이와 곱해지는 가중치의 스케일도 달라진다. 이렇게 되면 큰 가중치에만 관심을 두..
이제 확률적 경사 하강법에 대해서 공부해보려고 한다. 이 내용에 대한 강의도 1시간이 넘는 무척 많은 분량이다. 책도 함께 학습하며 또다시 새로운 전진을 해볼 것이다. 학습 목표경사 하강법 알고리즘을 이해하고 대량의 데이터에서 분류 모델을 훈련하는 방법 배우기 시작하기 전에한빛마켓은 럭키백 이벤트를 오픈하고 나서 매출이 껑충 뛰었다. 영업팀은 매주 7개의 생선 중에서 일부를 무작위로 골라 머신러닝 모델을 학습할 수 있게 훈련 데이터를 제공하고 있다. 하지만 수산물을 공급하겠다는 곳이 너무 많아 샘플을 골라내는 일이 너무 힘들다. 게다가 추가되는 수산물은 아직 샘플을 가지고 있지 않다.영업팀은 새로운 생선이 도착하는 대로 가능한 즉시 훈련 데이터를 제공하겠다고 약속했다. 하지만 어느 생선이 먼저 올지,..
새벽에 공부했던 로지스틱 회귀에 대한 실습을 진행해볼 것이다. 잘 이해했는지 확인해볼 수 있는 좋은 시간이다. 로지스틱 회귀 실습해보기 시그모이드 함수 출력은 0에서 1까지만 변한다. 두 번째 샘플을 제외하고 모두 도무리 예측했다. 예측 확률은 predict_proba() 메서드에서 제공한다. 이 z값을 시그모이드 함수에 통과시키면 확률을 얻을 수 있다. 파이썬의 사이파이 라이브러리에도 시그모이드 함수가 있다. 바로 expit()이다. np.exp() 함수ㄷ를 이용해 분소 계산을 하는 것보다 훨씬 편리하고 안전하다. decisions 배열의 값을 확률로 변환해보자. 이진 분류를 위해 2개의 생선 샘플을 골라냈고 이를 이용해 로지스틱 회귀 모델을 훈련했다. 이진 분류일 경우..
지난번에 풀었던 문제는 오늘의 공부로써 끝이 났다. 이제 다음 STEP부터는 최상위 수학과 에이급 수학 모두 백지 상태의 문제집이다. 내일부터는 오답노트가 아닌 실제로 푼 문제를 함께 올리는 학습일지를 쓰려고 한다. 오늘은 새벽에 수학 공부를 하지 않고 아침에 해보았다. 그리고 앞으로는 수학 문제집에 바로 답을 쓰며 문제를 풀지 않고 따로 수학노트에 쓰기로 했다. 이렇게 하니 문제를 풀 때 답이 보여서 오히려 틀린 답을 계속해서 풀게 되는 것 같았다. 그리고 수학을 잘 못하니 한번 풀기 보다 여러 번 반복해서 공부하는 것이 더 좋은 학습법일 것 같다. 그럼 오늘 공부한 일지를 올려본다. 최상위 수학 STEP 1 틀린 문제 다시 풀기 4번과 5번 문제는 많이 어려웠다. 특히 4번을 풀기 위해서는 절대값의 ..
이제 새로운 단원 학습을 시작해 본다. 로지스틱 회귀 모델은 지난번 수업 시간에 공부했던 내용이기도 하지만 아직 기초가 부족하니 이 학습을 통해 많은 것을 배울 수 있을 것 같다. 학습 목표로지스틱 회귀 알고리즘을 배우고 이진 분류 문제에서 클래스 확률을 예측하기 시작하기 전에혼공머신은 이제 럭키 백에 포함된 생선이 무엇인지 확률을 구하는 문제를 해결해야 한다. 머신러닝으로 럭키백의 생선이 어떤 타깃에 속하는지 확률을 구할 수 있을까? 럭키백의 확률김팀장은 혼공머신에게 럭키백에 들어갈 수 있는 생선은 7개라고 알려주었다. 이벤트를 잘 마치려면 럭키백에 들어간 생선의 크기, 무게 등이 주어졌을 때 7개 생선에 대한 확률을 출력해야 한다. 이번에는 길이, 높이, 두께 외에도 대각선 길이와 무게도..
이제 특성 공학에 대해서 공부했던 내용을 스스로 실습하며 공부해보는 시간이다. 그래프도 직접 만들어보는 이 시간이 정말 즐겁다. 다중 회귀 실습해보기 이제 특성을 줄여야 한다. 그래프에서 계속 오류가 떠서 한참의 시간이 걸렸다. 그리고 새로운 사실을 알게 되었다. alpha_list와 train_score의 길이가 같아야 한다는 것을.. 그리고 리스트의 for문을 한번 실행시킬 때마다 길이가 6씩 늘어가고 있었다. 코드를 다시 실행시키니 이제 이 문제가 사라졌다. 경고 메시지가 뜨지만 특별히 문제될 것은 없다고 한다. 사이킷런의 라쏘 모델은 최적의 개수를 찾기 위해 반복적인 계산을 수행하는데, 지정한 반복 횟수가 부족할 때 이런 경고가 발생한다. 이 반복..