일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- 중학수학
- 머신러닝
- 언리얼학습
- 이수증
- 정보처리기사필기
- html/css
- 데이터입출력구현
- pandas
- 코딩테스트
- 정보처리기사실기
- numpy/pandas
- 선형회귀모델
- 자바
- 핵심프로젝트
- C++
- 자바 실습
- 데이터베이스
- 텍스트마이닝
- 데이터시각화
- JSP/Servlet
- 언리얼프로젝트
- 데이터분석
- 요구사항확인
- c언어
- Orange
- 선형분류모델
- 파이썬
- 딥러닝
- 자연수의성질
- 디버깅
- Today
- Total
목록데이터분석 (26)
클라이언트/ 서버/ 엔지니어 " 게임 개발자"를 향한 매일의 공부일지
마지막 단원 학습이 남아있다. 이번에는 이름도 생소한 매플로립으로 그래프를 설정하는 방법을 배워볼 것이다. 이론 6 - matplotlib 실습 6 - 차트 설정하기 이 코드를 실행하면 다음과 같은 그래프가 나타난다. 지시사항에는 없지만 내가 원하는 모습대로 그래프를 약간 변경해보았다. 수업 시간에 배운 내용이라 별로 어렵지 않게 해결했다. 더 마음에 드는 것 같다. 학습을 마치고이렇게 3주차 학습을 거의 다 마쳤다. 이 단원은 무척 재미있었다. 이제 다음 포스트에서 미션 문제를 풀어보려고 한다. 30분 안에 다 풀 수 있을 것 같다.그러면 잠시 쉬는 시간을 가져야지.
조금 전에 너무 졸려서 10분 정도 잠을 자고 일어났더니 머릿속이 개운해졌다. 낮잠은 10~20분만으로도 충분한 것 같다. 이제 다시 남은 2시간 동안 열심히 공부를 해볼 것이다. 1시간 동안 3주차 학습을 다 마치고 남은 1시간은 4주차 학습을 시작해보려고 한다. 이론 5 - 집합 연산 이 연산은 둘 중 하나만 만족하는 조건이다. 즉 교집합을 제외한 값이다. 실습 5 - 교집합과 합집합 구하기 근데 이런 오류가 떴다. 그 이유는 변수 옆에 _set을 붙이기 않았기 때문이다. 그냥 연산을 하니 붙일 필요가 없다고 생각했는데 큰 차이가 있었다._set이라는 접미사는 변수의 데이터 타입을 명확히 나타내기 위해 붙이는 것이다. 이 경우, dark_knight_set은..
집합은 내가 참 좋아했던 과목 중에 하나이다. 근데 언제부터인가 이 교육 과정이 중학 과정에서 사라졌는데 왜 없앴는지 지금도 이해가 되지 않는다. 교육 과정이 바뀔 때마다 이번에는 넣으려나 했는데 여전히 집합은 고등학교 과정에만 존재한다. 파이썬에서는 이런 집합 함수도 존재하는데 참 신기했다. 이론 4 - 집합 리스트는 순서가 중요하기에 set[3, 2, 1]은 다른 집합이다. 중복이 있어도 같은 집합으로 취급한다. update는 각각의 집합 안에 이 원소가 추가된다. remove와 discord의 차이점은 무엇일까? remove는 반드시 존재해야만 식이 성립하고 그렇지 않으면 오류 메시지를 띄운다. 하지만 discord는 존재하지 않으면 그냥 무시한다. 실습 4 - 데이터..
딕셔너리와 비슷한 JSON에 대해서 학습해보기로 하자. 이론 3 - JSONJSON은 어떤 형식이다. 웹에서 동작하는 도구는 대부분 자바스크립트이다. 키가 파일의 용량을 더 차지하기에 좀더 큰 편이다. 실습 3 - JSON 데이터 다루기 main JSON 수정 전후의 JSON 파일이 이렇게 들어있다. 이런 식으로 형 변환이 필요하다. JSON은 한 줄이 아닌 한번에 불러온다. 이 코드를 이렇게 한 줄로 줄여쓸 수도 있다. 완성된 코드 전체 흐름create_dict(src): 먼저, src로 지정된 JSON 파일을 읽고 이를 파이썬의 딕셔너리로 변환한다.src = 'netflix.json'이므로, netflix.json 파일이 있어야 합니다. 이 파일은 JSON 형..
이어서 딕셔너리에 관한 내용을 더 학습해보기로 하자. 이론 2 - 딕셔너리의 키키는 약간의 제한이 있다. 실습 2 - 데이터 순회하기 : items() 이 코드를 한 줄로 줄일 수도 있다. 이 딕셔너리는 사용자가 시청한 작품의 ID를 저장한 리스트를 값으로 가진다. 키는 사용자 ID이고, 값은 사용자가 시청한 작품들의 ID 리스트이다. user_to_titles.items(): user_to_titles 딕셔너리의 **키(사용자 ID)**와 **값(시청한 작품 리스트)**를 순차적으로 가져온다.len(titles): 각 사용자의 시청한 작품 리스트의 길이를 계산하여, 시청한 작품 수를 구한다.user_to_num_titles[user] = len..
이제 3주차 학습을 시작해본다. 아침과 점심시간을 이용해 2주차 학습을 마쳤고 이제 3주에도 6개의 강의와 실습이 준비되어 있다.바로 이어서 공부를 진행해볼 것이다. 이론 1 - 딕셔너리 리스트는 앞에서부터 확인하는 순차 리스트이기 때문이다. 실습 1 - 데이터 빠르게 탐색하기 : 딕셔너리 텍스트 파일은 이렇게 작성되었다. 이제 문제를 풀어보자. 학습을 마치고딕셔너리로 키와 value값을 가져오는 문제를 풀었다. 코드는 혼자서 작성하기는 아직 어렵지만 지금은 적어도 코드는 읽고 분석할 수 있게 되었다.더 공부하다 보면 언젠가는 혼자서도 코드를 암기해서 작성할 수 있는 수준이 되겠지!
이제 데이터를 분석하는데 필요한 함수에 대한 학습을 마쳤고 그래프를 다루는 단원만이 남아있다. 3주차에서 딕셔너리에 대해서 배우기는 하지만 2주차의 마지막 개념 학습이라 홀가분한 기분이다.여기까지만 하고 아침 공부를 마치려고 한다. 이론 5 - 그래프 다루기 이 부분은 다른 과목을 통해 더 자세한 것들을 배웠다. 이론 수업은 매우 간단하게 끝났다. 이제 실습 문제만 하나 풀어보면 될 것 같다. 실습 5 - 차트 그리기 : matplotlib 이 예제는 설명만 들어면 되고 따로 작성하는 코드는 없었다. 난 이미 데이터 시각화 수업을 들으면 많은 공부를 했기에 이 내용이 하나도 어렵지 않았다. 마치 친숙한 느낌이었다.이렇게 그래프가 그려진다.가로축에는 년도가 세로축에는 온도 그래프가 잘 나타나고..
이번에는 데이터를 정렬하는 방법에 대해서 학습해보겠다. 이론 4 - 데이터 정렬하기 절대값 순서대로 정렬하고 싶을 때 abs를 사용한다. reverse는 순서를 뒤짚어주는 함수이다. 실습 4 - 데이터 정렬하기 : sorted() 튜플로 키와 value값을 넣는 것은 조금 어려운 것 같다. 아직 pair[1]이 무엇을 의미하는지 잘 이해가 되지 않았다. 이 코드를 분석해보면 다음과 같다. pairs 리스트각각 단어와 그 단어의 빈도수를 나타내는 튜플((단어, 빈도수))로 구성되어 있다. 예를 들어, 'time'이라는 단어는 8번 등장했고, 'turbo'는 1번 등장했다는 의미이다 2. get_freq 함수 이 함수는 (단어, 빈도수)로 이루어진 튜플을 받아서 해당 튜플의 두 ..
세번째 학습 내용도 별로 어렵지 않은 것 같다. 처음에는 리스트가 얼마나 어려웠는지 모른다. 이 리스트 때문에 파이썬에 다른 언어에 비해 훨씬 더 어렵다는 생각을 하게 되었고, 데이터 분석도 굉장히 지루하고 어렵다고 생각했다.하지만 공부해보니 파이썬은 정말 매력적인 언어였다. 요즘은 자바를 잘 쓰지 않는데 파이썬에 대한 학습을 어느 정도 진행한 다음에 다시 본 언어인 자바에 집중하려고 한다.C 언어도 다시 공부해보고 싶다~ 이론 3 - 리스트로 리스트 만들기 앞의 예시를 좀더 간결하게 만들 수 있다. 이러한 방식을 list comprehension이라고 한다. 이렇게 바꾸어 쓸 수 있다. 이 예시에서는 5, 7이 출력된다. 실습 3 - 한 줄로 코드 짧게 ..
두번째 학습은 데이터 구조에 대해서 배우게 된다. 먼저 이론 수업부터 들으며 학습해보기로 하자. 이론 2 - 데이터 구조 다루기 리스트는 변경이 가능하지만 튜플은 변경할 수 없다. 튜플을 변경하는 유일한 방법은 hello에 새로운 값을 넣는 것이다. 실습 2 - 데이터 형태 변환하기 여기에도 이렇게 텍스트 파일로 이러한 글자들이 96번까지 들어있다. 이제 문제를 풀어보기로 하자. strip()은 문자 앞뒤의 모든 공백 문제들을 사라지게 할 수 있다. 실행해보면 이렇게 공백과 \n이 사라졌다. 학습을 마치고리스트와 튜플을 사용하여 특정 문자를 수정하거나 제거하는 방법에 대해 배울 수 있었다. 이 내용도 파이썬 공부할 때 충분히 배웠던 내용이라 그냥 복습한다는 느낌으..