일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 영어공부
- CSS
- 자바
- 파이썬라이브러리
- 머신러닝
- 중학1-1
- 코딩테스트
- 정보처리기사필기
- C++
- 딥러닝
- 데이터입출력구현
- 컴퓨터비전
- pandas
- 자바 실습
- 정보처리기사실기
- 중학수학
- 텍스트마이닝
- SQL
- 운영체제
- html/css
- JSP/Servlet
- numpy/pandas
- 데이터분석
- 데이터베이스
- 연습문제
- CNN
- 컴퓨터구조
- 혼공머신
- 파이썬
- 정수와유리수
- Today
- Total
목록전체 글 (1250)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
조금 전에 pandas로 데이터를 불러오고 저장하며 원하는 데이터를 출력하는 실습을 진행해보았다. 이번에는 데이터를 변환하는 방법에 대해서 학습해보기로 하자.바로 이어서 학습을 진행해본다. 데이터의 목적에 따라 사용하려면 변환 작업이 꼭 필요할 것이다. 이론 3 - 데이터 변환하기 1 데이터 타입 변환이란 데이터의 자료형을 변환하는 것이다. 입장객의 평균을 구할 때 연산이 필요하지만, 텍스트 타입으로 되어 있어 연산 값이 제대로 나오지 않는다. 올바른 계산을 위해 텍스트를 정수형 타입으로 바꾸어주어야 한다. df에 어른 타입의 컬럼을 astype의 int로 변환한다. 그런 다음 어른 컬럼에 저장하면 df의 타입이 int로 변환된 것을 확인할 수 있다. 만약 메서드들이 원본 데이터를 바꿔버..
난 뭐든 한번 해보면 계속 하게 되는데 시작하기 전까지가 가장 어려운 것 같다. 오늘은 가능하면 집중해서 드려볼 생각이다.이제 2주차 수업은 Pandas에 관한 내용이다. 조금 전에 아침을 먹으며 이론 강의 2개를 들어보았다. 데이터를 분석할 때 많이 사용하는 기능이었다. 그럼 바로 학습을 시작해보자! 이론 1 - Pandas 라이브러리 소개 Pandas란 무엇인가?데이터의 구조를 바꾸거나 이어붙이는 등 엑셀의 파이썬 버전이라고 생각할 수 있다. 엑셀이 있는데 왜 굳이 코드를 짜며 pandas를 사용해야 할까? 몇십만개, 몇 백만개가 저장되어 있는 파일을 엑셀로 열면 일부 데이터가 손실되거나 로딩에 많은 시간이 걸린다. pandas 라이브러리를 사용하면 데이터 손실 없이 빠르게 처리할 수 있다. ..
마지막 단원은 집계함수와 마스킹 연산에 관한 내용이다. 통계를 내는 방법을 설명하는 것 같다.사설은 생략하고 바로 본 학습에 들어가본다~ 학습을 마치고 미션 문제도 하나 있는데 그것도 풀어볼 예정이다. 이론 - 집계함수 & 마스킹 연산 대용량 데이터에 진입했을 때 첫 단계는 궁금한 데이터에 대해 요약 통계를 계산해보는 것이다. 가장 기본적인 요약 통계를 확인하는 방법을 numpy에서 제공한다.min은 가장 작은 값이고, max는 가장 큰 값이다. mean은 평균값을 말한다. 표준편차를 구할 수도 있는데 이것은 np.std(x)라고 쓰면 된다. sum은 축을 통해서도 계산할 수 있다. y축 연산은 열이 각각 계산되어 [4, 6, 8, 10]이 된다. x축 연산은 행이 각각 계산되어 [6, 22]가 ..
Numpy에서도 브로드캐스팅을 쓴다는 게 참 재미있는 표현인 것 같다. 브로드캐스팅은 오페라나 공연 등에서 콜을 받았을 때 쓰는 용어인 줄 알았는데 네트워트에서도 잘 사용하는 용어였다. 브로드캐스팅은 송신 호스트가 전송한 데이터가 네트워크에 연결된 모든 호스트에 전송되는 방식을 의미한다는 것이다. 즉 한번에 캐스팅을 하는 것을 브로드캐스팅이라고 하나보다. 이론 5 - 브로드 캐스팅 브로드캐스팅은 shape이 다른 array끼리도 연산이 가능한 것을 말한다. 이 5라는 데이터(단일행렬)는 3x3 행렬이 마치 더해진 것처럼 연산하는 것이다. 이 예제에서 보면 [1 2 3] 행렬이 아래로도 내려가 연산이 되는 것을 볼 수 있다. 잡아늘려서 이렇게 1차원이 2차원으로도 되었다. 1차원 행렬이..
이번에 학습할 단원은 Numpy 연산이다. 이것도 배열이니 연산을 할 수 있나보다. Numpy가 처음에는 무척 어렵게 느껴졌는데 해보니 별거 아니었다. 배열은 조금 알고 있으면 충분히 이해할 수 있는 부분이었다.그럼 바로 다음 학습을 진행해보자! 이론 4 - Numpy 연산 파이썬에서 몇 가지 연산은 느리게 진행된다. 이 예시에서 보면 value 값을 받아서 빈 데이터를 받은 array의 길이만큼 만든다. 반복문을 돌면서 기존에 가진 데이터에 5를 추가해서 쓰고 그것을 돌려주는 함수이다.values는 1~10까지인 size가 5인 ranint라고 하면, 여기에 5개를 붙여서 이 함수를 출력한다. 1~100까지 있는 1천만개의 데이터를 수행한다면, 큰 array에 대해서는 수행 시간이 느리다는 것을..
어제 잠이 오지 않아 일어나서 한 단원 학습을 하고 2시 반쯤 잠을 청했다. 일요일이니 자고 싶은만큼 실컷 자자 하고 알람을 껐다. 신기하게도 5시 40분이 조금 넘어서 일어났다. 근데 내가 무슨 꿈을 꾸었는지 언뜻 생각이 났는데, 그게 바로 자기 전에 공부했던 배열이었다. 프로그래밍으로 무슨 추척을 하면서 도둑을 잡고 누군가에게 쫓기기도 하고 아무튼 이상했지만 재미있는 꿈이었다. 일어나자마자 잊어버릴까 싶어서 기록해보기로 했다. 언젠가 책에서 읽은 기억이 나는데, 자신이 어떤 것에 몰입하고 있는지 알아보는 여부는 거기에 관한 꿈을 꾸는가라고 했다. 그러면 한 50% 이상 몰입한 상태라는 것이다. 아마도 난 지금 프로그래밍에 완전 몰입하고 있는 것 같다. 하루종일 이 생각만 하고 있는 게 분명하다.그래서..
배열의 기초 이 단원을 조금 학습하다가 졸려서 잠을 자려고 12시 반쯤 침대에 누웠다. 근데 아무리 잠을 자려고 해도 잠이 오지 않아서 1시 20분쯤 일어나 공부를 시작해보기로 했다. 아마 어제 낮잠을 많이 자서 잠이 오지 않은 것 같다.잠이 오지 않으면 공부를 하면 되니 오히려 더 잘되었다. 조금 전에 앞부분만 조금 들었던 수업을 다시 들으며 학습을 진행해보겠다.이 단원에서는 배열이 numpy에서 어떻게 사용되는지 배열의 기초적인 내용을 다루게 될 것 같다. 자바나 파이썬과 어떤 차이가 있는지 궁금해진다.바로 학습에 들어가기로 하자! 이론 2 - 배열의 기초 10이하의 수에 size=(3, 4)를 넣게 되면 3x4 행렬이 생긴다. 이때 우리가 확인할 수 있는 속성은 크게 4가지가 있다.ndim :..
조금 전에 요가를 했는데 정말 좋았다. 25분이라는 시간이 금방 지나갔다. 요가를 할 때면 내 몸을 천천히 또는 빠르게 움직이며 세포 하나하나를 만나게 되는 것 같다. 평소에는 잘 느끼지 못했던 감각들이 되살아나는 것을 느낀다. 앞으로는 매일 30분씩 요가를 꼭 해볼 생각이다. 그러다가 마음이 내키면 맨몸 운동을 해도 좋을 것 같다. 개발자는 주로 앉아서 작업을 하는 경우가 많아 자신의 몸이 굳어가는 것을 잘 감지하지 못할 때가 많다. 그러니까 평소에 몸을 잘 움직이며 몸도 마음도 유연해야 좋은 프로그램을 만들 수 있다고 생각한다. 우리의 뇌는 신체의 움직임에 매우 밀접한 연관이 있기에 어떤 것도 따로 떼어서 생각할 수 없다.이제 Numpy와 Pandas 학습을 시작해보려고 한다. 다른 과목들은 모두 O..
조금 늦은 점심을 먹고 오후 공부를 시작해본다. 아침에도 공부를 별로 하지 못했으니 오후에는 더욱 빠르게 학습을 마쳐야 한다. 하지만 정말 특별하고 소중한 시간을 보냈다. 아마도 영원히 오늘의 시간이 기억에 남을 것 같다.어제 4단원 첫번째 부분 강의를 들었으나 졸면서 들어서 그런지 하나도 머릿속에 남아있는 것이 없었다. 이제 학습일지를 쓰며 본격적으로 공부를 시작해본다! 학습 내용스토리지분산 데이터베이스데이터베이스 이중화 구성데이터베이스 암호화 학습 시간전날 밤 10시 반 ~ 11시 오후 2시 10분 ~ 2시 50분 오후 3시 ~ 3시 50분 1. 스토리지(Storage) 개념데이터를 보존하고 가능한 한 간편하게 액세스할 수 있도록 개발된 기술을 사용하여 정보를 보존하는 저장 장치구성1. DAS(..
아침을 먹으면서 강의를 듣고 개념 학습을 진행해보았다. 밥 먹는 시간도 아까운 정도로 오늘 공부할 것들이 정말 많다. 데이터 모델링 부부은 정말 많이 어려웠다. 한번 강의를 들어서는 잘 이해가 되지 않을 정도였다.그래도 공부한 내용을 정리하며 학습일지를 써본다.여기까지 공부하면 3단원을 마치게 된다. 4단원 하나 남았는데 이건 오늘 저녁에 진행해보려고 한다. 이 공부만 마치면 이제 데이터베이스를 이어서 학습해볼 것이다. 학습 내용데이터 모델링개체-관계(E-R) 모델논리적 데이터 모델링데이터베이스 정규화학습 시간아침 9시 ~ 11시 15분 1. 데이터 모델 개념현실 세계의 정보를 인간과 컴퓨터가 이해할 수 있도록 추상화하여 표현한 모델 데이터베이스 설계 단계/ 데이터 모델 절차설계 단계에는 ..