일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 정보처리기사실기
- 머신러닝
- 딥러닝
- CSS
- 파이썬
- 자바 실습
- 컴퓨터구조
- 디버깅
- 자바스크립트심화
- 중학수학
- 중학1-1
- SQL
- 데이터베이스
- 순환신경망
- 컴퓨터비전
- 자바
- html/css
- 연습문제
- 상속
- 데이터분석
- 혼공머신
- c언어
- rnn
- 자바스크립트
- 개발일기
- 정보처리기사필기
- JSP/Servlet
- ChatGPT
- JDBC
- JSP
- Today
- Total
목록인공지능 (418)
클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지
조금 전에 pandas로 데이터를 불러오고 저장하며 원하는 데이터를 출력하는 실습을 진행해 보았다. 이번에는 데이터를 변환하는 방법에 대해서 학습해 보기로 하자.바로 이어서 학습을 진행해본다. 데이터의 목적에 따라 사용하려면 변환 작업이 꼭 필요할 것이다. 이론 3 - 데이터 변환하기 1 데이터 타입 변환이란 데이터의 자료형을 변환하는 것이다. 입장객의 평균을 구할 때 연산이 필요하지만, 텍스트 타입으로 되어 있어 연산 값이 제대로 나오지 않는다. 올바른 계산을 위해 텍스트를 정수형 타입으로 바꾸어주어야 한다. df에 어른 타입의 컬럼을 astype의 int로 변환한다. 그런 다음 어른 컬럼에 저장하면 df의 타입이 int로 변환된 것을 확인할 수 있다. 만약 메서드들이 원본 데이터를 ..
난 뭐든 한번 해보면 계속하게 되는데 시작하기 전까지가 가장 어려운 것 같다. 오늘은 가능하면 집중해서 드려볼 생각이다.이제 2주차 수업은 Pandas에 관한 내용이다. 조금 전에 아침을 먹으며 이론 강의 2개를 들어보았다. 데이터를 분석할 때 많이 사용하는 기능이었다. 그럼 바로 학습을 시작해 보자! 이론 1 - Pandas 라이브러리 소개 Pandas란 무엇인가?데이터의 구조를 바꾸거나 이어 붙이는 등 엑셀의 파이썬 버전이라고 생각할 수 있다. 엑셀이 있는데 왜 굳이 코드를 짜며 pandas를 사용해야 할까? 몇십만 개, 몇 백만 개가 저장되어 있는 파일을 엑셀로 열면 일부 데이터가 손실되거나 로딩에 많은 시간이 걸린다. pandas 라이브러리를 사용하면 데이터 손실 없이 빠르게 처리할 ..
마지막 단원은 집계함수와 마스킹 연산에 관한 내용이다. 통계를 내는 방법을 설명하는 것 같다. 사설은 생략하고 바로 본 학습에 들어가 본다~ 학습을 마치고 미션 문제도 하나 있는데 그것도 풀어볼 예정이다. 이론 - 집계함수 & 마스킹 연산 대용량 데이터에 진입했을 때 첫 단계는 궁금한 데이터에 대해 요약 통계를 계산해 보는 것이다. 가장 기본적인 요약 통계를 확인하는 방법을 numpy에서 제공한다.min은 가장 작은 값이고, max는 가장 큰 값이다. mean은 평균값을 말한다. 표준편차를 구할 수도 있는데 이것은 np.std(x)라고 쓰면 된다. sum은 축을 통해서도 계산할 수 있다. y축 연산은 열이 각각 계산되어 [4, 6, 8, 10]이 된다. x축 연산은 행이 각각 계산되어 [6,..
Numpy에서도 브로드캐스팅을 쓴다는 게 참 재미있는 표현인 것 같다. 브로드캐스팅은 오페라나 공연 등에서 콜을 받았을 때 쓰는 용어인 줄 알았는데 네트워크에서도 잘 사용하는 용어였다. 브로드캐스팅은 송신 호스트가 전송한 데이터가 네트워크에 연결된 모든 호스트에 전송되는 방식을 의미한다는 것이다. 즉 한 번에 캐스팅을 하는 것을 브로드캐스팅이라고 하나보다. 이론 5 - 브로드 캐스팅 브로드캐스팅은 shape이 다른 array끼리도 연산이 가능한 것을 말한다. 이 5라는 데이터(단일행렬)는 3x3 행렬이 마치 더해진 것처럼 연산하는 것이다. 이 예제에서 보면 [1 2 3] 행렬이 아래로도 내려가 연산이 되는 것을 볼 수 있다. 잡아늘려서 이렇게 1차원이 2차원으로도 되었다. 1차원 행렬..
이번에 학습할 단원은 Numpy 연산이다. 이것도 배열이니 연산을 할 수 있나 보다. Numpy가 처음에는 무척 어렵게 느껴졌는데 해보니 별거 아니었다. 배열은 조금 알고 있으면 충분히 이해할 수 있는 부분이었다.그럼 바로 다음 학습을 진행해보자! 이론 4 - Numpy 연산 파이썬에서 몇 가지 연산은 느리게 진행된다. 이 예시에서 보면 value 값을 받아서 빈 데이터를 받은 array의 길이만큼 만든다. 반복문을 돌면서 기존에 가진 데이터에 5를 추가해서 쓰고 그것을 돌려주는 함수이다.values는 1~10까지인 size가 5인 ranint라고 하면, 여기에 5개를 붙여서 이 함수를 출력한다. 1~100까지 있는 1천만 개의 데이터를 수행한다면, 큰 array에 대해서는 수행 시간이 느리..
어제 잠이 오지 않아 일어나서 한 단원 학습을 하고 2시 반쯤 잠을 청했다. 일요일이니 자고 싶은 만큼 실컷 자자 하고 알람을 껐다. 신기하게도 5시 40분이 조금 넘어서 일어났다. 근데 내가 무슨 꿈을 꾸었는지 언뜻 생각이 났는데, 그게 바로 자기 전에 공부했던 배열이었다. 프로그래밍으로 무슨 추적을 하면서 도둑을 잡고 누군가에게 쫓기기도 하고 아무튼 이상했지만 재미있는 꿈이었다. 일어나자마자 잊어버릴까 싶어서 기록해보기로 했다. 언젠가 책에서 읽은 기억이 나는데, 자신이 어떤 것에 몰입하고 있는지 알아보는 여부는 거기에 관한 꿈을 꾸는가라고 했다. 그러면 한 50% 이상 몰입한 상태라는 것이다. 아마도 난 지금 프로그래밍에 완전 몰입하고 있는 것 같다. 하루종일 이 생각만 하고 있는 게 분명하다.그래..
배열의 기초 이 단원을 조금 학습하다가 졸려서 잠을 자려고 12시 반쯤 침대에 누웠다. 근데 아무리 잠을 자려고 해도 잠이 오지 않아서 1시 20분쯤 일어나 공부를 시작해 보기로 했다. 아마 어제 낮잠을 많이 자서 잠이 오지 않은 것 같다.잠이 오지 않으면 공부를 하면 되니 오히려 더 잘되었다. 조금 전에 앞부분만 조금 들었던 수업을 다시 들으며 학습을 진행해보겠다. 이 단원에서는 배열이 numpy에서 어떻게 사용되는지 배열의 기초적인 내용을 다루게 될 것 같다. 자바나 파이썬과 어떤 차이가 있는지 궁금해진다. 바로 학습에 들어가기로 하자! 이론 2 - 배열의 기초 10 이하의 수에 size=(3, 4)를 넣게 되면 3x4 행렬이 생긴다. 이때 우리가 확인할 수 있는 속성은 크게 4가지가 있다.nd..
조금 전에 요가를 했는데 정말 좋았다. 25분이라는 시간이 금방 지나갔다. 요가를 할 때면 내 몸을 천천히 또는 빠르게 움직이며 세포 하나하나를 만나게 되는 것 같다. 평소에는 잘 느끼지 못했던 감각들이 되살아나는 것을 느낀다. 앞으로는 매일 30분씩 요가를 꼭 해볼 생각이다. 그러다가 마음이 내키면 맨몸 운동을 해도 좋을 것 같다. 개발자는 주로 앉아서 작업을 하는 경우가 많아 자신의 몸이 굳어가는 것을 잘 감지하지 못할 때가 많다. 그러니까 평소에 몸을 잘 움직이며 몸도 마음도 유연해야 좋은 프로그램을 만들 수 있다고 생각한다. 우리의 뇌는 신체의 움직임에 매우 밀접한 연관이 있기에 어떤 것도 따로 떼어서 생각할 수 없다.이제 Numpy와 Pandas 학습을 시작해보려고 한다. 다른 과목들은 모두 O..