관리 메뉴

클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지

Numpy 6 - 집계함수 & 마스킹 연산 본문

인공지능/Numpy & Pandas

Numpy 6 - 집계함수 & 마스킹 연산

huenuri 2024. 7. 31. 14:55

마지막 단원은 집계함수와 마스킹 연산에 관한 내용이다. 통계를 내는 방법을 설명하는 것 같다. 사설은 생략하고 바로 본 학습에 들어가 본다~ 학습을 마치고 미션 문제도 하나 있는데 그것도 풀어볼 예정이다.


 

 

 

 

 

이론 - 집계함수 & 마스킹 연산

 

대용량 데이터에 진입했을 때 첫 단계는 궁금한 데이터에 대해 요약 통계를 계산해 보는 것이다. 가장 기본적인 요약 통계를 확인하는 방법을 numpy에서 제공한다.
min은 가장 작은 값이고, max는 가장 큰 값이다. mean은 평균값을 말한다. 표준편차를 구할 수도 있는데 이것은 np.std(x)라고 쓰면 된다.

 

 

 

 

sum은 축을 통해서도 계산할 수 있다. y축 연산은 열이 각각 계산되어 [4, 6, 8, 10]이 된다. x축 연산은 행이 각각 계산되어 [6, 22]가 된다. 이 부분이 꼭 혼돈된다.

 

 

 

 

 

x < 3일때 3보다 작은 것은 true로 작지 않은 것은 false로 값이 나온다. 하지만 인덱스에 조건을 넣게 되면 true인 값이 출력된다.


 

 

 

 

퀴즈 6 - 집계함수 & 마스킹 연산

 

 


 

 

 

 

실습 9 - 집계함수 & 마스킹 연산

 

 


 

 

 

문제 풀기

 

 

 

5번과 6번 문제는 그동안 정말 어려웠는데 혼자서 잘 풀었다. 그리고 8번은 잘 몰라서 참고 코드를 살펴보았다. matrix 안에 조건을 넣는 것이다.

 

 


 

 

 

 

미션 - 양치기 소년의 거짓말 횟수 구하기!

 

 

거짓말을 한 횟수를 찾아야 하니 이러한 개념은 무엇을 사용해야 하는지 알아야 한다.


 

 

 

1. 문제 풀기

 

 

처음에는 이름을 잘못 써서 오류가 나왔다.

 

 

 

이번에는 이름은 맞게 썼지만 인덱스의 값만 출력이 되어 0만 나왔다.


 

 

 

2. 다시 풀어보기

 

 

 

 

다시 풀었지만 오답이 나왔다. 이 코드는 sum으로 값을 더한 건데 이렇게 하니 1인 경우에 더해져서 진실을 한 횟수가 나왔다. 그러면 전체 값에서 이걸 빼야 할 것 같다.


 

 

 

 

3. 코드 수정하기

 

 

 


 

 

 

 

단원 학습 정리

 


 

 

 

 

 

학습을 마치고

이렇게 해서 1주 차 학습을 모두 마쳤다. numpy에 대해서 이제 어느 정도는 잘 이해할 수 있게 되었다. 미션 문제를 내가 풀었다는 것만으로도 정말 기뻤다. 이제 조금 쉬었다가 아침 공부를 시작해 볼 것이다.

오늘은 Numpy & Pandas 과목에 집중하려고 한다. 어제 공부했던 디버깅 입문도 할 수 있으면 다 마쳐보고 싶다. 다음 2주차에서는 Pandas에 대해서 공부해 볼 것이다. 나도 이제 본격적으로 데이터의 세계에 진입하게 된 것 같다.


데이터 하면 무척 딱딱하고 지루할 거라 생각했는데 전혀 아니었다. 우리 삶의 모든 것이 데이터로 이루어져 있다. 인공지능도 빅데이터를 기반으로 만들어졌고, 데이터가 없으면 우리가 사는 세상도 아무것도 아닌 것이 된다. 열심히 배워서 인공지능 분야에서 전문가가 되고 싶다.