관리 메뉴

클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지

넷플릭스 시청 데이터로 알아보는 데이터형 변환 5 - 집합 연산 본문

인공지능/파이썬 데이터 분석

넷플릭스 시청 데이터로 알아보는 데이터형 변환 5 - 집합 연산

huenuri 2024. 9. 12. 16:16

조금 전에 너무 졸려서 10분 정도 잠을 자고 일어났더니 머릿속이 개운해졌다. 낮잠은 10~20분만으로도 충분한 것 같다. 이제 다시 남은 2시간 동안 열심히 공부를 해볼 것이다. 1시간 동안 3주차 학습을 다 마치고 남은 1시간은 4주차 학습을 시작해보려고 한다.


 

 

 

이론 5 - 집합 연산

 

 

 

 

 

 

 

 

 

이 연산은 둘 중 하나만 만족하는 조건이다. 즉 교집합을 제외한 값이다.

 

 

 

 

 

 

 

 


 

 

 

 

 

실습 5 - 교집합과 합집합 구하기


 

 

 

근데 이런 오류가 떴다. 그 이유는 변수 옆에 _set을 붙이기 않았기 때문이다. 그냥 연산을 하니 붙일 필요가 없다고 생각했는데 큰 차이가 있었다.

_set이라는 접미사는 변수의 데이터 타입을 명확히 나타내기 위해 붙이는 것이다. 이 경우, dark_knight_set은 집합(set) 타입을 나타내며, 다른 데이터 구조(예: 리스트나 튜플)와 구별할 수 있도록 네이밍에 반영한 것이다.

 

왜 _set을 붙이는가?

 

  1. 가독성: 변수 이름에 **_set**을 붙임으로써, 이 변수가 집합(set) 타입임을 한눈에 알 수 있다. 코드를 읽는 사람은 이 변수를 사용할 때 중복되지 않는 값들을 다루고 있다는 것을 쉽게 파악할 수 있다.
    • 리스트는 중복을 허용하고 순서가 있으며, 집합은 중복을 허용하지 않고 순서가 없는 특성을 가진다.
  2. 데이터 구조 구별: 동일한 이름을 가진 변수를 여러 데이터 구조로 사용해야 할 때, 변수 이름에 접미사를 붙이면 데이터 구조의 차이를 명확히 구분할 수 있다. 예를 들어, 리스트(dark_knight)와 집합(dark_knight_set)은 둘 다 영화 시청자의 데이터를 다루지만, 각각의 특징에 따라 다른 방식으로 사용된다.
  3. 의도 명확화: 집합(set)은 중복을 제거하고 수학적 집합 연산(교집합, 합집합, 차집합)을 수행할 수 있는 자료형이다. 변수 이름에 _set을 붙여서, 개발자는 이 변수를 통해 집합 연산을 할 계획이라는 의도를 명확히 전달할 수 있다.

 

 

 

이제 잘 출력이 되었다. 프로그래밍은 이렇게 규칙이 있다. 이 규칙을 알고 잘 사용하는 것이 가장 중요하다.

 

 


 

 

학습을 마치고

집합 연산도 공부를 마쳤다. 이제 마지막 단원은 그래프를 그리는 건데 무척 재미있을 것 같다. 데이터 시각화를 배운 후에 이 분야에 관심이 생기며 신기했다.

바로 이어서 학습을 진행해볼 것이다.