관리 메뉴

클라이언트/ 서버/ 엔지니어 "게임 개발자"를 향한 매일의 공부일지

데이터 시각화 14 - 시본을 활용한 차트 그리기 본문

인공지능/Numpy & Pandas

데이터 시각화 14 - 시본을 활용한 차트 그리기

huenuri 2024. 9. 12. 11:13

이번에는 Seaborn을 활용하여 다양한 모양의 차트를 그려보기로 하자. 이것만 하면 데이터 시각화 수업은 끝난다.


 

 

 

 

시본으로 차트 그려보기

 

시본 홈페이지에 들어가면 다양한 모양의 차트를 보여준다. 여기서 필요한 것들을 가져다 쓸 수도 있다.

 

 

 

 

 

여기 안에 들어가면 예시 코드도 있는데 이걸 붙여 넣어 사용할 수도 있다.


 

 

 

 

각 구간을 분할해서 보려면 hue에 이 정보를 넣어준다.

 


 

 

 

hue를 사용하며 데이터가 한번 더 세분화된다. 하지만 남성 여성이 겹쳐져서 내용을 구분하기가 어렵다. 이럴 때 사용하는 것이 stack인데, 데이터가 차곡차곡 쌓이듯이 볼 수 있다.


 

 


 

 

이렇게 구분이 잘 되어 볼 수 있는 것이 시본의 큰 장점이다.


 

 

 

 

 

이 차트를 만들어볼 것이다.

 

 

 


 

 

 

 

나이가 많을수록 근속연수가 많다는 걸 볼 수 있다. 여기서 두 가지 속성을 더 추가해보자.


 

 

 

 

직책별로 색깔이 다르게 표시되고 있다. 나이가 높아질수록 직책도 올라간다는 확인하게 된다. 이제 연봉 정보에 따른 비교를 해보자.


 

 

 

 

 

나이가 높아져 직책이 올라갈수록 연봉도 함께 올라간다.


 

 

 


 

 

 

 

이런 그래프를 그려볼 것이다.

 

 

하지만 네모칸 안에 숫자는 보이지 않고 있는데 이건 최신 버전으로 했을 때 이런 현상이 발생한다고 한다. 버전을 변경해주면 된다.


 

 

 

 

 

설치한 후에는 주석 처리를 해주었고 커널을 restart 해야 한다. 그리고 처음부터 다시 실행해야 하니 시간도 많이 걸리고 좀 힘들었다. 

 

 

이제 잘 나오고 있다. 화려하게 다양한 정보를 표시하기에는 시본이 좋다고 한다. 박스 플롯은 이상치를 측정할 때 자주 사용하는 편이다.

 

 


 

 

 

학습을 마치고

여기까지 해서 데이터 시각화 단원이 끝났다. 벌써 11시가 넘었는데 남은 시간동안은 어제 진행했던 데이터 분석 2주차 수업을 들으면서 실습을 진행해보려고 한다.

엘리스로 수업을 들을 때보다 선생님의 수업을 통해 더 깊이있는 학습이 되어 정말 유익한 시간이었다. 수업을 현장에서 들을 때는 이런 식으로 학습하지 못한다. 난 손이 느려서 필기를 하지 못할 때가 많고, 이해도 잘 안되는 편이다.

하지만 온라인으로 다시 수업을 들으며 복습하면 예제들이 만들어지는 과정을 모두 기록해볼 수 있어서 좋은 것 같다.