Note
데이터 시각화 - Heat map, Histogram (5) 본문
728x90
1. Heat map
변수 간의 상관관계를 보여주기에 적합한 차트이다.
여기서는 60세 이하 나이랑 참가 인원 성별 사이의 상관관계를 보기로 한다.
라이브러리를 임포트하고 데이터 파일을 불러온다.
60세 이하를 가진 참가자의 데이터를 추출하는 모습.
groupby를 통해 나이와 성별로 그룹핑을 했고 ubstack을 통해서 데이터 프레임 형태로 만들었다.
subplots()에선 두 개의 값을 받을 수 있는데 figure 와 axes 값을 받을 수 있다.
여기서 변수명은 상관없다. 순서가 중요하다
fig란 figure로써 - 전체 subplot을 말한다. ex) 서브플랏안에 몇 개의 그래프가 있던지 상관없이 그걸 담는 하나. 전체 사이즈를 말한다.
ax는 axe로써 - 전체 중 낱낱개를 말한다 ex) 서브플롯 안에 2개(a1, a2)의 그래프가 있다면 a1, a2로 말한다.
그래프를 출력하면 이러한 모습이고 색깔이 어두울수록 인원수가 적은 것이다.
2. Histogram
히스토그램도 마찬가지로 라이브러리 임포트와 데이터 불러오기로 시작한다.
(1) 나이별 참가자 비율 분포 구하기 : 씨본의 displot
(2) 나이별 참가자 실제 수 그리기 : 씨본의 countplot
(3) 카운트가 높은 연령 기준으로 실제 수 그리기 : 씨본의 countplot 응용
'Machine Learning > Data Visualization' 카테고리의 다른 글
데이터 시각화 - Box plot, Geo chart with Folium (6) (0) | 2021.05.03 |
---|---|
데이터 시각화 - Scatter chart, Bubble chart (4) (0) | 2021.05.03 |
데이터 시각화 - Pie 차트, Line 차트 (3) (0) | 2021.05.02 |
데이터 시각화 - Dual Axis, 파레토 차트 (2) (0) | 2021.04.30 |
데이터 시각화 - column차트 (1) (0) | 2021.04.30 |
Comments