목록시각화 (3)
Note

1. Box plot 박스 플랏은 흔히 통계 수업시간에 많이 볼 법한 차트로 상자 수염 그림이라고도 한다. 평소와 같이 필요한 라이브러리를 임포트 해주고 데이터를 불러오면서 시작한다. 국적인 미국인 참가자들 데이터를 불러온다. 국적 안에서 성별을 분리해서 각각 새로운 변수로 저장한다. 차트의 크기를 정하고 스타일도 옵션으로 추가할 수 있다. 이처럼 박스 플랏을 그려 볼 수 있다. 박스 플랏은 최대값, 최솟값, 1분위수, 중위수, 3분위수, 이상치 유무를 보기 쉽게 나타낸 차트이다. 2. Geo chart with Folium 2017년 보스턴 마라톤 데이터를 지도 상에 찍어보는 것이 목표이다. 라이브러리 임포트와 데이터 파일을 불러온 후에 10K 부터 Pace 기록까지 만을 뽑아낸다. 이 전과 같이 시간..

1. Heat map 변수 간의 상관관계를 보여주기에 적합한 차트이다. 여기서는 60세 이하 나이랑 참가 인원 성별 사이의 상관관계를 보기로 한다. 라이브러리를 임포트하고 데이터 파일을 불러온다. 60세 이하를 가진 참가자의 데이터를 추출하는 모습. groupby를 통해 나이와 성별로 그룹핑을 했고 ubstack을 통해서 데이터 프레임 형태로 만들었다. subplots()에선 두 개의 값을 받을 수 있는데 figure 와 axes 값을 받을 수 있다. 여기서 변수명은 상관없다. 순서가 중요하다 fig란 figure로써 - 전체 subplot을 말한다. ex) 서브플랏안에 몇 개의 그래프가 있던지 상관없이 그걸 담는 하나. 전체 사이즈를 말한다. ax는 axe로써 - 전체 중 낱낱개를 말한다 ex) 서브플..

라이브러리 임포트 라이브러리 임포트와 데이터 파일을 불러온다. 18세 ~ 59세까지의 데이터만 불러와서 새로운 변수에 저장해준다. 프린트를 사용해 출력해보면 아래와 같은 사진으로 출력된다. 나이대별로 runner수가 얼마나 있는지 확인하기 위해 Age.value.counts()를 사용한 모습 그래프를 그리기 위해서는 x축과 y축이 필요하다. x축에 Age를 나열하고 y축에는 값들을 나열한다. x축을 나이로 나열하고 그에 해당하는 값을 그래프에 찍기 위해 숫자가 아닌 문자열 형태로 변환한 모습 y축에 값을 나열하고 비율그래프를 나타내기 위해서 ratio라는 새로운 변수를 만들어 준다. 비율로 바꾼 것을 누적데이터로 나타내어 최종적으로 100%를 만들어 주는 형식으로 바꾸어준 모습. 그래프를 그리기에 앞서 ..