Note
유튜브 댓글 워드 클라우드 본문
728x90
필요한 라이브러리를 임포트하고 앞에서 저장한 엑셀 파일을 불러온다.
데이터를 불러온 모습이다.
정규표현식을 통해서 알파벳을 제외하고 모든 문자를 제거한 모습이다.
워드 클라우드를 위해 필요 없는 칼럼을 제거하고 문자열 데이터로 변환한 모습이다.
워드 클라우드를 설치해준다.
원하는 이미지를 array의 형태로 불러온다.
불러온 이미지의 형태. 이미지는 원하는 것으로 바꿀 수 있다.
의미 없는 용어 stopword를 설정해준다. 즉, 워드 클라우드에서 제거하고 싶은 단어.
워드 클라우드를 실행하면 이러한 형태로 나오고 윈도우에 맞는 폰트를 설정해야 한다. 검색을 통해서 다른 폰트로 설정 가능하다.
이미지를 실행시키면 위에 있던 사진에 단어들이 나열된 모습을 볼 수 있다.
'Deep Learning > NLP' 카테고리의 다른 글
불용어 (Stopword) (0) | 2021.07.27 |
---|---|
정제와 정규화 (0) | 2021.07.27 |
토큰화(Tokenization) (0) | 2021.07.25 |
Bag of Words(BOW) (0) | 2021.07.16 |
텍스트 분석 (0) | 2021.07.16 |
Comments