Note
케라스의 texts_to_matrix() 본문
728x90
import numpy as np
from tensorflow.keras.preprocessing.text import Tokenizer
texts = ['탐스러운 사과', '맛있는 바나나', '노랗고 길쭉한 바나나 바나나', '저는 과일이 좋아요']
tokenizer = Tokenizer()
tokenizer.fit_on_texts(texts)
print(tokenizer.word_index)
# mode 옵션은 count, binary, tfidf, freq
print(tokenizer.texts_to_matrix(texts, mode = 'count'))
각 단어에 숫자 1부터 시작하는 정수 인덱스 부여하기
텍스트 데이터에 texts_to_matrix() 적용
입력된 텍스트 데이터로부터 행렬(matrix)를 만드는 도구
'Deep Learning > NLP' 카테고리의 다른 글
다층 퍼셉트론(MLP)을 사용하여 텍스트 분류 (0) | 2022.05.07 |
---|---|
20개 뉴스 그룹 데이터 (0) | 2022.05.06 |
LSA & LDA (0) | 2021.09.06 |
Word2Vec (0) | 2021.09.02 |
유사도 (0) | 2021.08.05 |
Comments