Deep Learning/NLP
케라스의 texts_to_matrix()
Jun's N
2022. 5. 5. 23:30
import numpy as np
from tensorflow.keras.preprocessing.text import Tokenizer
texts = ['탐스러운 사과', '맛있는 바나나', '노랗고 길쭉한 바나나 바나나', '저는 과일이 좋아요']
tokenizer = Tokenizer()
tokenizer.fit_on_texts(texts)
print(tokenizer.word_index)
# mode 옵션은 count, binary, tfidf, freq
print(tokenizer.texts_to_matrix(texts, mode = 'count'))
각 단어에 숫자 1부터 시작하는 정수 인덱스 부여하기
텍스트 데이터에 texts_to_matrix() 적용
입력된 텍스트 데이터로부터 행렬(matrix)를 만드는 도구
728x90