케라스의 texts_to

Deep Learning/NLP

케라스의 texts_to_matrix()

Jun's N 2022. 5. 5. 23:30

import numpy as np
from tensorflow.keras.preprocessing.text import Tokenizer

texts = ['탐스러운 사과', '맛있는 바나나', '노랗고 길쭉한 바나나 바나나', '저는 과일이 좋아요']

tokenizer = Tokenizer()
tokenizer.fit_on_texts(texts)
print(tokenizer.word_index)

# mode 옵션은 count, binary, tfidf, freq
print(tokenizer.texts_to_matrix(texts, mode = 'count'))

각 단어에 숫자 1부터 시작하는 정수 인덱스 부여하기

텍스트 데이터에 texts_to_matrix() 적용

입력된 텍스트 데이터로부터 행렬(matrix)를 만드는 도구

728x90

저작자표시 비영리 (새창열림)