Note

케라스의 texts_to_matrix() 본문

Deep Learning/NLP

케라스의 texts_to_matrix()

알 수 없는 사용자 2022. 5. 5. 23:30
728x90
import numpy as np
from tensorflow.keras.preprocessing.text import Tokenizer

texts = ['탐스러운 사과', '맛있는 바나나', '노랗고 길쭉한 바나나 바나나', '저는 과일이 좋아요']

tokenizer = Tokenizer()
tokenizer.fit_on_texts(texts)
print(tokenizer.word_index)

# mode 옵션은 count, binary, tfidf, freq
print(tokenizer.texts_to_matrix(texts, mode = 'count'))

각 단어에 숫자 1부터 시작하는 정수 인덱스 부여하기

텍스트 데이터에 texts_to_matrix() 적용

입력된 텍스트 데이터로부터 행렬(matrix)를 만드는 도구

 

'Deep Learning > NLP' 카테고리의 다른 글

다층 퍼셉트론(MLP)을 사용하여 텍스트 분류  (0) 2022.05.07
20개 뉴스 그룹 데이터  (0) 2022.05.06
LSA & LDA  (0) 2021.09.06
Word2Vec  (0) 2021.09.02
유사도  (0) 2021.08.05
Comments