Note
PyKoSpacing 본문
728x90
띄어쓰기가 되어있지 않은 문장을 띄어쓰기를 한 문장으로 변환해주는 패키지
pip install git+https://github.com/haven-jeon/PyKoSpacing.git
sent = '김군은 극중 다중 인격 사나이 이광수 역을 맡았다. 김군은 한국 태권도 전승자를 가리는 결전의 날을 앞두고 10년간 함께 훈련한 사부님인 유사부(김모씨 분)를 찾으러 내려온 인물이다.'
new_sent = sent.replace(" ", '') # 띄어쓰기가 없는 문장 임의로 만들기
from pykospacing import Spacing
spacing = Spacing()
kospacing_sent = spacing(new_sent)
print(sent)
print(kospacing_sent)
김군은 극중 다중 인격 사나이 이광수 역을 맡았다. 김군은 한국 태권도 전승자를 가리는 결전의 날을 앞두고 10년간 함께 훈련한 사부님인 유사부(김모씨 분)를 찾으러 내려온 인물이다.
김군은 극중 다중 인격 사나이 이광수 역을 맡았다. 김군은 한국 태권도 전승자를 가리는 결전의 날을 앞두고 10년간 함께 훈련한 사부님인 유사부(김모씨 분)를 찾으러 내려온 인물이다.
'Deep Learning > NLP' 카테고리의 다른 글
RNN을 이용한 텍스트 생성 1 (0) | 2022.05.24 |
---|---|
Py-Hanspell (0) | 2022.05.15 |
FastText (패스트텍스트) (0) | 2022.05.08 |
다층 퍼셉트론(MLP)을 사용하여 텍스트 분류 (0) | 2022.05.07 |
20개 뉴스 그룹 데이터 (0) | 2022.05.06 |
Comments