Note
언어 모델 (Language Model) 본문
728x90
언어 모델이란?
단어 또는 문장에 확률을 할당하는 것을 하는 모델이다.
즉, 이전 단어 다음에 어떤 단어가 올 확률이 가장 높은 것인지를 찾아내는 것이다.
다른 유형으로는 두 사이에 어떤 단어가 올 확률이 높은 것인지를 찾는 모델이 있다.
흔히 말하는 언어 모델링은 주어진 단어를 토대로 주어지지 않은 단어를 예측하는 것이다.
단어 시퀀스에 확률을 할당해줄 때, 기본적으로 문장의 흐름이 자연스러운 쪽에 확률을 높게 할당한다.
기계 번역, 오타 교정, 음성 인식 등에서 문장의 구성이 좀 더 자연스러운 쪽으로 높은 확률을 할당한다.
예를 들면, '떠났다'와 '쩌났다'가 있다고 한다면 '떠났다'에 더 높은 확률을 할당하는 것이다.
이처럼 번역 과정, 오타, 음성 인식에서도 같이 활용된다.
크게 통계적 언어 모델과 n-gram 언어 모델이 있다.
'Deep Learning > NLP' 카테고리의 다른 글
Word2Vec (0) | 2021.09.02 |
---|---|
유사도 (0) | 2021.08.05 |
정규 표현식 ( Regular Expression ) (0) | 2021.07.29 |
표제어 추출 (Lemmatization) (0) | 2021.07.27 |
어간 추출 (Stemming) (0) | 2021.07.27 |
Comments