요약
형태소 분석(morphological analysis)이란 자연어 처리의 기저를 이루는 단계로 문장에서 최소 의미 단위인 형태소들을 추출하는 작업을 말한다. 한국어는 자체의 특성으로 인하여 형태소 분석 작업이 자연어 처리에 있어 큰 비중을 차지한다.
본 논문에서는 기존에 연구되었던 형태소 분석 시스템들을 중심으로 한국어 형태소 분석시 고려해야 할 사항들에 대해 전반적으로 설명하고자 한다.
한국어 형태소 분석 시스템의 고찰
이 호, 임 해창
고려대학교
전산과학과
I. 서론
자연어 처리 시스템을 구조적으로 살펴보면 형태소 분석 (morphological analysis) 단계, 구문 분석(syntatic analysis) 단계, 의미 분석(semantic analysis) 단계, 문맥 분석(discourse analysis) 단계로 구성되어 있다. 형태소 분석 단계에서는 문장에서 최소 의미 단위를 추출해 내며, 구문 분석 단계에서는 통사 구조를 파악한다. 또한 의미 분석 단계에서는 각 단어에 올바른 의미를 부여하고 단어 끼리의 적합한 결합 관계를 조사하며, 문맥 분석 단계에서는 문장들 사이의 의미 관계를 분석한다.
.... |