정책연구검색


전체 검색

Home  정책연구검색  전체 검색

과제정보

과제정보
과제명 전자사전 개발
기관명 문화체육관광부 담당부서 조직성과담당관실
전화번호 02-3704-9227 연구기간 2004-04-14 ~ 2004-12-13
연구분야
개요 전자사전 개발

계약정보

과제정보
수행기관 서울대학교 [대학]
수행연구원 홍재성 계약일자 2004-04-14
계약방식 기타 계약금액 0원

연구결과 정보

과제정보
제목 (21세기 세종계획)전자사전 개발
연구보고서
목차 Ⅰ. 머리말=1 
1. 세종전자사전 개발의 목표와 의의=1 
2. 세종전자사전의 특징=3 
3. 3단계(2004-2007) 사업 개요=5
Ⅱ. 사업 개요=7 
1. 목 적=7 
2. 사업기간=7 
3. 사업내용=8 
4. 2004년 사업 목표 및 내용=11 
Ⅲ. 연구 추진 계획 및 실적=17
Ⅳ. 세부 추진 내역=20 
1. 핵심 전자사전 분과=20 
2. 연어사전분과 2004년도 연구 목표 및 내용=267 
3. 복합명사구분과 2004년도 연구 목표 및 내용=335 
4. 특수어 분과 2004년도 연구 목표 및 내용=371 
5. 통합전자사전 구축 및 관리평가 분과=427 
Ⅴ. 결론 및 향후 전망=464 
1. 문제점 및 개선방안=464 
2. 전망 및 3단계 중기계획=465 
Ⅵ. 참고문헌=467
◇ 결과물 CD 내역=504
초록
1. 사업명 : 한국어 전자사전 개발 2. 연구의 목적 ? 본 연구는 대규모 한국어 어휘를 수집하고 이를 체계적으로 분석·기술하여, 한국어 관련 언어 정보의 자동 처리에 필수적이면서도, 보편적으로 활용될 수 있는 기반 전자사전을 구축하려는 작업이다. ? 전자사전은 각종 언어 정보를 처리하는 소프트웨어 개발과 실행에 필수불가결한 핵심 부문이라는 인식에서 출발한 본 연구는, 언어학/한국어학/사전학 및 전산학의 기존 연구성과들에 대한 비판적 검토를 바탕으로, 다양한 용도의 전산처리에 실질적으로 활용될 수 있고 그 기술의 획기적 발전에도 공헌할 수 있는 범용적 기반의 대규모 한국어 전자사전을 개발하는 것을 목표로 한다. ? 범용적 전자사전이란 특정한 유형이나 영역의 기계 처리 작업에 국한되지 않고, 정보 검색, 텍스트의 분석과 산출, 자동번역, 다국어 사전 구축, 인쇄 사전 구축 또는 한국어 교육이나 순수연구 등에 두루 활용되며, 더 나아가서는 향후의 진보된 인공지능 개발환경에도 유연하게 적용될 수 있는 전자사전을 말한다. 3. 연구의 필요성 ? 고도의 정보화 시대에 접어들어 선진 각국에서 이미 진행 중인 방대한 전자사전 구축 작업들을 염두에 둘 때, 정밀하면서도 방대한 한국어 전자사전의 편찬 작업은 우리나라가 21세기를 주도할 정보, 통신 등 언어 정보 산업에서 우위를 점하기 위해서 갖추어야 할 기본 조건이다. 이는 또한 미국이나 일본 등 언어 정보 산업 선진국에 의한 문화 및 기술 종속 방지 차원에서도 시급히 요구되는 일이다. ? 언어 정보의 효율적인 자동처리를 위해서는 언어학과 전산학의 긴밀한 협력이 필수적으로 요구된다. 본 연구는 언어학적 관점에서 체계적으로 기술된 자료를 전산학적 관점의 연구와 체계적으로 접목시킴으로써 이제껏 미진했던 두 분야의 학제간 연구를 획기적으로 진척시키는 기회를 제공한다. ? 자연언어 기계처리 분야의 비약적 발전을 위해서는 특정 분야에만 제한적으로 응용될 수 있는 자동 처리 방식에서 탈피하여 언어 전반에 걸쳐 종합적으로 적용할 수 있는 방대한 규모의 정보자료가 구축되어야 한다. 따라서 개별적이고 특수한 연구들과는 달리 본 연구에서 지향하는 법용적이고 방대한 어휘 정보 베이스의 구축이 이루어져야 한다. 4. 연구내용 및 결과물 세종 전자사전 개발 3단계 사업 1차년도인 2004년의 주요 연구내용은 다음과 같다. 1) 상세기술 전자사전 구축 2) 기초전자사전 구축 및 목록 정제 3) 세종 전자사전 구축 지침서 보완 4) 세종 전자사전 개발과 활용을 위한 기초 연구 5) 통합 전자사전 구축 6) 세종 전자사전 검색과 활용을 위한 도구 개발 및 평가 ? 검증 연구 이와 같은 연구내용은 각 하위분과에서 수행되는데. 1)-3)은 하위 전자사전 개발 분과에서. 4)는 핵심 전자사전 분과 내의 기초연구 소분과를 비롯한 여러 소분과에서. 5)는 통합 전자사전 구축 분과에서. 6)은 통합 전자사전 분과와 핵심사전 분과 내 기초연구 소분과 및 통합지원 분과에서 수행되었다. 각 분과별 2004년 연구 결과물을 구체적으로 제시하면 아래와 같다. ? 전자사전 구축 지침서 보완 1) 체언, 용언 : 3단계 사업에서는 중규모 전자사전 개발을 위해 유보했던 어휘 의미관계 정보항목들에 대한 기술을 재개하고, 미시구조를 XML 방식으로 재구성하게 됨에 따라 관련 내용에 대한 지침들을 새로이 확정하는 등 구축 지침서에 대한 대대적인 보완 작업을 수행하였다. 2) 연어 : 연어사전은 올해로 개발이 종료되므로, 기존 지침서를 보완하여 최종 지침서를 완성하였다. 4) 관용표현 : 관용표현 사전은 기성결과물 검토 과정에서 기존 지침서를 보완하였고, 기초 전자사전 목록 확장과 관련하여 기초 전자사전 구축 지침서를 구축하였다. 5) 특수어, 복합명사구, 통합전자사전 구축분과에서도 각각 기존 지침서를 보완하였다. ? 전자사전 개발과 활용을 위한 기반 연구 1) 의미정보 : 명사 의미부류 체계 및 전문영역 체계 등 의미정보 기술관련 연구 2) 통사정보 : 각 분과사전의 통사정보 기술 및 검증을 위한 연구 3) 세종 전자사전 술어집 보완 5) 세종 전자사전의 활용 및 응용 방안 마련을 위한 기초 연구 ? 전자사전 구축도구 및 활용도구 개발 및 보완 1) 통합 입력기 보완 2) 세종 전자사전 검색기 보완 3) 기성 결과물 자료 활용을 위한 검색기 보완 5. 연구결과의 활용 전자사전 및 언어정보 처리 소프트웨어 개발과 관련하여, 국외에서는, 대규모 프로젝트를 통한 지속적이고 일관성 있는 연구들이 활발하게 진행되고 있으며, 그 결과들의 활용도 이미 상당한 수준에 이른 상태이다. 반면 국내의 연구 현황은 아직 미미한 수준에 머무르고 있어 언어정보 선진국의 수준에 미치지 못하고 있다. 국내 최초로 장기간의 체계적인 연구 작업에 의한 대규모 한국어 전자사전 구축을 도모하는 세종전자사전 개발 사업은, 이미 중규모 전자사전의 개발과 배포를 통해 부분적으로 확인할 수 있었듯이, 다음과 같은 기대효과로 열악한 현 상황의 개선에 공헌할 수 있을 것이다. ? 본 연구는 한국어 정보 처리 분야에 필수적인 대규모의 어휘 정보의 전산화를 위한 본격적인 연구로서 아직도 미미한 수준에 있는 국내 관련분야의 연구 활성화를 촉진한다. ? 본 연구를 통해 구축될 한국어 전자사전은 범용적 어휘 데이터베이스의 성격을 가지므로, 이의 전산적 가공을 통해 각종 한국어 정보 처리 분야에서 사용될 수 있다. 따라서. 해당 분야의 국내 연구 및 기술 수준을 획기적으로 발전시킬 수 있는 계기를 제공 한다. ? 본 연구는 언어 정보 데이터베이스를 공학적 실용성의 관점에서 뿐만 아니라 언어학적 이론과 방법론을 엄격하게 적용하여 구축하는 것으로서, 그 결과물로 제공되는 한국어 전자사전은 국어학·언어학 연구에도 요긴하게 활용될 수 있는 언어 자료를 제공할 수 있다. 이러한 관점에서 본 연구는 한국어 연구의 발전에도 크게 기여할 것이다. ? 전자사전의 개발은 언어학과 전산학의 진정한 학제간 협력 작업을 통해서 이루어질 때 바람직한 결과가 기대되는 성질의 작업이다. 본 연구 개발에는 다수의 국어학·언어학 분야의 전문 연구 인력과 전산학 분야의 전문 인력이 참여하여 긴밀한 상호 협력의 장을 이루고 있어, 그간 한국어 자동처리 분야에서 문제점으로 나타났던 순수 언어학 이론과 공학적 응용 사이의 불균형 문제를 해소시키고 있는 만큼 만족스러운 성과를 기대할 수 있을 것이다. ? 본 연구에서 목표하는 전자사전의 구축은 한국의 정보·통신산업 분야에서 미국, 유럽, 일본 등 기존 선진산업국들에의 기술 종속을 미연에 방지하고, 나아가서는 이들과의 경쟁에서 한국이 우위를 점할 수 있는 기반을 마련한다.
 

1. 사업명 :
한국어 전자사전 개발 
2. 연구의 목적 
? 본 연구는 대규모 한국어 어휘를 수집하고 이를 체계적으로 분석·기술하여, 한국어 관련 언어 정보의 자동 처리에 필수적이면서도, 보편적으로 활용될 수 있는 기반 전자사전을 구축하려는 작업이다. 
? 전자사전은 각종 언어 정보를 처리하는 소프트웨어 개발과 실행에 필수불가결한 핵심 부문이라는 인식에서 출발한 본 연구는, 언어학/한국어학/사전학 및 전산학의 기존 연구성과들에 대한 비판적 검토를 바탕으로, 다양한 용도의 전산처리에 실질적으로 활용될 수 있고 그 기술의 획기적 발전에도 공헌할 수 있는 범용적 기반의 대규모 한국어 전자사전을 개발하는 것을 목표로 한다. 
? 범용적 전자사전이란 특정한 유형이나 영역의 기계 처리 작업에 국한되지 않고, 정보 검색, 텍스트의 분석과 산출, 자동번역, 다국어 사전 구축, 인쇄 사전 구축 또는 한국어 교육이나 순수연구 등에 두루 활용되며, 더 나아가서는 향후의 진보된 인공지능 개발환경에도 유연하게 적용될 수 있는 전자사전을 말한다.
3. 연구의 필요성 
? 고도의 정보화 시대에 접어들어 선진 각국에서 이미 진행 중인 방대한 전자사전 구축 작업들을 염두에 둘 때, 정밀하면서도 방대한 한국어 전자사전의 편찬 작업은 우리나라가 21세기를 주도할 정보, 통신 등 언어 정보 산업에서 우위를 점하기 위해서 갖추어야 할 기본 조건이다. 이는 또한 미국이나 일본 등 언어 정보 산업 선진국에 의한 문화 및 기술 종속 방지 차원에서도 시급히 요구되는 일이다. 
? 언어 정보의 효율적인 자동처리를 위해서는 언어학과 전산학의 긴밀한 협력이 필수적으로 요구된다. 본 연구는 언어학적 관점에서 체계적으로 기술된 자료를 전산학적 관점의 연구와 체계적으로 접목시킴으로써 이제껏 미진했던 두 분야의 학제간 연구를 획기적으로 진척시키는 기회를 제공한다. 
? 자연언어 기계처리 분야의 비약적 발전을 위해서는 특정 분야에만 제한적으로 응용될 수 있는 자동 처리 방식에서 탈피하여 언어 전반에 걸쳐 종합적으로 적용할 수 있는 방대한 규모의 정보자료가 구축되어야 한다. 따라서 개별적이고 특수한 연구들과는 달리 본 연구에서 지향하는 법용적이고 방대한 어휘 정보 베이스의 구축이 이루어져야 한다. 
4. 연구내용 및 결과물 
세종 전자사전 개발 3단계 사업 1차년도인 2004년의 주요 연구내용은 다음과 같다. 
1) 상세기술 전자사전 구축 
2) 기초전자사전 구축 및 목록 정제 
3) 세종 전자사전 구축 지침서 보완 
4) 세종 전자사전 개발과 활용을 위한 기초 연구 
5) 통합 전자사전 구축 
6) 세종 전자사전 검색과 활용을 위한 도구 개발 및 평가 ? 검증 연구 
이와 같은 연구내용은 각 하위분과에서 수행되는데. 1)-3)은 하위 전자사전 개발 분과에서. 4)는 핵심 전자사전 분과 내의 기초연구 소분과를 비롯한 여러 소분과에서. 5)는 통합 전자사전 구축 분과에서. 6)은 통합 전자사전 분과와 핵심사전 분과 내 기초연구 소분과 및 통합지원 분과에서 수행되었다. 각 분과별 2004년 연구 결과물을 구체적으로 제시하면 아래와 같다. 
? 전자사전 구축 지침서 보완 
1) 체언, 용언 : 3단계 사업에서는 중규모 전자사전 개발을 위해 유보했던 어휘 의미관계 정보항목들에 대한 기술을 재개하고, 미시구조를 XML 방식으로 재구성하게 됨에 따라 관련 내용에 대한 지침들을 새로이 확정하는 등 구축 지침서에 대한 대대적인 보완 작업을 수행하였다. 
2) 연어 : 연어사전은 올해로 개발이 종료되므로, 기존 지침서를 보완하여 최종 지침서를 완성하였다. 
4) 관용표현 : 관용표현 사전은 기성결과물 검토 과정에서 기존 지침서를 보완하였고, 기초 전자사전 목록 확장과 관련하여 기초 전자사전 구축 지침서를 구축하였다. 
5) 특수어, 복합명사구, 통합전자사전 구축분과에서도 각각 기존 지침서를 보완하였다.
? 전자사전 개발과 활용을 위한 기반 연구 
1) 의미정보 : 명사 의미부류 체계 및 전문영역 체계 등 의미정보 기술관련 연구 
2) 통사정보 : 각 분과사전의 통사정보 기술 및 검증을 위한 연구 
3) 세종 전자사전 술어집 보완 
5) 세종 전자사전의 활용 및 응용 방안 마련을 위한 기초 연구 
? 전자사전 구축도구 및 활용도구 개발 및 보완 
1) 통합 입력기 보완 
2) 세종 전자사전 검색기 보완 
3) 기성 결과물 자료 활용을 위한 검색기 보완 
5. 연구결과의 활용 
전자사전 및 언어정보 처리 소프트웨어 개발과 관련하여, 국외에서는, 대규모 프로젝트를 통한 지속적이고 일관성 있는 연구들이 활발하게 진행되고 있으며, 그 결과들의 활용도 이미 상당한 수준에 이른 상태이다. 반면 국내의 연구 현황은 아직 미미한 수준에 머무르고 있어 언어정보 선진국의 수준에 미치지 못하고 있다. 국내 최초로 장기간의 체계적인 연구 작업에 의한 대규모 한국어 전자사전 구축을 도모하는 세종전자사전 개발 사업은, 이미 중규모 전자사전의 개발과 배포를 통해 부분적으로 확인할 수 있었듯이, 다음과 같은 기대효과로 열악한 현 상황의 개선에 공헌할 수 있을 것이다. 
? 본 연구는 한국어 정보 처리 분야에 필수적인 대규모의 어휘 정보의 전산화를 위한 본격적인 연구로서 아직도 미미한 수준에 있는 국내 관련분야의 연구 활성화를 촉진한다. 
? 본 연구를 통해 구축될 한국어 전자사전은 범용적 어휘 데이터베이스의 성격을 가지므로, 이의 전산적 가공을 통해 각종 한국어 정보 처리 분야에서 사용될 수 있다. 따라서. 해당 분야의 국내 연구 및 기술 수준을 획기적으로 발전시킬 수 있는 계기를 제공 한다.
? 본 연구는 언어 정보 데이터베이스를 공학적 실용성의 관점에서 뿐만 아니라 언어학적 이론과 방법론을 엄격하게 적용하여 구축하는 것으로서, 그 결과물로 제공되는 한국어 전자사전은 국어학·언어학 연구에도 요긴하게 활용될 수 있는 언어 자료를 제공할 수 있다. 이러한 관점에서 본 연구는 한국어 연구의 발전에도 크게 기여할 것이다. 
? 전자사전의 개발은 언어학과 전산학의 진정한 학제간 협력 작업을 통해서 이루어질 때 바람직한 결과가 기대되는 성질의 작업이다. 본 연구 개발에는 다수의 국어학·언어학 분야의 전문 연구 인력과 전산학 분야의 전문 인력이 참여하여 긴밀한 상호 협력의 장을 이루고 있어, 그간 한국어 자동처리 분야에서 문제점으로 나타났던 순수 언어학 이론과 공학적 응용 사이의 불균형 문제를 해소시키고 있는 만큼 만족스러운 성과를 기대할 수 있을 것이다. 
? 본 연구에서 목표하는 전자사전의 구축은 한국의 정보·통신산업 분야에서 미국, 유럽, 일본 등 기존 선진산업국들에의 기술 종속을 미연에 방지하고, 나아가서는 이들과의 경쟁에서 한국이 우위를 점할 수 있는 기반을 마련한다.
제작일 2004-12-13
발행년도 2004년

연구결과 평가 및 활용보고서

과제정보
평가결과서 미등록
활용결과 보고서 ※ 등록되지 않았습니다. (영 제52조에 따라 연구 종료 후 6개월 이내 등록)

공공누리 정보

공공누리
저작물
민간이용 동의
비동의 사유

연구결과 만족도

연구결과 만족도
참여인원 : 0명 점수: 0
연구결과 만족도 평가정보
no data found.

만족도 평가

연구결과 만족도 평가정보
*비밀번호