정책연구검색


전체 검색

Home  정책연구검색  전체 검색

과제정보

과제정보
과제명 한민족 언어 정보화
기관명 문화체육관광부 담당부서 조직성과담당관실
전화번호 02-3704-9227 연구기간 2005-04-15 ~ 2005-12-14
연구분야
개요 한민족 언어 정보화

계약정보

과제정보
수행기관 전북대학교 [대학]
수행연구원 이태영 계약일자 2005-04-15
계약방식 기타 계약금액 0원

연구결과 정보

과제정보
제목 (21세기 세종계획)한민족 언어 정보화
연구보고서
초록
1. 사업명 한민족 언어 정보화 2. 연구의 목적 한국어 정보화를 위한 중장기 발전 계획으로 수립된 21세기 세종 계획의 목표는 한국어와 한글을 바탕으로 하는 정보 사회의 건설에 있다. 이를 위해서, (1) 세계 수준의 한국어 기초 언어 자료 기반 구축을 통한 한국어 정보화 (2) 표준화된 전자 사전 구축을 통한 한국어 체계화 (3) 한민족 언어 정보화를 통한 한국어 세계화 (4) 언어 정보화와 관련된 규격 및 도구의 체계적 정리를 통한 한국어 표준화를 실현한다는 네 가지 목표를 설정하고 있다. 이 연구는 위에서 제시한 21세기 세종 계획의 네 가지 목표를 실현하기 위하여 설정된 ‘국어 기초 자료 구축’, ‘전자 사전 개발’, ‘한민족 언어 정보화’ 등의 분야 중에서, ‘한민족 언어 정보화’ 분야에 관한 것이다. 그리고 1998년-2007년(10년간)까지의 장기 발전 계획 중에서, 2004년-2007년(4년간)까지의 제3단계 2차년도(2005년)의 계획을 실행하는 작업이다. 지금까지 ‘한민족 언어 정보화’ 분과에서는 1998년부터 2000년까지 제1단계 사업을 완료하였다. 두 가지 중요한 사업을 실행하였는데, 그 중에서 하나는 ‘국어 어문 규정 검색 프로그램’을 개발한 것이고, 다른 하나는 ‘남북한 언어 비교 사전’을 구축한 일이었다. 제2단계 1차년도인 2001년에 시행한 사업은 ‘남한 방언 검색 시스템 개발’, ‘국어의 로마자 표기법 검색 시스템 개발 및 국어의 로마자 표기 변환 프로그램 개발’, ‘남북한 이질화된 언어 검색 시스템 개발’, ‘한민족 언어 검색 통합 프로그램 1 개발’이었다. 그 결과, ‘한글 맞춤법 검색 시스템’, ‘표준어 규정 검색 시스템’, ‘외래어 표기법 검색 시스템’, ‘국어의 로마자 표기법 검색 시스템’을 개발하여 일차적으로 ‘국어 어문 규정 검색 프로그램’을 완성하였다. 그리고 ‘남북한 언어 비교 사전 구축’ 사업에서는 기초 어휘 10,000개를 선정하여 표기, 음운, 어휘, 문법 사항 등을 정밀하게 비교하여 남북한 기초 어휘가 매우 동질적이라는 점을 밝힐 수 있게 되었다. 또한 ‘남북한 이질화된 언어 검색 시스템 개발’ 사업에서는 북한에서만 쓰이는 어휘 3,000개를 검색할 수 있도록 제시하였다. ‘한국 방언 검색 시스템 개발’ 사업에서는 ‘남한 방언 검색 시스템’을 개발하여 이미 나와 있는 방언 사전과 방언 자료를 지도와 함께 쉽게 검색할 수 있도록 시스템을 개발하였다. 이제까지 개발된 모든 검색 시스템을 통합하여 ‘한민족 언어 통일을 위한 검색 통합 프로그램1’을 개발하여 모든 국민들이 자유롭게 검색할 수 있도록 프로그램화 하였다. 그리고 2002년에 시행한 사업은 1) 한민족 정서법 변환 프로그램 개발을 위한 기초 연구, 2) 북한 방언 검색 시스템 개발, 3) 국어 어휘의 역사 검색 시스템(1) 개발, 4) 한민족 언어 통일을 위한 검색 통합 프로그램(2) 개발이었다. ‘한민족 정서법 변환 프로그렘 개발을 위한 기초 연구’에서는 북한의 자료를 남한의 정서법으로 변환시키는 프로그램을 개발하는 데에 필요한 기초적인 사업을 추진하였다 . ‘북한 방언 검색 시스템 개발’에서는 ‘한국 방언 검색 시스템 개발’을 위한 2차년도 사업으로, 북한의 함북, 함남, 평북, 평남, 황해, 강원도 미수복 지역 5개 군, 경기도 미수복 지역 2개 군에서 사용되는 방언을 검색할 수 있는 시스템을 개발하였다. ‘국어 어휘의 역사 검색 시스템 개발’에서는 현대 국어의 어휘 중에서 약 1,000개의 일상 어휘를 선택하여 그 어휘들 각각의 어원 정보와 표기법 및 형태의 변화, 음운 변화, 의미 변화의 과정을 문헌 자료에 대한 철저한 실증적 자료를 제시하였다. 그리고 ‘한민족 언어 통일을 위한 검색 통합 프로그램 개발’에서는 한민족 언어 정보화 분과에서 개발한 모든 검색 시스템을 통합하여 국민들이 원하는 한국어 정보를 쉽게 검색할 수 있도록 그 프로그램을 완성하였다. 2002년도에 개발한 ‘북한 방언 검색 시스템’을 세종 계획 제2단계 1차년도인 2001년에 개발하였던 ‘남한 방언 검색 시스템’과 ‘한국 방언 검색 프로그램’으로 통합하였으며, ‘한민족 정서법 변환 프로그램’과 ‘국어 어휘의 역사 검색 프로그램’을 통합하였다. 그리고 여기에 이미 개발한 모든 프로그램을 통합하여 종합 프로그램(2)로 만들었다 2003년에 시행한 사업은 ‘한민족 정서법 변환 프로그램 개발을 위한 기초 연구’, ‘중국 및 기타 지역 방언 검색 시스템 개발을 위한 기초 연구’, ‘국어 어휘의 역사 검색 시스템(2) 개발을 위한 기초 연구’, ‘한민족 언어 정보 검색 통합 프로그램 개발’이었다. 그리하여 ‘한민족 정서법 변환 프로그램 개발을 위한 기초 연구’에서는 정서법 변환 프로그램에 필요한 데이터베이스를 제공하여 실제로 프로그램을 제작하였다. ‘중국 및 기타 지역 방언 검색 시스템 개발을 위한 기초 연구’에서 개발한 프로그램에서는 남한의 방언과 북한의 방언 그리고 기타 세계의 다른 지역에서 사용하고 있는 한국어 방언을 검색할 수 있도록 하였다. ‘국어 어휘의 역사 검색 프로그램(2) 개발을 위한 기초 연구’에서는 국어 어휘 역사에 관한 정보를 컴퓨터 프로그램을 통하여 국민들에게 제공하여 국민들의 국어 정보화에 기여함은 물론 잊혀져만 가는 국어 어휘에 관한 역사적 사실을 밝혀 줌으로써 국어의 보존에도 크게 기여하게 하였다. ‘한민족 언어 정보 검색 통합 프로그램 개발’에서는 2003년에 한민족 언어 정보화 분과에서 구축한 데이터베이스를 이용하여 검색 시스템들을 개발하였고 또 지금까지 개발한 모든 검색 시스템들을 통합하여 국민들이 원하는 한국어 정보를 쉽게 검색할 수 있도록 프로그램을 완성하였다. 2003년도에 통합한 프로그램들은 ‘한민족 정서법 변환 프로그램’, ‘국어의 어휘의 역사 검색 프로그램’, ‘한국 방언 검색 프로그램’이다. ‘한민족 정서법 변환 프로그램’은 2003년도에 개발한 ‘남한 정서법을 북한 정서법으로 변환하는 프로그램’에 2002년도에 개발한 ‘북한 정서법을 남한 정서법으로 변환하는 프로그램’을 통합하였다. ‘국어의 어휘의 역사 검색 프로그램’은 2002년에 개발한 프로그램의 내용을 확충하였다. ‘한국 방언 검색 프로그램’은 2001년에 개발한 ‘남한 방언 검색 시스템’, 2002년에 개발한 ‘북한 방언 검색 시스템’, 2003년에 개발한 ‘중국 및 기타 지역 방언 검색 시스템’을 통합하였다. 2004년에 시행한 사업은 ‘문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구, 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구, 한국 전통 문화 어휘 검색 프로그램 개발을 위한 기초 연구, 한민족 언어 정보화 검색 통합 프로그램 개발이었다. 2005년도의 ‘문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구’의 목적은 방언에 관심이 있는 연구자들과 일반 국민들이, 잘 알려진 문학 작품에 나타난 방언의 뜻과 예문 및 언어적 특징을 자세히 알 수 있도록 데이터베이스를 작성하여 제공하는 데 일차적인 목적이 있다. 그간 잘 알려진 문학 작품 임에도 불구하고 특징적인 지역 방언이 나오는 작품을 이해하는 데는 매우 큰 어려움이 있었다. 이 사업에서는 연차적으로 이러한 문제를 해결하면서 방언에 대한 이해의 폭을 넓혀가고자 한다. 특히 앞으로 국어 사전에 방언이 자세하게 수록되어야 하고, 각 지역의 방언 사전이 편찬되어야 하는데 이러한 사전 편찬에도 큰 도움이 되고자 이 연구를 진행하였다. 무엇보다도 친근한 작가가 쓴 지역을 대표하는 특징적인 방언을 해설하여 국민들의 방언에 대한 이해에 큰 도움을 줄 것으로 판단된다. 2005년도의 ‘국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구’의 목적은 국어 어휘의 역사 검색 시스템을 제작하는 데에 필요한 데이터베이스를 구축 하는 것이다. 그리하여 제작된 시스템에서 국민들에게 국어 어휘에 관한 역사 정보를 제공하여 국어에 관한 지식과 이해의 폭을 넓힘으로써 언어 생활을 더욱 윤택하게 하고, 국어의 정확한 사용을 통하여 국민들의 의사소통의 정확성과 신속성을 제고함을 그 목적으로 한다. 아울러 이러한 국어 어휘 역사에 관한 정보를 컴퓨터 프로그램을 통하여 국민들에게 제공하여 국민들의 국어 정보화에 기여함은 물론 잊혀져만 가는 국어 어휘에 관한 역사적 사실을 밝혀 줌으로써 국어의 보존에도 크게 기여하게 될 것이다. 따라서 이 연구는 거시적으로는 한민족 언어의 정보화를 확충시켜 나아가고, 미시적으로는 국민들의 국어에 대한 자긍심을 갖게 함으로써 국어 발전의 기틀을 마련하는 데에 그 목적이 있는 것이다. 2005년도의 ‘한민족 언어 정보 통합 검색 프로그램 개발’의 목적은 한민족 언어 정보화 분과에서 구축한 데이터베이스를 이용하여 검색 프로그램들을 개발하고 또 개발한 모든 검색 프로그램들을 통합하여 국민들이 원하는 한국어 정보를 쉽게 검색할 수 있도록 그 프로그램을 완성하는 데에 있다. 2005년도에는 ‘문학 작품에서 사용된 방언 검색 프로그램’, ‘국어 어휘의 역사 검색 프로그램’을 웹버전으로 만들었다. ‘국어의 어휘의 역사 검색 프로그램’은 2004년에 개발한 프로그램의 내용을 확충하였다. 또한 ‘문학 작품에서 사용된 방언 검색 프로그램’은 2004년도에 개발한 프로그램의 내용을 확충하였다. 3. 연구의 필요성 ‘한민족 언어 정보화’는 21세기 세종 계획 제 3 단계(2004년-2007년)의 2차 년도인 2005년 사업으로서 다음의 세 가지를 시행하게 되었다. (1) 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구 (2) 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구 (3) 한민족 언어 정보 검색 통합 프로그램 개발 (1)의 연구 결과로 제작한 프로그램은 문학 작품에 나타난 각 지역의 난해한 방언의 뜻과 용례 및 언어적 특징을 보여주기 때문에 일반 국민들이 방언을 통하여 한국어를 더욱 깊이 이해하는 데 필요한 것이다. (2)의 연구 결과로 제작한 프로그램은 국어의 어휘의 변천 과정과 어원에 대하여 궁금증을 가지고 있는 국민들의 욕구를 해소하는 데에 필요한 것이다. (3)는 (1), (2)의 프로그램을 통합하여 언어 대중들이 언어 생활에 직접 편리 하게 이용할 수 있도록 하기 위한 필요성에 의해 정밀한 웹 프로그램을 개발하는 것이다. 3.1. 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구 흔히 국어 사전을 편찬할 때, 각종 문학작품을 통하여 예문을 추출한다. 작가들의 한국어에 대한 감각을 비교적 높이 평가하기 때문일 것이다. 마찬가지로 문학작품에 쓰인 각 지역의 방언은 언어에 대한 감각이 있는 작가들이 비교적 상세하게 또는 안정되게 묘사하고 있기 때문에 방언으로서 가치가 있는 것이다. 그러나 문학 작품을 보거나 가르칠 때에 평소에 들어보지 못한 방언의 출현으로 인하여 시와 소설을 제대로 이해하기 어려웠던 것은 사실이다. 심한 경우에는 전혀 해독이 안 되어 오랫동안 궁금한 채로 해독을 미루어 온 어휘들도 많다. 전문가들조차도 해독이 안 되는 작품을 일반인들이 읽고 이해할 수는 없는 것이다. 이러한 어휘들은 대체로 방언인 경우가 많아서 방언 사전이 변변히 마련되어 있지 않은 상황에서 우리는 많은 어려움을 갖고 있다. 방언은 그 특징상 현지인에게 채록을 해야 한다. 그러나 채록을 하려면 많은 시간과 인력 그리고 경비가 소요된다. 현지 조사에서 채록한 자료들은 정제되지 않아서 군더더기가 많고 내용이 제대로 전달되지 않는 문장이 많다. 따라서 전문 인력을 동원하여 자료를 새롭게 다듬어야 한다. 반면에 작품에 쓰인 방언들은 작가에 의해 이미 정제된 방언 어휘나 문장들이기 때문에 비교적 안전하게 사용할 수 있는 것이다. 최근 지역 문화에 대한 관심이 고조되고 있는 이 시점에서 방언에 대한 관심은 최고조에 달한 것 같다. 지역의 방송과 신문, 시민들은 방언을 문화의 일부로 인식하고 아주 드러내놓고 자기 지역의 방언을 수없이 많이 사용하고 있다. 그런가 하면 자기 지역의 방언이 나오는 중요한 문학 작품과 작가의 업적을 선양 하는 많은 사업을 시행하고 있다. 문학 작품에 나오는 방언에 대한 접근은 주로 국어학자들의 몫으로 돌리고 있다. 방언이 언어이기 때문에 국어학 전공자가 다루어야 한다는 사고방식이다. 그러나 문학 작품에서 방언은 작품의 문학성은 물론, 인물, 배경, 이야기 전개를 해석하는 데 매우 중요한 요소이기 때문에 국어학과 국문학 전공자들이 공동으로 다루어야 할 중요한 요소인 셈이다. 따라서 연구에 있어서 공통분모가 많은 부분이기도하다. 이 사업에서는 3개년 계획으로 약 2,100 개의 방언 어휘를 중심으로 진행하고자 한다. 일차년도에는 우선 ‘전라, 경상, 충청, 강원, 제주’를 중심으로 지역의 대표적인 방언을 700여 개를 해설하였다. 금번 이차년도에는 ‘이북, 경기’를 포함하여 꼭 필요한 작품을 선별하여 700 개를 해설하였다. 사실상 이 사업으로 문학 작품의 방언을 통하여 각 지역의 방언적 특징을 드러내기는 쉽지 않지만 그래도 대표적인 방언, 또는 난해한 방언을 해설하는 것이기 때문에 연구자는 물론 일반 국민들에게도 매우 유익할 것이다. 그간 이러한 사업이 시행된 바가 없기 때문에 앞으로 방언 사전을 편찬하거나 방언 어휘를 해설할 때 하나의 표준이 될 것으로 생각한다. 3.2. 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구(4) 패권주의에 대항하여 민족주의가 발전하게 되면서 국민들은 우리의 것에 대한 관심이 높아진다. 그 중에서도 가장 높은 관심을 보이는 분야는 우리 문화재에 대한 새로운 관심과 지나간 시기의 인물에 대한 재평가, 그리고 국어에 대한 관심이라고 할 수 있다. 국어에 대한 관심 중에서 가장 높은 것은 국어 어휘 어원에 관한 것이다. 어휘는 한 사회의 문화적인 소산이다. 그래서 한 어휘의 형태로부터 그 어휘가 지니는 의미에 이르기까지 그 어휘가 사용되던 사회의 모습을 반영하고 있음이 일반적이다. 이러한 관점에서 볼 때, 어휘는 다른 문화적인 현상과 완전히 독립된 상태에서 파악하기 어렵다. 특히 어휘 형태와 의미의 변화가 단순히 음운론적인 규칙이나 단어 형성 규칙, 그리고 의미 변화의 규칙에 의해서만 이루어진다고 단언할 수 없다. 20세기 말부터 우리 나라는 국제적 관계와 사회적 관계로 인하여, 많은 외래어 및 외국어가 홍수처럼 쏟아져 들어왔고, 그로 인해 우리 국민들의 언어 생활은 우리의 고유어와 한자어뿐만 아니라 수많은 외래어 및 외국어의 범람으로 극심한 언어의 혼효로 인한 부작용이 심한 상태에 있다. 특히 영어의 영향은 절대적 가치를 지니고 사회에서 중요한 요소로 자리잡고 있다. 그러나 이러한 빠른 변화에 대해 일반 국민들은 그 반작용으로 오히려 우리 국어를 더 살려 쓰자는 적극적인 자세로 대웅하고 있는 것으로 판단된다. 한편에서는 외국어 또는 외래어를 중시하는가 하면, 한편에서는 이들을 우리 국어로 바꿀 뿐만 아니라, 더 적극적으로는 우리가 지금까지 써 왔으면서도 잊어버리거나 사라진 어휘들을 되살려 쓰려는 노력까지도 보이고 있다. 그래서 최근에 많은 국민들이 국어 어휘의 역사 및 어원 정보에 대해 큰 관심을 보이고 있다. 시중 서점에는 국어의 어원 정보에 대한 서적이 상당수 나와 있다. 국어 어원 사전이 여러 곳에서 편찬되고, 어휘의 어원에 대한 관심을 가지고 있는 학자들이 어원학회를 결성하는 등의 현상은 곧 국어 어휘의 어원 및 역사에 대한 관심이 고조되고 있음을 증명하는 것이다. 게다가 인터넷상에서도 국어의 어원에 대한 정보가 넘쳐나고 있다. 그러나 안타깝게도 이러한 국어의 어휘 역사에 대한 정보는 전문가들로서 볼 때, 매우 부정확한 지식으로 말미암아 국민들에게 민간어원설 수준의 정보밖에 제공하지 못하는 실정에 있다. 게다가 각종의 국어 사전에도 그 어휘의 역사적 정보를 제공하여 주지 않음으로써, 국어에 대한 국민들의 관심을 충족시키지 못하는 실정에 있다고 할 수 있다. 지금까지 국어의 어원이나 그 역사에 대하여 연구한 업적은 무척 많으나, 실제로 문헌이나 실제적 증거에 의하여 기술한 것은 몇몇 논저에 국한되어 있는 실정이다. 따라서 국어에 대한 부정확한 지식으로 국어에 대한 지식과 이해가 잘못 전달되어, 우리의 어문 생활을 발전시키지 못하고 있다. 이러한 점을 감안한다면, 가능하면 상당수의 국어 어휘의 역사를 기술하는 것이 마땅하겠으나, 실제로 역사 말뭉치에서 추출하여 그 어휘의 역사를 기술할 수 있는 어휘는 그리 충분한 편이 못된다. 따라서 1차 년도와 2차 년도, 3차 년도,4차 년도를 통하여 약 4,000 개의 어휘의 역사를 기술하고 프로그램으로서 검색이 가능하도록 한다. 그 단어는 국민들이 그 어원에 대하여 많은 관심을 가지고 있는 일상 어휘들을 선별하도록 한다. 이러한 작업은 이미 일본에서는 국립국어연구소에서 오래 전에 이루어져 있는 것으로 알려져 있다. 그리하여 어느 한 어휘를 검색하면 그 어휘가 어느 문헌에서 처음 사용되었으며, 어떠한 변화 과정을 거쳐 오늘날에는 어떻게 사용되고 있는가를 제시하여 주고 있다. 그렇지만 우리나라에서는 아직까지 이러한 작업이 체계적으로 이루어진 적이 없다. 왜냐 하면 국어의 역사에 대한 전문적인 지식을 갖추고 있지 못한 연구자가 많지 않기 때문이다 이 연구는 이러한 점에서 매우 의미 있는 작업이라고 생각한다. 이 연구에 참여하는 연구진들은 국어 사전 편찬의 경험이 풍부하거나, 국어사 연구 및 어휘론 연구의 전문가이며 또한 권위자들로서 구성되어 있어서, 연구 결과의 신빙성이 높을 것으로 기대된다. 3.3. 한민족 언어 정보 검색 통합 프로그램 개발 국어학자들에 의해서 수집되고 정리된 국어 자료들을 국민들이 널리 공유하고 사용하기 위해서는 검색 통합 프로그램이 개발되어야 한다. 이를 통하여 국민들이 올바른 국어 생활을 영위하고, 국어에 대한 인식과 이해를 높일 것이다. 1998년에서 2004년까지 개발된 기존 프로그램들과 2005년에 개발한 2개의 프로그램을 모두 통합한 프로그램을 인터넷에서 검색이 가능하도록 웹 검색 프로그램으로 개발한다. (1) 문학 작품에서 사용된 방언 검색 프로그램 ① 3단계 1차년도(2004년) : 700개 어휘 ② 3단계 2차년도(2005년) : 700개 어휘 (2) 국어 어휘의 역사 검색 프로그램 ① 2단계 2차년도(2002년) : 1,000개 어휘 ② 2단계 3차년도(2003년) : 1,000개 어휘 ③ 3단계 1차년도(2004년) : 1,000개 어휘 ④ 3단계 2차년도(2005년) : 1,000개 어휘 (3) 한국 전통 문화 어휘 검색 프로그램 ① 3단계 1차년도(2004년) : 300개 어휘 (4) 어문 규정 통합 검색 프로그램 ① 1단계 1차년도(1998년) : 한글 맞춤법 검색 프로그램 ② 1단계 2차년도(1999년) : 표준어 규정 검색 프로그램 ③ 1단계 3차년도(2000년) : 외래어 표기법 검색 프로그램 ④ 2단계 1차년도(2001년) : 국어의 로마자 표기법 검색 프로그램 (5) 남북한 언어 비교 사전 검색 프로그램 ① 1단계 1차년도(1998년) : 1,000개 어휘 ② 1단계 2차년도(1999년) : 4,000개 어휘 ③ 1단계 3차년도(2000년) : 5,000개 어휘 (6) 남북한 이질화된 언어 검색 프로그램 ① 2단계 1차년도(2001년) : 3,000개 어휘 (7) 한국 방언 검색 프로그램 ① 2단계 1차년도(2001년) : 남한 방언 검색 프로그램 ② 2단계 2차년도(2002년) : 북한 방언 검색 프로그램 ③ 2단계 3차년도(2003년) : 중국 및 기타 지역 방언 검색 프로그램 (8) 남북한 정서법 변환 프로그램 ① 2단계 2차년도(2002년) : 북한 정서법을 남한 정서법으로 변환하는 프로그램 ② 2단계 3차년도(2003년) : 남한 정서법을 북한 정서법으로 변환하는 프로그램 이와 같은 프로그램들이 통합된다면 한 단어에 대해서 어문 규정, 남북한 어휘 비교, 방언, 어휘의 역사, 남북한 정서법 등에 관한 다양한 정보를 얻을 수 있다. 이러한 자료의 제공은 한국어정보처리 프로그램을 개발하려는 산업체들에게 매우 귀중한 정보를 제공하게 되며, 좀 더 정밀한 프로그램을 개발할 수 있는 토대를 제공하게 될 것이다. ‘문학 작품에서 사용된 방언 검색 프로그램’은 문학 작품에서 사용된 수많은 귀한 방언들에 대한 정보를 제공함으로써 문학 작품의 내용과 의미를 정확하게 이해하게 해 줄 것이다. ‘국어 어휘의 역사 검색 프로그램’은 국어 어휘의 어원을 밝히고 변천사를 정리하는 작업으로서, 그동안 궁금해 하던 어휘의 뿌리를 알려줄 것이다. 4. 연구 내용 및 결과물 4.1. 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구 ‘문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구’ 분야에서는 연차별로 다음과 같이 개발하도록 계획되어 있다. (1) 2004년 : 700 단어의 방언 검색 프로그램 개발 (2) 2005년 : 700 단어의 방언 검색 프로그램 개발 (3) 2006년 : 700 단어의 방언 검색 프로그램 개발 지금까지 출판된 방언이 많이 사용된 문학 작품을 선별한다. 시와 소설, 구비 문학대계, 희곡 작품을 대상으로 한다. 문학 작품 외에 한국정신문화연구원에서 발행한 ‘한국 구비문학 대계’와 ‘한국 방언 자료집’을 활용한다. 이 가운데에서 해당 지역의 방언이 많이 사용된 작품을 중점적으로 검토하여 어휘와 용례를 추출한다. 해당 지역 방언이 아주 많기 때문에 몇 가지 기준을 제시하여 해당 지역을 잘 드러낼 수 있는 특징적인 방언을 뽑아낸다. 4.2. 국어 어휘의 역사 검색 시스템4 개발을 위한 기초 연구 ‘국어 어휘의 역사 검색 시스템’ 분야에서는 연차별로 다음과 같이 개발하도록 계획되었다. 1) 2002년 : 1,016 단어의 어휘 역사 검색 시스템 개발 2) 2003년 : 1,037 단어의 어휘 역사 검색 시스템 개발 3) 2004년 : 1,071 단어의 어휘 역사 검색 시스템 개발 4) 2005년 : 1,066 단어의 어휘 역사 검색 시스템 개발 2005년도에는 2002년에서 2004년까지 개발한 모든 프로그램을 통합하여 하나의 시스템으로 통합하였다. 그리하여 상당수의 한국어 어휘의 어원 정보 및 그 역사의 검색이 가능하게 되었다. 2005년도에는 2002-2004년도에서 작성한 항목을 제외하고, 1,066개의 표제항을 조사하였으며, 이를 15세기부터 20세기 및 방언형에 이르기까지의 형태, 음운, 의미 변화의 내용을 일반인들이 이해하기 쉽게 기술하였다. 개발한 프로그램은 2005년의 ‘한민족 언어 검색 통합 프로그램’에 포함 되었다. 4.3. 한민족 언어 정보 검색 통합 프로그램 개발 (1) 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구 (2) 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구 (1), (2)를 웹 버전으로 개발한다 한편, 이미 개발한 어문 규정 통합 검색 프로그램, 남북한 언어 비교 사전 검색 프로그램, 남북한 이질화된 언어 검색 프로그램, 한국 방언 검색 프로그램은 2005년에 개발한 프로그램들과 통합하여 인터넷에서 검색이 가능하도록 웹 검색 프로그램으로 개발한다. 4.4. 연구 결과물 1. 연구보고서(종이 책)200부 2. 소스 시디 10개 5. 연구 결과의 활용 5.1. 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구 ① 국민들이 그간 궁금하게 생각했던 방언 어휘에 대해 정확한 뜻을 알 수 있다. ② 방언 연구에서 소홀히 다룬 문학 작품의 방언을 해설하는 것이므로 새로운 영역을 개척하는 것이 될 수 있다. ③ 중 ? 고등학교와 대학교의 문학 교육에 큰 도움이 될 것이다. ④ 국어 사전과 각 지역의 방언 사전 편찬에 큰 도움이 될 것이다. ⑤ 표준어의 사정에 방언을 적극 활용하여 보다 많은 복수 표준어를 만들 수 있다. ⑥ 각 지역의 방언을 표준어와 관련시키는 프로그램을 개발하거나 기타 정보 산업 및 문화 산업에 활용할 수 있을 것이다. 5.2. 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구 이 연구 결과는 연구 당해년도의 결과물을 무료로, 그리고 즉각적으로 공개할 수 있다. 따라서 일반 국민뿐만 아니라 한국어를 다루는 모든 교육기관(초 ? 중고 관공서, 대학, 컴퓨터 회사 등)이나 외국의 한국어 및 한국학 관련 연구소나 학교에서 즉각적으로 활용할 수 있다. 게다가 현재 인터넷상에서 국어의 역사정보(역사정보라기보다는 오히려 어원정보라고 할 수 있다)를 제공해 주고 있는 각 홈페이지에서 이를 내려받아서 활용함으로써, 21세기 세종계획을 통한 국어정보화에 대한 인식을 높일 수 있다. 그리고 이 프로그램은 옛한글 및 한자로 표기되기 때문에, 아직까지 한글 유니코드를 사용하지 않는 사람들에게 유니코드의 필요성을 알리는 중요한 역할을 할 수가 있으며, 아직까지 옛한글을 사용하는 홈페이지나 프로그램이 적은 형편 이어서 이들을 표기하기 위한 유니코드 사용에 촉매제 역할을 할 수도 있을 것 이다. 또한 한민족 언어 정보화 사업에서 ‘한글맞춤법 검색기, 표준어 검색기, 외래어 표기법 검색기, 로마자 표기 검색기’와 같은 프로그램을 통하여 국민들에게 현대 국어에 대한 인식을 높임과 동시에 국어의 역사에 대한 인식도 함께 제시함으로써, 국민들의 국어에 대한 이해도를 확대시켜 나아가게 할 수 있다. 이것은 곧 국민들로 하여금 국어에 대한 사랑을 높이는 계기를 마련할 수 있게 될 것이다. 5.3. 한민족 언어 정보 검색 프로그램 개발 ① 국어 정보화에 있어서 데이터베이스를 활용한 프로그램 개발 기술을 발전시켜 학자나 전문가들이 쉽게 활용할 수 있도록 한다. ② 데이터와 프로그램 소스를 공개하여 전문 소프트웨어 개발 업체로 하여금 국민들이 편히 사용할 수 있는 검색 프로그램을 개발하여 장착하도록 유도한다.
 

1. 사업명 
한민족 언어 정보화 
2. 연구의 목적 
한국어 정보화를 위한 중장기 발전 계획으로 수립된 21세기 세종 계획의 목표는 한국어와 한글을 바탕으로 하는 정보 사회의 건설에 있다. 이를 위해서, 
(1) 세계 수준의 한국어 기초 언어 자료 기반 구축을 통한 한국어 정보화 
(2) 표준화된 전자 사전 구축을 통한 한국어 체계화 
(3) 한민족 언어 정보화를 통한 한국어 세계화 
(4) 언어 정보화와 관련된 규격 및 도구의 체계적 정리를 통한 한국어 표준화를 실현한다는 네 가지 목표를 설정하고 있다. 
이 연구는 위에서 제시한 21세기 세종 계획의 네 가지 목표를 실현하기 위하여 설정된 ‘국어 기초 자료 구축’, ‘전자 사전 개발’, ‘한민족 언어 정보화’ 등의 분야 중에서, ‘한민족 언어 정보화’ 분야에 관한 것이다. 그리고 1998년-2007년(10년간)까지의 장기 발전 계획 중에서, 2004년-2007년(4년간)까지의 제3단계 2차년도(2005년)의 계획을 실행하는 작업이다.
지금까지 ‘한민족 언어 정보화’ 분과에서는 1998년부터 2000년까지 제1단계 사업을 완료하였다. 두 가지 중요한 사업을 실행하였는데, 그 중에서 하나는 ‘국어 어문 규정 검색 프로그램’을 개발한 것이고, 다른 하나는 ‘남북한 언어 비교 사전’을 구축한 일이었다. 
제2단계 1차년도인 2001년에 시행한 사업은 ‘남한 방언 검색 시스템 개발’, ‘국어의 로마자 표기법 검색 시스템 개발 및 국어의 로마자 표기 변환 프로그램 개발’, ‘남북한 이질화된 언어 검색 시스템 개발’, ‘한민족 언어 검색 통합 프로그램 1 개발’이었다. 
그 결과, ‘한글 맞춤법 검색 시스템’, ‘표준어 규정 검색 시스템’, ‘외래어 표기법 검색 시스템’, ‘국어의 로마자 표기법 검색 시스템’을 개발하여 일차적으로 ‘국어 어문 규정 검색 프로그램’을 완성하였다. 그리고 ‘남북한 언어 비교 사전 구축’ 사업에서는 기초 어휘 10,000개를 선정하여 표기, 음운, 어휘, 문법 사항 등을 정밀하게 비교하여 남북한 기초 어휘가 매우 동질적이라는 점을 밝힐 수 있게 되었다. 또한 ‘남북한 이질화된 언어 검색 시스템 개발’ 사업에서는 북한에서만 쓰이는 어휘 3,000개를 검색할 수 있도록 제시하였다. ‘한국 방언 검색 시스템 개발’ 사업에서는 ‘남한 방언 검색 시스템’을 개발하여 이미 나와 있는 방언 사전과 방언 자료를 지도와 함께 쉽게 검색할 수 있도록 시스템을 개발하였다. 이제까지 개발된 모든 검색 시스템을 통합하여 ‘한민족 언어 통일을 위한 검색 통합 프로그램1’을 개발하여 모든 국민들이 자유롭게 검색할 수 있도록 프로그램화 하였다. 
그리고 2002년에 시행한 사업은 1) 한민족 정서법 변환 프로그램 개발을 위한 기초 연구, 2) 북한 방언 검색 시스템 개발, 3) 국어 어휘의 역사 검색 시스템(1) 개발, 4) 한민족 언어 통일을 위한 검색 통합 프로그램(2) 개발이었다. 
‘한민족 정서법 변환 프로그렘 개발을 위한 기초 연구’에서는 북한의 자료를 남한의 정서법으로 변환시키는 프로그램을 개발하는 데에 필요한 기초적인 사업을 추진하였다 . ‘북한 방언 검색 시스템 개발’에서는 ‘한국 방언 검색 시스템 개발’을 위한 2차년도 사업으로, 북한의 함북, 함남, 평북, 평남, 황해, 강원도 미수복 지역 5개 군, 경기도 미수복 지역 2개 군에서 사용되는 방언을 검색할 수 있는 시스템을 개발하였다. ‘국어 어휘의 역사 검색 시스템 개발’에서는 현대 국어의 어휘 중에서 약 1,000개의 일상 어휘를 선택하여 그 어휘들 각각의 어원 정보와 표기법 및 형태의 변화, 음운 변화, 의미 변화의 과정을 문헌 자료에 대한 철저한 실증적 자료를 제시하였다. 그리고 ‘한민족 언어 통일을 위한 검색 통합 프로그램 개발’에서는 한민족 언어 정보화 분과에서 개발한 모든 검색 시스템을 통합하여 국민들이 원하는 한국어 정보를 쉽게 검색할 수 있도록 그 프로그램을 완성하였다. 2002년도에 개발한 ‘북한 방언 검색 시스템’을 세종 계획 제2단계 1차년도인 2001년에 개발하였던 ‘남한 방언 검색 시스템’과 ‘한국 방언 검색 프로그램’으로 통합하였으며, ‘한민족 정서법 변환 프로그램’과 ‘국어 어휘의 역사 검색 프로그램’을 통합하였다. 그리고 여기에 이미 개발한 모든 프로그램을 통합하여 종합 프로그램(2)로 만들었다 
2003년에 시행한 사업은 ‘한민족 정서법 변환 프로그램 개발을 위한 기초 연구’, ‘중국 및 기타 지역 방언 검색 시스템 개발을 위한 기초 연구’, ‘국어 어휘의 역사 검색 시스템(2) 개발을 위한 기초 연구’, ‘한민족 언어 정보 검색 통합 프로그램 개발’이었다. 그리하여 ‘한민족 정서법 변환 프로그램 개발을 위한 기초 연구’에서는 정서법 변환 프로그램에 필요한 데이터베이스를 제공하여 실제로 프로그램을 제작하였다. ‘중국 및 기타 지역 방언 검색 시스템 개발을 위한 기초 연구’에서 개발한 프로그램에서는 남한의 방언과 북한의 방언 그리고 기타 세계의 다른 지역에서 사용하고 있는 한국어 방언을 검색할 수 있도록 하였다. ‘국어 어휘의 역사 검색 프로그램(2) 개발을 위한 기초 연구’에서는 국어 어휘 역사에 관한 정보를 컴퓨터 프로그램을 통하여 국민들에게 제공하여 국민들의 국어 정보화에 기여함은 물론 잊혀져만 가는 국어 어휘에 관한 역사적 사실을 밝혀 줌으로써 국어의 보존에도 크게 기여하게 하였다. ‘한민족 언어 정보 검색 통합 프로그램 개발’에서는 2003년에 한민족 언어 정보화 분과에서 구축한 데이터베이스를 이용하여 검색 시스템들을 개발하였고 또 지금까지 개발한 모든 검색 시스템들을 통합하여 국민들이 원하는 한국어 정보를 쉽게 검색할 수 있도록 프로그램을 완성하였다. 2003년도에 통합한 프로그램들은 ‘한민족 정서법 변환 프로그램’, ‘국어의 어휘의 역사 검색 프로그램’, ‘한국 방언 검색 프로그램’이다. ‘한민족 정서법 변환 프로그램’은 2003년도에 개발한 ‘남한 정서법을 북한 정서법으로 변환하는 프로그램’에 2002년도에 개발한 ‘북한 정서법을 남한 정서법으로 변환하는 프로그램’을 통합하였다. ‘국어의 어휘의 역사 검색 프로그램’은 2002년에 개발한 프로그램의 내용을 확충하였다. ‘한국 방언 검색 프로그램’은 2001년에 개발한 ‘남한 방언 검색 시스템’, 2002년에 개발한 ‘북한 방언 검색 시스템’, 2003년에 개발한 ‘중국 및 기타 지역 방언 검색 시스템’을 통합하였다. 
2004년에 시행한 사업은 ‘문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구, 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구, 한국 전통 문화 어휘 검색 프로그램 개발을 위한 기초 연구, 한민족 언어 정보화 검색 통합 프로그램 개발이었다. 
2005년도의 ‘문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구’의 목적은 방언에 관심이 있는 연구자들과 일반 국민들이, 잘 알려진 문학 작품에 나타난 방언의 뜻과 예문 및 언어적 특징을 자세히 알 수 있도록 데이터베이스를 작성하여 제공하는 데 일차적인 목적이 있다. 그간 잘 알려진 문학 작품 임에도 불구하고 특징적인 지역 방언이 나오는 작품을 이해하는 데는 매우 큰 어려움이 있었다. 이 사업에서는 연차적으로 이러한 문제를 해결하면서 방언에 대한 이해의 폭을 넓혀가고자 한다. 특히 앞으로 국어 사전에 방언이 자세하게 수록되어야 하고, 각 지역의 방언 사전이 편찬되어야 하는데 이러한 사전 편찬에도 큰 도움이 되고자 이 연구를 진행하였다. 무엇보다도 친근한 작가가 쓴 지역을 대표하는 특징적인 방언을 해설하여 국민들의 방언에 대한 이해에 큰 도움을 줄 것으로 판단된다.
2005년도의 ‘국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구’의 목적은 국어 어휘의 역사 검색 시스템을 제작하는 데에 필요한 데이터베이스를 구축 하는 것이다. 그리하여 제작된 시스템에서 국민들에게 국어 어휘에 관한 역사 정보를 제공하여 국어에 관한 지식과 이해의 폭을 넓힘으로써 언어 생활을 더욱 윤택하게 하고, 국어의 정확한 사용을 통하여 국민들의 의사소통의 정확성과 신속성을 제고함을 그 목적으로 한다. 아울러 이러한 국어 어휘 역사에 관한 정보를 컴퓨터 프로그램을 통하여 국민들에게 제공하여 국민들의 국어 정보화에 기여함은 물론 잊혀져만 가는 국어 어휘에 관한 역사적 사실을 밝혀 줌으로써 국어의 보존에도 크게 기여하게 될 것이다. 따라서 이 연구는 거시적으로는 한민족 언어의 정보화를 확충시켜 나아가고, 미시적으로는 국민들의 국어에 대한 자긍심을 갖게 함으로써 국어 발전의 기틀을 마련하는 데에 그 목적이 있는 것이다. 
2005년도의 ‘한민족 언어 정보 통합 검색 프로그램 개발’의 목적은 한민족 언어 정보화 분과에서 구축한 데이터베이스를 이용하여 검색 프로그램들을 개발하고 또 개발한 모든 검색 프로그램들을 통합하여 국민들이 원하는 한국어 정보를 쉽게 검색할 수 있도록 그 프로그램을 완성하는 데에 있다. 
2005년도에는 ‘문학 작품에서 사용된 방언 검색 프로그램’, ‘국어 어휘의 역사 검색 프로그램’을 웹버전으로 만들었다. ‘국어의 어휘의 역사 검색 프로그램’은 2004년에 개발한 프로그램의 내용을 확충하였다. 또한 ‘문학 작품에서 사용된 방언 검색 프로그램’은 2004년도에 개발한 프로그램의 내용을 확충하였다. 
3. 연구의 필요성 
‘한민족 언어 정보화’는 21세기 세종 계획 제 3 단계(2004년-2007년)의 2차 년도인 2005년 사업으로서 다음의 세 가지를 시행하게 되었다. 
(1) 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구
(2) 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구 
(3) 한민족 언어 정보 검색 통합 프로그램 개발 
(1)의 연구 결과로 제작한 프로그램은 문학 작품에 나타난 각 지역의 난해한 방언의 뜻과 용례 및 언어적 특징을 보여주기 때문에 일반 국민들이 방언을 통하여 한국어를 더욱 깊이 이해하는 데 필요한 것이다. 
(2)의 연구 결과로 제작한 프로그램은 국어의 어휘의 변천 과정과 어원에 대하여 궁금증을 가지고 있는 국민들의 욕구를 해소하는 데에 필요한 것이다. 
(3)는 (1), (2)의 프로그램을 통합하여 언어 대중들이 언어 생활에 직접 편리 하게 이용할 수 있도록 하기 위한 필요성에 의해 정밀한 웹 프로그램을 개발하는 것이다. 
3.1. 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구 
흔히 국어 사전을 편찬할 때, 각종 문학작품을 통하여 예문을 추출한다. 작가들의 한국어에 대한 감각을 비교적 높이 평가하기 때문일 것이다. 마찬가지로 문학작품에 쓰인 각 지역의 방언은 언어에 대한 감각이 있는 작가들이 비교적 상세하게 또는 안정되게 묘사하고 있기 때문에 방언으로서 가치가 있는 것이다.
그러나 문학 작품을 보거나 가르칠 때에 평소에 들어보지 못한 방언의 출현으로 인하여 시와 소설을 제대로 이해하기 어려웠던 것은 사실이다. 심한 경우에는 전혀 해독이 안 되어 오랫동안 궁금한 채로 해독을 미루어 온 어휘들도 많다. 전문가들조차도 해독이 안 되는 작품을 일반인들이 읽고 이해할 수는 없는 것이다. 이러한 어휘들은 대체로 방언인 경우가 많아서 방언 사전이 변변히 마련되어 있지 않은 상황에서 우리는 많은 어려움을 갖고 있다. 
방언은 그 특징상 현지인에게 채록을 해야 한다. 그러나 채록을 하려면 많은 시간과 인력 그리고 경비가 소요된다. 현지 조사에서 채록한 자료들은 정제되지 않아서 군더더기가 많고 내용이 제대로 전달되지 않는 문장이 많다. 따라서 전문 인력을 동원하여 자료를 새롭게 다듬어야 한다. 반면에 작품에 쓰인 방언들은 작가에 의해 이미 정제된 방언 어휘나 문장들이기 때문에 비교적 안전하게 사용할 수 있는 것이다. 
최근 지역 문화에 대한 관심이 고조되고 있는 이 시점에서 방언에 대한 관심은 최고조에 달한 것 같다. 지역의 방송과 신문, 시민들은 방언을 문화의 일부로 인식하고 아주 드러내놓고 자기 지역의 방언을 수없이 많이 사용하고 있다. 그런가 하면 자기 지역의 방언이 나오는 중요한 문학 작품과 작가의 업적을 선양 하는 많은 사업을 시행하고 있다. 
문학 작품에 나오는 방언에 대한 접근은 주로 국어학자들의 몫으로 돌리고 있다. 방언이 언어이기 때문에 국어학 전공자가 다루어야 한다는 사고방식이다. 그러나 문학 작품에서 방언은 작품의 문학성은 물론, 인물, 배경, 이야기 전개를 해석하는 데 매우 중요한 요소이기 때문에 국어학과 국문학 전공자들이 공동으로 다루어야 할 중요한 요소인 셈이다. 따라서 연구에 있어서 공통분모가 많은 부분이기도하다.
이 사업에서는 3개년 계획으로 약 2,100 개의 방언 어휘를 중심으로 진행하고자 한다. 일차년도에는 우선 ‘전라, 경상, 충청, 강원, 제주’를 중심으로 지역의 대표적인 방언을 700여 개를 해설하였다. 금번 이차년도에는 ‘이북, 경기’를 포함하여 꼭 필요한 작품을 선별하여 700 개를 해설하였다. 사실상 이 사업으로 문학 작품의 방언을 통하여 각 지역의 방언적 특징을 드러내기는 쉽지 않지만 그래도 대표적인 방언, 또는 난해한 방언을 해설하는 것이기 때문에 연구자는 물론 일반 국민들에게도 매우 유익할 것이다. 
그간 이러한 사업이 시행된 바가 없기 때문에 앞으로 방언 사전을 편찬하거나 방언 어휘를 해설할 때 하나의 표준이 될 것으로 생각한다. 
3.2. 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구(4) 
패권주의에 대항하여 민족주의가 발전하게 되면서 국민들은 우리의 것에 대한 관심이 높아진다. 그 중에서도 가장 높은 관심을 보이는 분야는 우리 문화재에 대한 새로운 관심과 지나간 시기의 인물에 대한 재평가, 그리고 국어에 대한 관심이라고 할 수 있다. 국어에 대한 관심 중에서 가장 높은 것은 국어 어휘 어원에 관한 것이다. 
어휘는 한 사회의 문화적인 소산이다. 그래서 한 어휘의 형태로부터 그 어휘가 지니는 의미에 이르기까지 그 어휘가 사용되던 사회의 모습을 반영하고 있음이 일반적이다. 이러한 관점에서 볼 때, 어휘는 다른 문화적인 현상과 완전히 독립된 상태에서 파악하기 어렵다. 특히 어휘 형태와 의미의 변화가 단순히 음운론적인 규칙이나 단어 형성 규칙, 그리고 의미 변화의 규칙에 의해서만 이루어진다고 단언할 수 없다. 
20세기 말부터 우리 나라는 국제적 관계와 사회적 관계로 인하여, 많은 외래어 및 외국어가 홍수처럼 쏟아져 들어왔고, 그로 인해 우리 국민들의 언어 생활은 우리의 고유어와 한자어뿐만 아니라 수많은 외래어 및 외국어의 범람으로 극심한 언어의 혼효로 인한 부작용이 심한 상태에 있다. 특히 영어의 영향은 절대적 가치를 지니고 사회에서 중요한 요소로 자리잡고 있다. 그러나 이러한 빠른 변화에 대해 일반 국민들은 그 반작용으로 오히려 우리 국어를 더 살려 쓰자는 적극적인 자세로 대웅하고 있는 것으로 판단된다. 한편에서는 외국어 또는 외래어를 중시하는가 하면, 한편에서는 이들을 우리 국어로 바꿀 뿐만 아니라, 더 적극적으로는 우리가 지금까지 써 왔으면서도 잊어버리거나 사라진 어휘들을 되살려 쓰려는 노력까지도 보이고 있다.
그래서 최근에 많은 국민들이 국어 어휘의 역사 및 어원 정보에 대해 큰 관심을 보이고 있다. 시중 서점에는 국어의 어원 정보에 대한 서적이 상당수 나와 있다. 국어 어원 사전이 여러 곳에서 편찬되고, 어휘의 어원에 대한 관심을 가지고 있는 학자들이 어원학회를 결성하는 등의 현상은 곧 국어 어휘의 어원 및 역사에 대한 관심이 고조되고 있음을 증명하는 것이다. 게다가 인터넷상에서도 국어의 어원에 대한 정보가 넘쳐나고 있다. 그러나 안타깝게도 이러한 국어의 어휘 역사에 대한 정보는 전문가들로서 볼 때, 매우 부정확한 지식으로 말미암아 국민들에게 민간어원설 수준의 정보밖에 제공하지 못하는 실정에 있다. 게다가 각종의 국어 사전에도 그 어휘의 역사적 정보를 제공하여 주지 않음으로써, 국어에 대한 국민들의 관심을 충족시키지 못하는 실정에 있다고 할 수 있다. 
지금까지 국어의 어원이나 그 역사에 대하여 연구한 업적은 무척 많으나, 실제로 문헌이나 실제적 증거에 의하여 기술한 것은 몇몇 논저에 국한되어 있는 실정이다. 따라서 국어에 대한 부정확한 지식으로 국어에 대한 지식과 이해가 잘못 전달되어, 우리의 어문 생활을 발전시키지 못하고 있다. 이러한 점을 감안한다면, 가능하면 상당수의 국어 어휘의 역사를 기술하는 것이 마땅하겠으나, 실제로 역사 말뭉치에서 추출하여 그 어휘의 역사를 기술할 수 있는 어휘는 그리 충분한 편이 못된다. 따라서 1차 년도와 2차 년도, 3차 년도,4차 년도를 통하여 약 4,000 개의 어휘의 역사를 기술하고 프로그램으로서 검색이 가능하도록 한다. 그 단어는 국민들이 그 어원에 대하여 많은 관심을 가지고 있는 일상 어휘들을 선별하도록 한다.
이러한 작업은 이미 일본에서는 국립국어연구소에서 오래 전에 이루어져 있는 것으로 알려져 있다. 그리하여 어느 한 어휘를 검색하면 그 어휘가 어느 문헌에서 처음 사용되었으며, 어떠한 변화 과정을 거쳐 오늘날에는 어떻게 사용되고 있는가를 제시하여 주고 있다. 그렇지만 우리나라에서는 아직까지 이러한 작업이 체계적으로 이루어진 적이 없다. 왜냐 하면 국어의 역사에 대한 전문적인 지식을 갖추고 있지 못한 연구자가 많지 않기 때문이다 
이 연구는 이러한 점에서 매우 의미 있는 작업이라고 생각한다. 이 연구에 참여하는 연구진들은 국어 사전 편찬의 경험이 풍부하거나, 국어사 연구 및 어휘론 연구의 전문가이며 또한 권위자들로서 구성되어 있어서, 연구 결과의 신빙성이 높을 것으로 기대된다.
3.3. 한민족 언어 정보 검색 통합 프로그램 개발 
국어학자들에 의해서 수집되고 정리된 국어 자료들을 국민들이 널리 공유하고 사용하기 위해서는 검색 통합 프로그램이 개발되어야 한다. 이를 통하여 국민들이 올바른 국어 생활을 영위하고, 국어에 대한 인식과 이해를 높일 것이다. 
1998년에서 2004년까지 개발된 기존 프로그램들과 2005년에 개발한 2개의 프로그램을 모두 통합한 프로그램을 인터넷에서 검색이 가능하도록 웹 검색 프로그램으로 개발한다. 
(1) 문학 작품에서 사용된 방언 검색 프로그램 
① 3단계 1차년도(2004년) : 700개 어휘 
② 3단계 2차년도(2005년) : 700개 어휘 
(2) 국어 어휘의 역사 검색 프로그램 
① 2단계 2차년도(2002년) : 1,000개 어휘 
② 2단계 3차년도(2003년) : 1,000개 어휘 
③ 3단계 1차년도(2004년) : 1,000개 어휘 
④ 3단계 2차년도(2005년) : 1,000개 어휘 
(3) 한국 전통 문화 어휘 검색 프로그램 
① 3단계 1차년도(2004년) : 300개 어휘 
(4) 어문 규정 통합 검색 프로그램
① 1단계 1차년도(1998년) : 한글 맞춤법 검색 프로그램
② 1단계 2차년도(1999년) : 표준어 규정 검색 프로그램
③ 1단계 3차년도(2000년) : 외래어 표기법 검색 프로그램 
④ 2단계 1차년도(2001년) : 국어의 로마자 표기법 검색 프로그램 
(5) 남북한 언어 비교 사전 검색 프로그램
① 1단계 1차년도(1998년) : 1,000개 어휘
② 1단계 2차년도(1999년) : 4,000개 어휘
③ 1단계 3차년도(2000년) : 5,000개 어휘 
(6) 남북한 이질화된 언어 검색 프로그램
①  2단계 1차년도(2001년) : 3,000개 어휘 
(7) 한국 방언 검색 프로그램 
① 2단계 1차년도(2001년) : 남한 방언 검색 프로그램
② 2단계 2차년도(2002년) : 북한 방언 검색 프로그램 
③ 2단계 3차년도(2003년) : 중국 및 기타 지역 방언 검색 프로그램
(8) 남북한 정서법 변환 프로그램 
① 2단계 2차년도(2002년) : 북한 정서법을 남한 정서법으로 변환하는 프로그램
② 2단계 3차년도(2003년) : 남한 정서법을 북한 정서법으로 변환하는 프로그램
이와 같은 프로그램들이 통합된다면 한 단어에 대해서 어문 규정, 남북한 어휘 비교, 방언, 어휘의 역사, 남북한 정서법 등에 관한 다양한 정보를 얻을 수 있다. 
이러한 자료의 제공은 한국어정보처리 프로그램을 개발하려는 산업체들에게 매우 귀중한 정보를 제공하게 되며, 좀 더 정밀한 프로그램을 개발할 수 있는 토대를 제공하게 될 것이다. 
‘문학 작품에서 사용된 방언 검색 프로그램’은 문학 작품에서 사용된 수많은 귀한 방언들에 대한 정보를 제공함으로써 문학 작품의 내용과 의미를 정확하게 이해하게 해 줄 것이다. 
‘국어 어휘의 역사 검색 프로그램’은 국어 어휘의 어원을 밝히고 변천사를 정리하는 작업으로서, 그동안 궁금해 하던 어휘의 뿌리를 알려줄 것이다. 
4. 연구 내용 및 결과물 
4.1. 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구 
‘문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구’ 분야에서는 연차별로 다음과 같이 개발하도록 계획되어 있다. 
(1) 2004년 : 700 단어의 방언 검색 프로그램 개발 
(2) 2005년 : 700 단어의 방언 검색 프로그램 개발 
(3) 2006년 : 700 단어의 방언 검색 프로그램 개발 
지금까지 출판된 방언이 많이 사용된 문학 작품을 선별한다. 시와 소설, 구비 문학대계, 희곡 작품을 대상으로 한다. 문학 작품 외에 한국정신문화연구원에서 발행한 ‘한국 구비문학 대계’와 ‘한국 방언 자료집’을 활용한다. 이 가운데에서 해당 지역의 방언이 많이 사용된 작품을 중점적으로 검토하여 어휘와 용례를 추출한다. 
해당 지역 방언이 아주 많기 때문에 몇 가지 기준을 제시하여 해당 지역을 잘 드러낼 수 있는 특징적인 방언을 뽑아낸다. 
4.2. 국어 어휘의 역사 검색 시스템4 개발을 위한 기초 연구 
‘국어 어휘의 역사 검색 시스템’ 분야에서는 연차별로 다음과 같이 개발하도록 계획되었다. 
1) 2002년 : 1,016 단어의 어휘 역사 검색 시스템 개발 
2) 2003년 : 1,037 단어의 어휘 역사 검색 시스템 개발 
3) 2004년 : 1,071 단어의 어휘 역사 검색 시스템 개발 
4) 2005년 : 1,066 단어의 어휘 역사 검색 시스템 개발 
2005년도에는 2002년에서 2004년까지 개발한 모든 프로그램을 통합하여 하나의 시스템으로 통합하였다. 그리하여 상당수의 한국어 어휘의 어원 정보 및 그 역사의 검색이 가능하게 되었다. 2005년도에는 2002-2004년도에서 작성한 항목을 제외하고, 1,066개의 표제항을 조사하였으며, 이를 15세기부터 20세기 및 방언형에 이르기까지의 형태, 음운, 의미 변화의 내용을 일반인들이 이해하기 쉽게 기술하였다. 개발한 프로그램은 2005년의 ‘한민족 언어 검색 통합 프로그램’에 포함 되었다. 
4.3. 한민족 언어 정보 검색 통합 프로그램 개발 
(1) 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구
(2) 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구 
(1), (2)를 웹 버전으로 개발한다 한편, 이미 개발한 어문 규정 통합 검색 프로그램, 남북한 언어 비교 사전 검색 프로그램, 남북한 이질화된 언어 검색 프로그램, 한국 방언 검색 프로그램은 2005년에 개발한 프로그램들과 통합하여 인터넷에서 검색이 가능하도록 웹 검색 프로그램으로 개발한다.
4.4. 연구 결과물 
1. 연구보고서(종이 책)200부 
2. 소스 시디 10개
5. 연구 결과의 활용 
5.1. 문학 작품에서 사용된 방언 검색 프로그램 개발을 위한 기초 연구 
① 국민들이 그간 궁금하게 생각했던 방언 어휘에 대해 정확한 뜻을 알 수 있다. 
② 방언 연구에서 소홀히 다룬 문학 작품의 방언을 해설하는 것이므로 새로운 영역을 개척하는 것이 될 수 있다. 
③ 중 ? 고등학교와 대학교의 문학 교육에 큰 도움이 될 것이다. 
④ 국어 사전과 각 지역의 방언 사전 편찬에 큰 도움이 될 것이다. 
⑤ 표준어의 사정에 방언을 적극 활용하여 보다 많은 복수 표준어를 만들 수 있다. 
⑥ 각 지역의 방언을 표준어와 관련시키는 프로그램을 개발하거나 기타 정보 산업 및 문화 산업에 활용할 수 있을 것이다. 
5.2. 국어 어휘의 역사 검색 프로그램 개발을 위한 기초 연구 
이 연구 결과는 연구 당해년도의 결과물을 무료로, 그리고 즉각적으로 공개할 수 있다. 따라서 일반 국민뿐만 아니라 한국어를 다루는 모든 교육기관(초 ? 중고 관공서, 대학, 컴퓨터 회사 등)이나 외국의 한국어 및 한국학 관련 연구소나 학교에서 즉각적으로 활용할 수 있다. 
게다가 현재 인터넷상에서 국어의 역사정보(역사정보라기보다는 오히려 어원정보라고 할 수 있다)를 제공해 주고 있는 각 홈페이지에서 이를 내려받아서 활용함으로써, 21세기 세종계획을 통한 국어정보화에 대한 인식을 높일 수 있다. 
그리고 이 프로그램은 옛한글 및 한자로 표기되기 때문에, 아직까지 한글 유니코드를 사용하지 않는 사람들에게 유니코드의 필요성을 알리는 중요한 역할을 할 수가 있으며, 아직까지 옛한글을 사용하는 홈페이지나 프로그램이 적은 형편 이어서 이들을 표기하기 위한 유니코드 사용에 촉매제 역할을 할 수도 있을 것 이다. 
또한 한민족 언어 정보화 사업에서 ‘한글맞춤법 검색기, 표준어 검색기, 외래어 표기법 검색기, 로마자 표기 검색기’와 같은 프로그램을 통하여 국민들에게 현대 국어에 대한 인식을 높임과 동시에 국어의 역사에 대한 인식도 함께 제시함으로써, 국민들의 국어에 대한 이해도를 확대시켜 나아가게 할 수 있다. 이것은 곧 국민들로 하여금 국어에 대한 사랑을 높이는 계기를 마련할 수 있게 될 것이다. 
5.3. 한민족 언어 정보 검색 프로그램 개발 
① 국어 정보화에 있어서 데이터베이스를 활용한 프로그램 개발 기술을 발전시켜 학자나 전문가들이 쉽게 활용할 수 있도록 한다. 
② 데이터와 프로그램 소스를 공개하여 전문 소프트웨어 개발 업체로 하여금 국민들이 편히 사용할 수 있는 검색 프로그램을 개발하여 장착하도록 유도한다.
제작일 2005-12-14
발행년도 2005년

연구결과 평가 및 활용보고서

과제정보
평가결과서 미등록
활용결과 보고서 ※ 등록되지 않았습니다. (영 제52조에 따라 연구 종료 후 6개월 이내 등록)

공공누리 정보

공공누리
저작물
민간이용 동의
비동의 사유

연구결과 만족도

연구결과 만족도
참여인원 : 0명 점수: 0
연구결과 만족도 평가정보
no data found.

만족도 평가

연구결과 만족도 평가정보
*비밀번호