
한국어 접사의 생산성 연구
김한샘 지음머리말
어휘 목록을 처음 봤던 기억을 떠올려 본다. 1994년 여름부터 《연세한국어사전》을 만드는 한국어 사전편찬실에서 학부 조교로 일을 하게 되면서 말뭉치 빈도에 기반한 사전 표제어 후보 목록을 접하게 되었고, 다음 해에는 사전 원고 작성 목록 관리 일을 하게 되었다. 지금은 사라진 폭스프로라는 프로그램으로 사전 표제어 목록을 관리하면서 언젠가는 직접 표제어를 선정하고 내용을 기술하는 일을 해 보고 싶다고 생각하였다. 이후 사전 원고 집필 작업에 참여하게 되면서 사전 표제어 후보 목록을 중심으로 기술할 표제어 목록을 선정하는 일이 난도가 높다는 것을 알았고, 파생어 기술의 범위를 정하는 것은 특히나 어려웠다. 그렇게 파생어와 접사에 대한 고민이 시작된 후 시간이 흘러 이에 대해 다시 진지하게 생각하게 된 것은 국립국어원에서 국어 어휘 등급 평정을 위한 어휘 조사 업무를 맡으면서였다. 등급별로 국어 어휘를 분류할 때 단위가 될 어휘를 확정하려면 단어의 일부로 어휘 파생에 관여하는 것과 구 단위와 결합이 가능하여 별도로 처리해야 할 것으로 접사를 구분해야 한다. 오랜 시간 국어 어휘 평정 연구를 진행하면서 자연스럽게 만나게 된 것이 생산성이라는 개념이었다. 영어 어휘를 대상으로 연구되어 온 개념을 어떻게 한국어에 적용할지 고민하는 과정이 쉽지는 않았지만 살아 있는 말뭉치를 분석하며 다양한 방법론을 적용하는 과정은 자료를 보는 눈을 키우는 계기가 되었다. 다년간 신어 조사를 하면서 신어 내부의 구조와 새로운 말이 만들어지는 과정에 집중하게 된 것이 여기에 살을 보태었다. 시간이 흘러 이제는 인공지능이 파생어와 접사를 어떻게 인식할까에 대한 고민을 하는 시대가 되었다. 이 책은 꾸준히 고민해 온 접사와 파생어에 대한 설익은 연구를 책으로 펴내는 쉼표의 지점이다. 미진한 연구가 부끄럽지만 앞으로의 연구에 동력으로 삼고자 한다.
이 책이 세상에 나오기까지 애써 주신 한국문화사와 새연세말뭉치를 연구에 활용할 수 있도록 해 주신 서상규 선생님, 지난한 데이터 분석 작업으로 집필에 도움을 준 강예지, 김희재, 박서윤, 비립, 이진 선생님께 감사드린다.
어휘 목록을 처음 봤던 기억을 떠올려 본다. 1994년 여름부터 《연세한국어사전》을 만드는 한국어 사전편찬실에서 학부 조교로 일을 하게 되면서 말뭉치 빈도에 기반한 사전 표제어 후보 목록을 접하게 되었고, 다음 해에는 사전 원고 작성 목록 관리 일을 하게 되었다. 지금은 사라진 폭스프로라는 프로그램으로 사전 표제어 목록을 관리하면서 언젠가는 직접 표제어를 선정하고 내용을 기술하는 일을 해 보고 싶다고 생각하였다. 이후 사전 원고 집필 작업에 참여하게 되면서 사전 표제어 후보 목록을 중심으로 기술할 표제어 목록을 선정하는 일이 난도가 높다는 것을 알았고, 파생어 기술의 범위를 정하는 것은 특히나 어려웠다. 그렇게 파생어와 접사에 대한 고민이 시작된 후 시간이 흘러 이에 대해 다시 진지하게 생각하게 된 것은 국립국어원에서 국어 어휘 등급 평정을 위한 어휘 조사 업무를 맡으면서였다. 등급별로 국어 어휘를 분류할 때 단위가 될 어휘를 확정하려면 단어의 일부로 어휘 파생에 관여하는 것과 구 단위와 결합이 가능하여 별도로 처리해야 할 것으로 접사를 구분해야 한다. 오랜 시간 국어 어휘 평정 연구를 진행하면서 자연스럽게 만나게 된 것이 생산성이라는 개념이었다. 영어 어휘를 대상으로 연구되어 온 개념을 어떻게 한국어에 적용할지 고민하는 과정이 쉽지는 않았지만 살아 있는 말뭉치를 분석하며 다양한 방법론을 적용하는 과정은 자료를 보는 눈을 키우는 계기가 되었다. 다년간 신어 조사를 하면서 신어 내부의 구조와 새로운 말이 만들어지는 과정에 집중하게 된 것이 여기에 살을 보태었다. 시간이 흘러 이제는 인공지능이 파생어와 접사를 어떻게 인식할까에 대한 고민을 하는 시대가 되었다. 이 책은 꾸준히 고민해 온 접사와 파생어에 대한 설익은 연구를 책으로 펴내는 쉼표의 지점이다. 미진한 연구가 부끄럽지만 앞으로의 연구에 동력으로 삼고자 한다.
이 책이 세상에 나오기까지 애써 주신 한국문화사와 새연세말뭉치를 연구에 활용할 수 있도록 해 주신 서상규 선생님, 지난한 데이터 분석 작업으로 집필에 도움을 준 강예지, 김희재, 박서윤, 비립, 이진 선생님께 감사드린다.
