이제는 새롭게 등장하는 전문용어, 신조어 등의 영어 표제어도 네이버에서 발 빠르게 확인할 수 있다.
웹 문서 내 표제어 추출은 '지식백과', '전문정보', '뉴스' 등 양질의 전문 정보들을 담은 웹 문서를 그 대상으로 한다.
이로써 이용자들은 그 동안 업데이트가 늦어 확인하기 어려웠던 전문 영역의 영어 신조어 등의 다양한 표제어까지 네이버 사전을 통해 보다 발 빠르게 확인할 수 있다.
특히 네이버는 1차로 자동 추출된 표제어 제공으로 인한 오류를 최소화하기 위해 ▲ 해당 표제어의 노출 빈도 정보를 통한 신뢰도 점검 ▲ 영어-한글 단어 간의 띄어쓰기 점검을 통한 오류 제거 ▲ 여러 단어에서의 단순 중복 사용 정도 점검 등 다중의 필터링 추가 적용했다.
지난 2009년 종이 사전 중심의 30만 건에 불과하던 네이버 영어사전의 표제어 수는 다양한 영역의 전문 용어 등을 꾸준히 업데이트한 결과 지난해 12월 10배 가까운 300만 건까지 확보하게 됐으며, 웹 문서에서의 추출 기술을 활용해 현재는 322만 건의 표제어를 제공하고 있다.
새로운 표제어 추출 기술 적용 이후 인터넷에서 찾기 어려웠던 전문용어 등의 표제어를 보다 쉽게 접할 수 있다는 점에서 이용자들로부터 호평을 얻고 있으며, 이와 함께 베트남, 터키, 러시아어 등 소수 이용 언어에 대한 사전 서비스 정교화 및 새로운 언어의 사전 출시 기대감까지 보이고 있는 상황이다.
NHN 김종환 사전&전문정보실장은 "지속적으로 다양한 영역의 표제어를 추가한 결과 3백만 건 이상의 영어 표제어를 확보하게 됐으며, 웹 문서에서의 표제어 추출을 통해 이용자들에게 한 단계 더 진화된 영어사전 서비스를 제공하게 됐다"고 밝혔다. 송진현 기자 jhsong@sportschosun.com