다국어 언어/음성 지식 데이터베이스(db)가 국내 연구진에 의해 구축됐다.

etri(한국전자통신연구원, 원장 최문기)는 2006년부터 2년여에 걸쳐 구축한 '다국어(영어, 중국어, 일본어) 언어/음성 지식 데이터베이스(db)'를 국내 산업체, 대학 및 연구기관을 대상으로 배포한다고 6일 밝혔다.

이 데이터베이스는 지능형 로봇, 차세대pc, 텔레매틱스, 디지털홈, 디지털콘텐츠, 이동통신 등 it839 신성장동력산업용 차세대 음성 인터페이스의 핵심 요소기술 개발에 활용될 예정이다.

언어/음성처리 기술은 정부의 신성장동력산업 응용분야의 사용자 인터페이스를 위한 공통 핵심기술로 그 동안 국내 언어/음성처리 기술개발 업체에서는 음성/언어 자원 db 구축에 많은 시간과 비용을 투여해 왔다.

특히, 국내업체간 중복 구축으로 인한 고비용 저효율의 문제와 다국어 음성/언어db의 부재는 외국 경쟁업체에 비해 국내 업체들의 경쟁력을 약화시키는 주요 원인으로 지적됐었다.

이번에 구축된 데이터베이스는 음성/언어기술 이용 상황에 따른 발음패턴, 어휘, 문장 구조 등의 변화와 주변 환경 및 관련 기기의 다양한 특성을 고려해 총 40여종을 외국 현지에서 수집하여 구축한 것이 특징이다.

etri 박상규 음성/언어정보연구센터장은 "다국어 언어/음성 db 구축으로 관련 분야의 연구개발 진입장벽을 해소할 수 있다"면서 "언어/음성 분야 산업 발전과 관련 연구의 저변을 확대할 수 있을 것"이라고 말했다.

/대전=조명휘 기자 joemedia@



저작권자 © 충청일보 무단전재 및 재배포 금지