발음 평가 정확도 97.15%...한국어 평가도 가능

스피치프로 버전2 평가항목 (좌상에서 시계방향으로)억양, 리듬, 음소, 강세 관련 평가 그래프 (사진=미디어랩)
스피치프로 버전2 평가항목 (좌상에서 시계방향으로)억양, 리듬, 음소, 강세 관련 평가 그래프 (사진=미디어랩)

음성 인식 관련 인공지능 전문 기업 미디어젠(대표 고훈)이 북미 표준 영어를 기준으로 발음을 평가해주는 솔루션 ‘스피치프로 버전2’를 21일 출시했다.

미디어젠 측은 “버전1은 음소 단위의 발음 정확도를 평가하는 것만 가능했던 반면 버전2는 영어 발음의 5요소인 발음 정확도, 억양, 강세, 리듬, 속도를 점수별로 수치화하도록 업그레이드했다”고 설명했다.

스피치프로 버전2는 발음의 5요소(발음정확도, 억양, 리듬, 강세, 멈춤구간)를 수치화한 백분율 점수를 AI 알고리즘으로 제공한다. 또한 북미 표준어를 쓰는 원어민 발음을 기준으로 비교해 ‘얼마나’ ‘어떻게’ 다른지 시각적 그래프로 보여준다.

미디어젠에 따르면 스피치프로 버전2는 언어학 전공 석박사들로 구성된 미디어젠 AI 에듀테크팀이 개발했으며, 전통적인 영어 교육 이론을 바탕으로 음성의 주요 특징과 영어 발음 학습 과정을 세분화해 모델을 설계했다. 

영어 발음의 정확도 평가를 중심으로 설계했던 ‘스피치프로 버전1’은 2021년 공인 인증 기관인 와이즈스톤에서 평가한 바에 따르면 발음 평가 엔진 정확도가 97.15%에 달했다. 미디어젠은 이와 관련해 총 3건의 국내 특허를 등록했으며, 이를 기반으로 버전2의 경우 버전1의 정확도 기준 평가 항목을 늘렸다.

심재우 미디어젠 이사는 “발음 5요소에 대해 체계적으로 점수를 산출하고 시각화가 가능하도록 하는 서비스는 국내에서 최초인 것으로 알고 있다”며 “기존 원어민 학습은 발음 교정을 해줄 교사가 필요했지만, 스피치프로를 활용하면 스스로 학습할 수 있을 것”이라고 말했다.

한편 미디어젠은 스피치프로 버전2가 2022년 정보통신산업진흥원의 AI 바우처 지원 사업 대상으로도 선정되면서 사업화 확대 기회를 얻었다.

또 스피치프로2에서는 한국어 발음 평가도 가능해, 최근 K-콘텐츠의 인기로 한국어를 가르치는 외국인 관련 기관이나 학원 등에서 수요가 많을 것으로 기대하고 있다.

이성관 기자 busylife12@aitimes.com

[관련 기사]  99% 정확도로 세계 1위 도전한다...QED, 농산물 생산예측 시장에 출사표
[관련 기사]  이미지 생성 AI 무료 배포했더니...몸값 1조원대로 '껑충'

키워드 관련기사
  • "진로 찾아드려요"...제네시스랩, 무료 AI 역량진단 제공
  • 도구 사용하는 AI 등장...진화 속도 빨라지나
  • 오픈AI, 오픈소스 다국어 음성인식 ‘위스퍼’ 공개