IT전문 시장조사업체 트렌드포스에 따르면 음성인식기술시장은 지난해 26억1000만달러(약 2조9297억원)에서 매년 44%씩 성장해 2021년에는 159억8000만달러(약 17조9375억원)에 이를 것으로 예측된다. 음성인식기술이 다양한 기기로 확산되면 시장 성장 속도는 더 빨라질 전망이다.
현재 이 분야에서 가장 앞선 기술을 보유한 기업은 아마존이다. 아마존은 2014년 음성인식 스피커 ‘에코’를 출시하면서 음성인식 인공지능(AI) 소프트웨어 ‘알렉사’를 선보였다. 알렉사는 출시 3년이 지난 현재 미국 음성인식 AI시장의 70%를 점유하고 있으며 이용할 수 있는 기능도 1만여개가 넘는다. 알렉사가 탑재된 에코는 지난해 총 520만대가 팔리면서 그 인기를 입증했다. 국내에서도 강남 등 일부지역에서 영어교육용 도구로 좋은 반응을 얻었다. 영어와 독일어만 지원함에도 그 인기는 다른 음성인식기술을 가뿐히 뛰어넘는다.
아마존 알렉사의 대항마로는 구글 ‘어시스턴트’가 꼽힌다. 구글은 어시스턴트의 이전 버전인 ‘구글 나우’에서 습득한 기술력과 노하우를 집약해 기능을 한층 업그레이드시켰다. 구글 어시스턴트에는 데이터를 축적해 스스로 학습하는 ‘머신러닝’기능이 포함됐다. 해외 IT전문매체 폰아레나는 구글 어시스턴트가 4년간의 머신러닝을 통해 인간의 언어를 95% 이상 이해할 수 있다고 설명했다. ‘생태계 확장의 명수’ 구글은 이 분야에서도 관련 기술을 개방하며 생태계 확장에 나섰다. 업계는 현재 전세계 1억개 이상의 디바이스에서 구글 어시스턴트가 구동 중인 것으로 분석한다.
글로벌 IT기업들의 음성인식 전쟁은 지난 5일(현지시간) 미국 캘리포니아 새너자이 매키너리 컨벤션센터에서 열린 ‘세계개발자대회(WWDC) 2017’에서 절정에 달했다. 이날 애플은 ‘시리’를 공개하면서 “더 인간다운 음성인식이 될 것”이라고 말했다. 시리는 아이폰, 맥북, 아이워치 등 애플이 생산하는 대부분의 제품에 탑재되는 음성인식기술이다.
◆AI·IoT 총아 ‘음성인식’
유수의 IT기업들이 너나할것 없이 음성인식기술 개발에 뛰어드는 건 AI와 사물인터넷(IoT)의 발달 때문이다. 해리슨 포 트렌드포스 연구원은 “음성인식기술이 등장한 것은 수년 전이지만 최근 들어 기기의 원격작동과 인터넷의 발달 등 기반기술이 발전하기 전까지는 상용화되지 않았다”며 “음성인식 정확도가 날로 높아지고 관련 기술이 상업적으로 성공을 거두면서 거대 IT기업들이 음성인식시장에 뛰어 들고 있다”고 분석했다.
![]() |
/사진=이미지투데이 |
국내에서는 삼성전자의 행보가 눈에 띈다. 삼성전자는 지난 4월10일 출시한 스마트폰 갤럭시S8 시리즈에 새로운 음성인식 기술 ‘빅스비’를 탑재해 눈길을 끌었다. 삼성전자는 갤럭시S8 시리즈에 빅스비 전용 버튼을 만들 정도로 음성인식에 공을 들였다.
빅스비의 등장은 지난해 삼성전자가 ‘비브랩스’를 인수하면서 예상됐다. 다른 기업들과 달리 가전제품과 스마트 디바이스를 모두 생산하는 건 삼성전자의 최대 장점으로 꼽힌다. 삼성전자가 빅스비의 음성인식률을 향상시키고 시장에서 많은 사용자를 확보할 수 있다면 시장을 선도하는 기업으로 자리매김할 것이라는 전망이다.
지난달 네이버는 메신저 ‘라인’ 제작진과 공동 개발한 음성인식기술을 선보였다. ‘클로바’라는 이름의 음성인식기술은 검색엔진 네이버와 뛰어난 호환을 보이며 사용자들로부터 극찬을 받았다. 클로바는 전용 디바이스가 없다는 단점에도 지식정보검색, 음악추천, 인공신경망 활용 통번역, 영어회화는 물론 인간과 비슷한 느낌의 대화도 가능한 성능을 보인다. 예컨대 클로바에 빅스비에 대해 아는지 물어보면 ‘비슷한 일을 하는 친구라 고충을 잘 알아요’ 같은 대답이 돌아온다.
◆다양한 플랫폼에 음성인식 도입
전문가들은 음성인식기술이 현재 스피커, 스마트폰 등 개별제품에 적용되는 형태에서 다양한 플랫폼으로 ‘이식’되는 형태로 발전할 것이라고 예상한다. 서로 다른 플랫폼에서 수집되는 정보가 빠른 속도로 음성인식의 ‘지능’을 향상시킬 것이라는 주장이 이를 뒷받침한다.
실제 업계에서도 이런 움직임이 관측된다. ‘폐쇄정책’으로 유명한 애플은 지난해 ‘WWDC 2016’에서 서드파티가 시리를 응용할 수 있는 소프트웨어개발키트(SDK)를 공개할 것이라는 방침을 내놓으며 관계자들을 놀라게 했고 삼성전자도 기본탑재 앱에 그치지 않고 SDK를 공개한다는 계획을 밝힌 바 있다.
지난달 네이버는 메신저 ‘라인’ 제작진과 공동 개발한 음성인식기술을 선보였다. ‘클로바’라는 이름의 음성인식기술은 검색엔진 네이버와 뛰어난 호환을 보이며 사용자들로부터 극찬을 받았다. 클로바는 전용 디바이스가 없다는 단점에도 지식정보검색, 음악추천, 인공신경망 활용 통번역, 영어회화는 물론 인간과 비슷한 느낌의 대화도 가능한 성능을 보인다. 예컨대 클로바에 빅스비에 대해 아는지 물어보면 ‘비슷한 일을 하는 친구라 고충을 잘 알아요’ 같은 대답이 돌아온다.
◆다양한 플랫폼에 음성인식 도입
전문가들은 음성인식기술이 현재 스피커, 스마트폰 등 개별제품에 적용되는 형태에서 다양한 플랫폼으로 ‘이식’되는 형태로 발전할 것이라고 예상한다. 서로 다른 플랫폼에서 수집되는 정보가 빠른 속도로 음성인식의 ‘지능’을 향상시킬 것이라는 주장이 이를 뒷받침한다.
실제 업계에서도 이런 움직임이 관측된다. ‘폐쇄정책’으로 유명한 애플은 지난해 ‘WWDC 2016’에서 서드파티가 시리를 응용할 수 있는 소프트웨어개발키트(SDK)를 공개할 것이라는 방침을 내놓으며 관계자들을 놀라게 했고 삼성전자도 기본탑재 앱에 그치지 않고 SDK를 공개한다는 계획을 밝힌 바 있다.
음성인식시장에서는 선점효과가 다른 기술보다 크게 작용한다. 머신러닝 같은 기계학습방법은 데이터가 방대할수록 정교하게 발전할 수 있어서다. 해당 기업들이 초기에 많은 ‘참여자’를 자사의 울타리 안에 끌어들이고자 하는 이유다.
IT업계 한 관계자는 “음성인식이 상용화될 4차 산업혁명 시대에는 산업 간 벽이 허물어져 대부분의 사물에 음성인식이 도입될 것”이라며 “음성인식시장을 선도하는 기업이 수십년간 대부분의 산업에 영향력을 미칠 수 있을 것”이라고 분석했다. 그는 이어 “음성인식기술은 수년내에 황금알을 낳는 거위가 될 것”이라고 말했다.