microsoft
活动+
 

语音对话塑造下一代人机接口 生活体验为创新最佳催化剂

台湾AI实验室创办人杜奕瑾出席科技部建立AI语音数据资料集记者会。廖家宜

走过PC时代的键盘、鼠标,再到手机时代的触控式屏幕,进展到AIoT时代,语音对话被视为下一代人机互动最直觉、人性化的体验方式。而台湾人工智能实验室AI Lab创办人杜奕瑾也指出,未来语音接口取代的机会以后将会越来越多,即便目前仍无法达到效果非常好的语意理解,但在开发过程中仍是激发创新最好的催化剂,敏锐洞悉生活周遭体验哪里里可以再进化才是重点。

杜奕瑾指出,全球走过PC时代一路进展到手机与网络世代,现在第三阶段转型则是聚焦如何把人工智能与物联网融入生活中,而其中「体验」就是关键。杜奕瑾2017年成立台湾AI实验室与科技部展开密切合作,研究如何在体验上创新,杜奕瑾指出,从PC时代的鼠标与键盘、手机时代的触控式屏幕,人机互动接口不断在演进,而他则是认为更直觉、人性化的语音接口取代的机会以后会越来越多,而Alexa与Google Home也不尽然是语音对话的最终接口呈现,新的时代新的体验一切都还在定义中。因此目前在AI Labs所聚焦的三大领域中就包含人机接口,而其余则有智能医疗与智慧城市等领域。

语音对话被视为下一代人机互动最直觉、最人性化的体验方式,在技术上包括语音辨识、语意理解等都是基本功,但中文自然语言理解与语音辨识都是一种高度在地化的技术,对于当地所使用的文字、用语习惯与语调等必须深入理解,甚至必须要在地人自己做才能符合当地需求。

其中最基础也是最重要的第一步就是累积数据进行语音辨识训练,虽同以中文为母语,但中国大陆挟人口优势,在AI语音辨识与理解技术上相对发展更早也更好,而两地文化仍有异,台湾又缺少人口优势,要发展AI语音就必须得下一番苦功。据了解目前业界对于AI学习「台湾味」语音辨识不甚理想,其主要系因无资料来源从而无法取得语音内容以及进行语音内容标记。

科技部在推动AI发展策略下,现也透过科技大擂台推出「与AI对话」竞赛,并携手广播电台建立AI语音数据资料集,邀请台科大副教授廖元甫协助语音资料的标注,藉此缩短资料标注的人力和时间。但该竞赛首届并无人取得最高额奖金,显见中文语音辨识与语意理解仍是一项挑战。

而杜奕瑾则认为,即便目前无法达到效果非常好的语意理解,但在开发过程中仍是激发创新最好的催化剂,敏锐洞悉生活周遭体验哪里里可以再进化才是重点。他举例,象是看准「乡民经济」AI Lab过去也曾计画开发乡民聊天机器人,让使用者与ChatBot的互动宛如PTT版,点子有了、创新有了,但实际开发过程除了得要有资料基础外,也必须先在网络上理解相关文章,但最后仍无法将理想具体实现,但奠基于先前的经验与技术,AI Lab却开发出能够实时将语音转文字的「雅婷逐字稿」,协助听障人士沟通,也能记录访谈或是会议内容,甚至在App Store下载量拿下第一名。

  •     按赞加入DIGITIMES智能应用粉丝团