语音识别应用进化 企业应深入解析智能生活一大接口 智能应用 影音
DForum0522
ADI

语音识别应用进化 企业应深入解析智能生活一大接口

  • 林仁钧台北

林仁钧/台北
引用DIGITIMES报导,根据法国管理顾问公司Capgemini最新研究指出,智能语音助理将在未来3年成为零售业者与消费者互动的主要模式。该研究报告调查来自美、英、法与德等4国的5,000多名消费者,发现使用智能语音助理科技的消费者,愿意透过这种互动方式,在未来3年多消费500%。

从Apple、Amazon、Google等AI语音识别系统中,可以看到智能生活的蓝图已经在生活周遭展开,但是语音识别系统要如何理解人类所说的话呢?台湾大学教授李宏毅指出,第一,机器要能把语音信号转程文字,其二,机器要对文字内容进行语意理解。

在语音识别方面,需要蒐集大量的语音信号及其对应的文字转写,例如:Google藉由蒐集了大量的影片和使用者标注的字幕来训练语音识别系统,但是对于标注数据稀少,或是没有标准书写文字的语言就会有困难。

在语意理解方面,随着需要机器执行的任务不同而需要蒐集不同的数据,例如假设想要训练聊天机器人,使用者可蒐集大量的电视剧或电影台词,以成为机器学习人类如何对话的养分;根据经验,机器在读过大约百万句以上的台词后,便几乎不会犯文法错误,但是目前机器的回答很容易前言不对后语,到要和人自然的对话,还有很长的路要走。

对于AI语音识别等领域之关键技术与专利有兴趣的厂商,可以更加深入了解个中技术心法,2018年4月10日,台湾大学SOC系统芯片中心将于台湾大学霖泽馆1F国际会议厅,举办AI智能生活专利布局趋势与策略活动,欢迎对于相关应用有兴趣的厂商参加,与台湾大学一起探讨、共创合作契机,进而创造致胜商机。

此次活动展出台大技术专利有机器人、AR&VR智能影像处理与智能人机界面、AI语音识别,在活动当中若对专利有兴趣的厂商,也可进一步了解技转程序的内容。详情请参见官网活动报名网页