Cadence推出AI语音及音频处理最佳化DSP 智能应用 影音
EVmember
DForum0515

Cadence推出AI语音及音频处理最佳化DSP

  • 吴冠仪台北

益华电脑(Cadence Design Systems, Inc.)宣布推出Cadence Tensilica HiFi 5 DSP,针对高效能远场(far-field)及AI语音识别处理的音频及语音IP核心。与HiFi 4 DSP相比,新推出的第五代HiFi DSP,提高两倍的音频处理能力,及高达四倍的神经网络(NN)处理效能,让数码家庭助理及汽车信息娱乐的语音控制应用,提供理想的使用者界面。

Cadence Tensilica音频/语音IP事业群行销总监Larry Przywara表示,引人注目的使用者界面体验,使得数码家庭助理语音迅速普及,也让远场处理演算及类神经网络语音识别,引发了新一波的创新。HiFi 5 DSP通过改良的浮点及定点功能,并支持新数据类型,可节省存储器及功耗,解决高性能运算问题。HiFi 5 DSP保持与现有HiFi DSP产品的高互通性,这表示庞大的音频软件生态链已然形成。

随着数码家庭助理的普及,对追求开发创新的消费性产品业者而言,语音控制的使用者界面日益重要。为了增进对语音的理解程度,先进DSP演算法正迅速进化,除了消除噪音及隔离扬声器声音,还需要更强的处理能力及更好的能源效率。此外,由于人们对于连线的延迟、隐私性及网络取得等种种考量,越来越多类神经网络语音识别演算开始在本地执行,而非在云端。

Ambiq Micro行销副总裁Aaron Grassian表示,为了支持功耗敏感的设备,我们采用更具运算密集能力的神经网络为基础的远场处理及语音识别演算。因应这些极度困难的挑战,Ambiq Micro选择成为Cadence HiFi 5 DSP的第一个授权商,将HiFi 5 DSP连接到Ambiq Micro的亚阈值功率优化技术(SPOT)平台,使产品研发、ODM及OEM能够在不牺牲品质或电池寿命的情况下,透过在可携式移动产品上整合语音助手、命令及控制,以及对话使用者界面(UI),充分发挥DSP Concepts及Sensory等语音软件领导者技术,获得最大的优势。

HiFi 5 DSP的主要功能包括:五个超长指令字(VLIW)时隙架构可于每个周期发出两个128位元负载;相较HiFi 4 DSP,提供优于2倍的预处理,以及后处理MAC功能;比HiFi 4 DSP高出4倍的类神经网络处理功能;新HiFi类神经数据库,可提供一组通常用于类神经网络处理(尤其是语音)的高度优化库函数。此数据库可被轻松收集到流行的机器学习框架中及软件兼容性,可与总计超过300个HiFi优化音频、语音编解码器,以及音频增强软件等完整的HiFi产品线兼容。

Linley Group资深分析师Mike Demler表示,运用AI处理是当今数码家电市场的优势,由于消费者对延迟、隐私的要求提升,并渴望以自然语音在使用者界面上交流,装置/元件上的处理工作负荷亦正在迅速增加。HiFi 5 DSP提供前端处理所需的性能,包括回声消除及降噪等任务,而其新的32-MAC/cycle类神经网络,可支持较小的任务,为复杂的语音识别演算提供了有效的解决方案。

DSP Concepts技术长Paul Beckmann提到,随着开发时程越来越紧缩,采用新的DSP密集型音频功能的需求,对OEM来说是一项挑战。为了满足这两种需求,制造商可以选择如HiFi 5 DSP这款浮点性能提升2倍、具有强大功能的处理核心,然后通过Audio Weaver Designer等图形配置工具,快速构建其音频功能;如果缺少现代芯片及开发工具两项功能,将很难与时俱进。