全部已读
 
 

个人听清楚声音三大关键:音量、音频、听力图

2018/02/08 - 台北讯

台北讯

声音是人体的五感之一,但声音的频率过去在IT产业相对较不受重视,如今物联网透过底层的设备撷取讯号做为分析,未来语音频率预料将变成系统必须处理的讯号种类之一。元鼎音讯(UnlimiterHear)董事长杨国屏于「音讯算法在IoT上的应用发展」中就指出,虽然相较于其它技术,音讯属于冷门领域,不过随著物联网应用的逐步拓展,未来发展潜力极为雄厚,成长力道也将逐步浮现。

杨国屏指出,目前国外已开始注意到音讯市场,并着手制定相关规范,IEEE(电机电子工程学会)已成立IEEE-P2650委员会着手制定智能手机听力测验标准,元鼎音讯正是此听力标准委员会的会员,元鼎音讯同时也在智能型手机上设计了个人听力测验应用程序(MFA Hearing Test App),透过此一免费应用程序,使用者将可测试出自身的听力。

除了学研机构,现在厂商也动作频频,在AI领域,近年来家庭语音助理如Amazon的Alexa、Google的Google Assistant等,已成为全球IT产业焦点。杨国屏表示,语音助理设备透过AI运算使用者的声音,因此声音的质量相当重要,他指出各种语言都会有不易辨别的高频子音,例如英文的F与S就容易被混淆,在AIoT系统中,若讯号不清楚,后端的处理单元会无法运算,因此声音质量在此类系统中,将会被高度要求。

对于声音质量,过去的设备都只着重于音量大小,但声音是由60%~70%的频率加上30%~40%的音量所组成,因此音频才是关键。杨国屏表示,多数人超过10岁就听不到18KHz的声音,即使音量再大也听不到,因此如果用移频的方式,将此频率声音转移到多数人都可听到的6KHz频率范围内,即使音量不大,声音仍然清晰。目前元鼎开发出的MFA毫秒移频技术,就以此方式,将之应用于智能行动装置、智能听戴装置、智能家居装置、智能健康装置等与音讯相关的设备中。

根据与元鼎音讯合作的台湾电信公司表示,使用移频技术后,一般人使用通讯App与3G/市话通话时,可改善4KHz以上高频子音的消失问题,在通讯App互通使用G.711语音编码通话时,可于通讯App以16KHz取样频率录音后,先经移频调整并重新取样8 KHz再编码传送,也可改善相同问题,由此可以看出,移频技术已可实际应用,并改善声音质量。

目前元鼎音讯提供音量、频率和个人听力图三种参数合一解决方案,并已广泛使用于助听器、辅听器、智能耳机、智能家庭语音装置、汽车语音装置...等。杨国屏表示,依据每个人耳朵的不同听力,所开发出专属音频算法IP,可方便的嵌入芯片中,让传统的音讯装置快速升级为智能音讯装置,提供差异化产品的同时,也让人类生活更多采多姿。


图说:元鼎音讯(UnlimiterHear)董事长杨国屏。