赛微语音技术助各产业打造高值化产品服务
2014年上半,「生活行VoiceGO!」获Google Play选为最佳生活品味App,其可让消费者透过自然语意查询天气、股票、电影等丰富信息,实用价值甚高,故而每月不重复用户多达85万人;此App幕后推手,便是深具语音识别与合成技术根基的赛微科技。
事实上,无论玩具IC、手机、车机,乃至环绕人们生活周遭的机顶盒、智能家电、穿载式装置,诸多类型设备,都可结合声控功能,大幅提升附加价值,导致产业界对语音识别(Voice Recognition)与语音合成(TTS)技术需求若渴,也让创始于2000年的赛微科技(Cyberon),不管历经信息应用趋势如何改朝换代,皆持续拥有莫大发展空间。
赛微业务经理陈柏沅表示,该公司成立至今,始终专注语音办识与合成技术,且技术含量不断深化。以Voice Recognition而论,即从早期的指令式识别,一路演进至连续语音识别、语意理解识别,截至目前,语音识别技术已支持32种语言;至于TTS,也从早期的Lite版本进展到近期的高品质版本,韵律处理能力迭有精进,亦使拟真效果愈来愈佳。目前高品质版已可达到近似真人发音效果,支持语系达20余种,并持续依市场需求以每年3~5种语言的速度扩充支持语系。
陈柏沅指出,赛微的竞争优势,除源自于对多国语言的支持外,高度定制化和高弹性的配合度也是获得客户青睐的主因;他进一步解释,尽管现今不管iOS或Android平台,都已针对语音识别释出免费API,看似可能对赛微等专业语音技术厂商构成巨大威胁,然而此类API偏向通用型接口,欲与特定应用深度綑绑,难度极高。
高度定制化 使客户易于创造独特价值
反观赛微,客户即便运用同一套Cyberon引擎作为核心,仍拥有莫大弹性空间,可根据产品特色打造不同的功能指令、使用者界面;举例来说,同样是智能手机的声控拍照功能,有的可支持声控自拍功能,有的则支持声控美颜拍照,其间差异,完全取决于个别客户的创意发想。
赛微科技具备完整语音解决方案,语音技术适用范围广阔,若以运算资源大小做为区分,最小可从运算资源有限的IC或MCU(少量而特定的指令识别),一直到云端服务器(已涉及连续语音识别或理解处理)皆可支持。其中,若以装置属性进行区别,则以玩具、手机、车机占有较大比重。
但外界或许不知,近年智能手机的盛行,对于赛微反而是利空、而非利多。陈柏沅解释,从2003年开始,赛微积极跨足Feature Phone且大有斩获,接着进入Windows Mobile,仍维持竞争利基,但后来iOS或Android智能手机崛起,厂商鼓励消费者随需购置App,因而大幅缩减预装软件,使赛微顿失发挥空间,所幸趁此空档转而加强耕耘声控导航、车用电子,成功开疆辟土,得以找到另一项驱动营运增长的引擎。
时至今日,移动设备厂开始亟思透过诸如声控拍照等举措,强化自身应用特色,而此目标又无法仰赖单独App来实现,因此纷纷与赛微洽谈合作,使得一度沈寂的手机业务,开始止跌劲扬。
穿戴装置与智能家庭 深具未来爆发性
然而除了车机或手机外,赛微已将触角延伸到更多元的场域。比方说,其与有线电视系统业者合作,让收视户能以语音输入查询电子节目表单。由于表单内容具时效性会时常更新,且为满足业主自然口语查询的期望,赛微针对此类行业需求以云端架构解决方案对应,以网络高效与实时之特性满足业者期望。
另外,赛微也积极与IC设计合作,藉以产出具语音控制功能的IC,进而应用于一些无操作系统的装置;陈柏沅认为,综观此类型装置,最具未来爆发潜力者,即包括两大类,其一是如同智能手表、眼镜、手环或衣服等穿戴式装置,另一则是智能家庭,意即未来闸道器一旦嵌入语音控制IC,辅以线上麦克风、抗噪音等收音机制到位,便能让居家使用者藉由语言遥控家电的定时、开关等功能。
值得一提的,虽然赛微具备多国语音识别能力,但现有客户结构主要仍以台厂外销为主。今年首度参与COMPUTEX TAIPEI(2015)展示,希望能将累积十余年来成功案例,藉由手机、车用主机、IC等设备崭露其语音识别与语音合成技术能量,并针对未来富含潜力的智能家庭应用主题加强展示,为参展的海内外人士打造丰富的语音技术飨宴。