智能音箱透过AI与硬件扩展优化产品使用体验 智能应用 影音
DFORUM
世平兴业

智能音箱透过AI与硬件扩展优化产品使用体验

  • 魏淑芳

Baidu智能音箱「小度在家」硬件整合6麦克风环状排列,建构可360度拾音、10m内进行语音指令智能识别人机界面。Baidu
Baidu智能音箱「小度在家」硬件整合6麦克风环状排列,建构可360度拾音、10m内进行语音指令智能识别人机界面。Baidu

DIGITIMES企划

结合AI人工智能分析与各种智能居家应用场景的智能音箱,在2017-18年交出不错的成绩单,Canalys即于2017年10月发布智能音箱市场分析预测指出,2018年底智能音箱全球出货量将达到5,630万部,相关产品的竞争将更趋剧烈…

Google发布支持Raspberry Pi的Voice Kit(AIY-Projects),套件将包含Google Assistant SDK与发展基于语音的智能服务。Google

Google发布支持Raspberry Pi的Voice Kit(AIY-Projects),套件将包含Google Assistant SDK与发展基于语音的智能服务。Google

Amazon推出带屏幕Echo Show智能音箱,除可透过语音指令取用电商服务,还附带打视讯电话、影音食谱等加值功能。Amazon

Amazon推出带屏幕Echo Show智能音箱,除可透过语音指令取用电商服务,还附带打视讯电话、影音食谱等加值功能。Amazon

自Amazon推出的Echo智能语音服务与系列智能音箱(Smart Speaker)结合,提供用户使用语音扩展其电商服务的加值应用场景后,Apple也推出自家智能音箱、藉由结合原有智能手机生态系的独家Siri智能语音助理服务,透过智能音箱的介接,让苹果智能服务生态系可以更轻易进入家庭应用场景。

2017智能音箱产品发展快速

而从电商、智能产品世界大厂的积极投入,2017年的大小品牌也纷纷推出标榜整合AI人工智能的智能音箱产品,不仅智能音箱实现与设计方式多元,导入的AI人工智能对应不同应用机制、辅助服务所提供的加值应用也多有不同,甚至在CES 2018也将形成继智能手机后百家争鸣的智能音箱大战景象,除参与竞争的IT厂商、网络服务厂商众多,不同的核心技术、应用场景生态系整合条件与实用价值也将出现极大差距。

从智能音箱的规模观察,2017年的全球智能音箱出货量即达达到3,000万台,2018年在大厂相继投入更多行销资源、更多中/大型业者参与新品竞争,2018年将会是智能音箱最重要的发展契机,不仅是比拼各厂的「智能」整合优势,也比智能音箱结合各种应用场景、海量加值内容的资源竞争,至于硬件端、智能系统、生态系等各种面向的技术、资源角力,也让这场智能音箱大战更值得持续关注。
 
智能音箱产业链日趋成熟
 
先从产业链的角度检视智能音箱市场,若用智能音箱大爆发前哨战的2017年做重点检视,会发现2017年之前的产品仍处于AI智能服务模块仍需验证与提升、关键系统芯片解决方案仍未完善、市场仍需深入教育耕耘等,而观察2017年之后的产业状态会发现,智能音箱的关键芯片、语音识别/人脸识别等AI模块,已陆续达到产品应用的实质水准,从机构、用户体验、关键芯片、整合技术成熟度等,各产业环节已日趋成熟,产品成败关键反而会在不同智能音箱设定的应用场景、与待解决改善的用户痛点。
 
实际上,在2017年推展智能音箱应用仍会遭遇几个较大的非技术门槛待突破,首先是智能音箱的系统整合未尽完善,在芯片良率、服务整合等仍需时间打磨。

另在基于大量语音、识别、决策的人机互动体验尚未完善,用户仍需一段时间熟悉新一代的产品,导致智能音箱在市场的认知度有限、市场开发成本偏高。然而在2017—18年开始有大型网络/云端服务商、智能硬件开发者等大举抢进智能音箱市场,相继已有超过10款结合智能应用的音箱产品推出,在CES等展会俨然已经成为未来智能产品的新潮流。
 
功能有限的独立产品存活不易  应用场景为决胜场域
 
先检视2017年智能音箱的发展动态,多数仍以独立型产品为主,由厂家自行整合多元网络智能应用为主,如串流音乐、串流视频、网络信息服务等。

随着大型网络商、硬件商加入智能音箱战局,智能音箱在「智能化」应用也大幅跨大了竞争门槛,例如整合阵列抗噪麦克风,追加如AI语音识别、AI应用场景分析与自动化应用等,甚至如Apple、Google、Amazon大型硬件、网络服务商,也推出衔接自身企业资源与优势的智能音箱产品,产业观察纷纷提出2018年极可能因为竞争白热化,在大型业者祭出补贴、促销或是更先进的智能应用,创造智能音箱更大幅的市场成长。

有了大型业者的加入参与竞争,很明显地2017-18年相继问世的智能音箱在产品性能、应用也逐渐趋于成熟,例如,网际网络服务大型业者如Baidu、京东、Alibaba等,与家电或3C硬件制造商如Haier、Lenovo、小米等陆续加入战局。

国际家电大厂如Sony、音箱设备商sonos等硬件厂商,也推出自家智能音箱;而从智能硬件端切入的Rokid、出门问问也推出新一代智能音箱抢市,甚至在线内容网络服务商喜马拉雅也推出了自有品牌的智能音箱。

智能音箱的智能化设计挑战日趋严苛

音箱智能化后,其实可以使用的场景相当多元,早期智能音箱为透过智能手机与音箱整合协同运作,例如透过蓝牙或其他网络界面进行智能设备连结,由手机端App操控音箱进行多媒体播放或进阶智能应用。但这类初期产品在使用体验太接近蓝牙喇叭,智能化的程度也因为成本限制相对受限,整合的音箱功能实用度有限。

新一代的智能音箱产品则朝向独立智能运作,透过自行系统联网而扩展如AI语音识别、智能家电控制、在线串流节目/音乐播放等进阶应用,甚至可以达到如真人应答的人机互动体验,则是智能音箱在系统、智能、硬件三方面大幅跳跃性升级的新产品。

基本上近期的智能音箱产品,主要会由三个面向进行整合,一是硬件上的优化与整合,如影响声控品质的阵列麦克风拾音与降噪技术、小体积音箱的音腔结构音质优化设计方案、整合智能运算中枢的嵌入式系统/硬件等。

在软件或网络服务端的智能化整合,例如Apple的Siri语音助理、Google Assistant、Amazon alexa的语音识别、Baidu Ai在智能音箱产品与云服务方面的进阶整合等;最后是各种综合应用场景的加值应用,例如,语音结合EC服务、语音控制选歌/播歌、语音网络服务调用/查询等,三的面向中尤以不同应用场景的服务优化最为重要。

智能音箱人机界面设计  为操控体验关键

尤其在人机界面的发展,在智能音箱使用体验方面,更决定了智能音箱能否扩展应用市场的关键。因为智能音箱体积多数不大,碍于屏幕较小甚至无设置屏幕的设计方案,与产品体积限制在硬件控制按键有限,也让新一代语音互动的人机界面成为智能音箱的重要操作机制。

如小米的小爱同学、Apple的Siri、Amazon的alexa等,影响硬件产品运作体验除了是硬件本身的稳定性外,当终端使用者透过语音指令或是其他人机界面操作能否顺畅,就直接判决了智能音箱的实用价值。

智能音箱的另一派发展即为导入屏幕设计,多数碍于成本的产品并不会设置显示屏,但无屏化的用户体验会因为使用者不理解「智能」分析下回传的系统反馈或是语音反馈,往往会因为语音对话指令一来一回降低操作设备效率,影响设备操作流畅度。

而设置显示屏幕是最简单提升用户体验的方案,甚至透过设置更大的屏幕,赋予智能音箱更多扩展应用的可能性。例如Amazon Echo Show或是Baidu的小度在家等智能音箱产品,因为搭载了大型屏幕则扩展了智能音箱的线上视讯通讯功能,或是语音查找影音食谱、查找在线影片的新利器。


关键字
议题精选-COMPUTEX 2018