NVIDIA力助桃园机捷 打造互动语音AI实践无人客服智能车站 智能应用 影音
EVmember
DForum0515

NVIDIA力助桃园机捷 打造互动语音AI实践无人客服智能车站

  • 范菩盈台北

桃园机场捷运互动语音AI与虚拟分身「霏霏」。NVIDIA
桃园机场捷运互动语音AI与虚拟分身「霏霏」。NVIDIA

桃园大众捷运股份有限公司(桃捷公司)为在车站实现以科技取代真人、提供更优质的服务和增强旅客体验,率先在机场捷运系统的A18高铁桃园站和A20兴南站导入虚拟智能站务人员「霏霏」。桃捷公司透过与台湾在地开发商乔泰科技合作,采用NVIDIA(辉达)的人工智能(AI)软、硬件平台和开发环境,并结合NVIDIA的技术谘询服务NVIDIA AI Enterprise打造了「霏霏」AI语音客服系统。

桃园捷运站务中心主任谢明融表示:「当这个计划构想成形以后,最重要的就是如何找到能达成我们想要效果的合作夥伴与技术,在公开徵选时乔泰科技提出了以NVIDIA为核心的整体运用技术,在经过了评选之后成为我们的夥伴,历经了多次的讨论与修正,终于让虚拟站务人员「霏霏」呈现在大家的面前,成为我们桃园捷运旅客服务的重要里程碑。」

台湾第一套基于完整AI互动语音与虚拟分身(Avatar)的客服系统,也是首度将AI语音技术与真人后台结合的客服系统。NVIDIA

台湾第一套基于完整AI互动语音与虚拟分身(Avatar)的客服系统,也是首度将AI语音技术与真人后台结合的客服系统。NVIDIA

乔泰技术长黄祥麟表示:「我们在向桃园捷运提案时即提出NVIDIA的平台是实现这套需要同步整合AI、边缘运算、云端运算与虚拟分身的首选。归功于NVIDIA多元完善的软、硬件资源与开发环境,团队得以针对 AI与系统整合进行优化,实现这套台湾首创的落地元宇宙应用。」

霏霏能如真人般与旅客进行实时互动,自动实时识别中、英、日、韩四国语言的提问,正确回答旅客站务、票据、乘车信息及周边旅游景点等相关谘询。当受到严重噪音干扰或遇到无法解决的问题,霏霏在第一时间也能转由真人客服提供服务,并同步将先前客服对话过程转为文字叙述,便于真人客服快速厘清旅客问题。

霏霏不仅是台湾第一套基于完整AI互动语音与虚拟分身(Avatar)的客服系统,也是首度将AI语音技术与真人后台结合的客服系统。为桃园机场捷运系统注入科技、年轻化、国际化,以及既简易便利又高效率的新气象。该服务建立在相比点选屏幕更为直觉的AI自然语音互动基础上,而站务人力资源则能更加妥善分配至其他站务所应用。

霏霏背后的技术架构是采用分散式运算方式,将不同延迟需求的工作流适时分配给边缘运算与云端运算处理;边缘运算使用的是NVIDIA GeForce RTX 3090硬件系统,而云端运算则串接到Google Kubernetes (K8S) 平台,并结合NVIDIA Triton推论服务器将霏霏边缘系统所接收到的AI运算需求分流至边缘系统与K8S平台。实际执行模式包括几个重要程序:语言的输入、语言的文字转换、AI语意理解与找寻问题的答案、结合虚拟分身与合成语音的解答。

霏霏是在人流量极大、环境噪音复杂的交通要点,需利用最新型降躁麦克风接收语音,并借助NVIDIA Maxine SDK进行输入语音降噪,使语音数据在进行文字转化前更为乾净、易于识别,再把数据传递到基于 AI 的语音与语言模型神经网络模块进行语言理解,最后把输出的回答结合Unreal Engine进行角色渲染与输出。

多项NVIDIA重要的自然语言技术是打造霏霏的核心,包括NVIDIA Riva语音人工智能SDK协助将旅客的谈话识别并转化为文字、NVIDIA NeMo大型语言模型(LLM)模型服务 做为霏霏提供自然应答的AI语言模型,利用NVIDIA Triton推论服务器进行部署。为实现流畅的AI自然语言互动,以搭载8张V100 GPU的系统执行NVIDIA NeMo Framework进行AI语言模型训练,将基础模型与站务、票据与观光信息等相关的数据投入训练。

霏霏率先证实以AI打造智能车站客服平台系统的真实可行性,霏霏是一个极佳的车站AI化的开始,未来如霏霏这样结合自然语言与虚拟分身的智能服务系统也将陆续扩大至更多的大众运输系统,以提升大众运输系统的服务品质。结合AI运算的高效能GPU技术,同时针对各类AI应用率先提供开发者友善工具且不断精进的NVIDIA软硬件技术与平台,势必将是引领此类智能客服与虚拟分身应用的关键所在。