台湾多元语言的语音AI识别技术创新 丽台助力长问科技引领多领域应用 智能应用 影音
EVmember
Event

台湾多元语言的语音AI识别技术创新 丽台助力长问科技引领多领域应用

  • 尤嘉禾台北

长问科技副总经理陈又硕。丽台
长问科技副总经理陈又硕。丽台

语音识别技术正在改变多项产业的运作模式,成为节省人力成本与提升效率的关键利器。长问科技打造出台湾在地的语音AI识别系统,横跨国、台、英、客语言的输入与输出,成为企业数码转型的重要动力,其应用范围涵盖金融、电信、医疗、法律、教育、媒体等领域,达到超过95%的识别准确率,还能针对不同产业的专业词汇进行语言模型优化,甚至结合大型语言模型(LLM)提高语音AI识别的准确性,进一步增强用户体验。

语音AI识别的多元应用实例,有效提升企业效能

长问科技的语音AI识别系统,专注于台湾在地语言的研发,采用单一模型实现多语言混合识别,无需切换模型即可处理不同语言的输入与输出,适用于多种情境。以金融业者客服为例,该系统能将台湾常见的语言精准识别成文字,后续再进行语义分析、判断客户的情绪,提供更贴近需求的服务。同时,该系统亦能透过RESTful API、WebSocket、MRCPv2,整合客服系统,提升了操作的便利性与效率。

在公部门的应用中,长问科技的语音AI识别技术运用于政府会议记录、防疫记者会直播、选举辩论等公共活动的实时字幕生成,实现台湾常见语言的无缝互通。此外,长问科技使用客委会的「台湾客语语音数据库」建立语音API,并与客委会团队合作开发出四县腔及海陆腔的虚拟主播,仅需输入稿件即可进行播报,为客家文化的推广提供助力,进一步展现了语音AI识别技术的社会价值。

长问科技的系统大多采定制化开发,能根据不同产业的需求优化专业词汇库,确保精准识别产业术语,这在金融、医疗、法律等高度专业化领域尤为重要。此外,系统还能灵活调整识别速度,以适应不同受众的需求(如年轻人或老年人),进一步提升识别精准度和使用体验。

在媒体产业中,长问科技的语音AI识别技术应用于Delay Live电视节目,大幅减少了传统人工听打字幕的工作量及压力。透过专业词汇库的优化,即使面对节目内容广泛、话题多变的挑战,系统依旧能够精准识别产业术语。这项技术降低了50%的人力,并且字幕工作人员增加了40%的休息时间,字幕工作人员只需集中于校正AI输出结果,极大地提高了效率。

丽台科技助力强化AI算力

为了满足实时语音AI识别对高计算性能的需求,长问科技选用了丽台科技的高效能AI硬件设备,特别是NVIDIA RTX 6000 Ada Generation GPU与WinFast GS4850T 服务器的结合,强大的算力平台为语音AI识别系统提供了稳定且高效的支持,确保能在应用环境中快速反应。

长问科技副总经理陈又硕指出:「丽台的优势在于其卓越的效能、合理的成本以及专业的技术谘询服务。我们的客户通常有定制化需求,针对数据的大小,丽台能提供精准的建置建议。」

语音AI识别系统助力跨文化交流

面对技术快速发展,长问科技预计持续提升语音AI识别的精准度,更计划扩展识别语言的广度,长问科技副总经理陈又硕说:「我们预计再新增客语的大埔腔、饶平腔、诏安腔,把台湾的语系做好之后,跨国的语音识别也是未来的目标,计划加入日语与越南语的识别,以满足更多产业的需求,进一步促进跨文化交流。」

通过高性能硬件和先进技术的结合,语音AI识别应用正逐渐改变我们生活的方式,长问科技副总经理陈又硕分享:「语音AI识别是未来的趋势,随着技术的进步,人类与机器沟通可以透过精准的数码化语音,很快便能实现人机自然的口语互动。」未来,随着技术的不断成熟,语音AI识别将带来更多的创新和可能性。

关键字