优必达Lilith获Meta推荐 5个你不知道的研发关键 智能应用 影音
DForum0313
Event

优必达Lilith获Meta推荐 5个你不知道的研发关键

  • 杨竣宇台北

优必达自家的AI虚拟人「优必酱」与CEO郭荣昌合影。优必达Ubitus K.K.
优必达自家的AI虚拟人「优必酱」与CEO郭荣昌合影。优必达Ubitus K.K.

生成式AI浪潮持续发酵,企业纷纷探索如何运用这项技术来提升营运效率和优化服务品质。对台湾企业而言,无论选择何种应用方案,采用繁体中文大语言模型都能让AI回应更贴近在地需求,创造更高的应用价值。

而在现有的繁中大语言模型里,优必达Lilith-3.3-70B是表现最突出的一个,不只在繁体中文验证集「TMMLU+」取得76.06%的准确率,领先其他繁中模型,更创下台湾第一个获得Meta官方认可、并在Llama官网推荐的繁中大型语言模型之纪录。

在展会现场,Ubitus以创新的AI虚拟角色 「优必酱」加入与参观者的互动。优必达Ubitus K.K.

在展会现场,Ubitus以创新的AI虚拟角色 「优必酱」加入与参观者的互动。优必达Ubitus K.K.

Lilith-3.3-70B是以Meta的Llama 3.3 70B为基础,针对繁体中文进行了大规模的专业语料微调(Fine-Tuning)训练,并结合连锁式推理(Chain-of-Thought;CoT)、混合专家模型(Mixture of Experts; MoE)等先进技术,大幅提升AI模型在繁体中文的语言理解、逻辑推理以及专业领域应用的表现。

5大关键要素  打造Lilith-3.3-70B绝佳表现

若进一步探究优必达研发Lilith-3.3-70B的历程,可发现其优异表现可归功于以下5大因素。第一是累积丰富的研发经验。优必达CEO郭荣昌表示,自Meta于2023年发布Llama 2以来,优必达便积极与学界合作发展繁中大型语言模型,历经两年多的深耕,研发团队已深谙AI模型训练的关键要素与技术重点。

第二是使用来自学界业界的高品质繁体中文文本作为训练数据集。为了确保AI模型具备高水准的语言表达能力,优必达除了与台大合作,亦与金融、医疗、科技、媒体等产业进行资源交换,将学界与产业提供的学术论文、新闻、小说、科技数据等高品质文本,作为Lilith-3.3-70B的训练数据集,确保模型能够更精准地理解繁体中文语境与专有名词。

第三为透过实战数据持续精进模型能力。郭荣昌指出,Lilith-3.3-70B上线后,优必达持续蒐集用户的回馈意见以及自家AI VTuber Ubi-chan的直播互动数据,据此进行模型调校,不断优化其在专业名词/在地用语理解、实时对话与个性化互动等方面的能力。

第四为采用CoT、MoE等最新技术。除了提升Lilith-3.3-70B的语言理解能力外,优必达也使用CoT、MoE等技术,强化Lilith-3.3-70B的逻辑推理以及专业领域应用的能力。尤其透过CoT训练可以让Lilith-3.3-70B学会分步解题,在数学推导、法规解析、技术问题回答等需要严谨逻辑推理的任务中,有更好的表现,甚至优于一般大型语言模型。

第五拥有充足的GPU算力为后盾,可以进行高频次模型训练与微调,以确保Lilith-3.3-70B能够达到最佳表现。

以Lilith-3.3-70B为核心  持续推动产业导入生成式AI应用

在深耕繁中大语言模型研发之余,优必达亦积极推动Lilith-3.3-70B的产业应用,郭荣昌表示,「我们希望透过Lilith-3.3-70B可以加速企业导入生成式AI应用,提升台湾产业整体竞争力」。

郭荣昌进一步解释,包括金融、寿险、医疗等受到主管机关高度监管的产业,或是制造等相当重视商业机密的产业,其实都有强烈的生成式AI应用需求,但这些产业基于法规和网安考量,而无法使用公有云的AI服务,而优必达Lilith-3.3-70B可以架构在地端,协助企业以私有云的架构导入生成式AI应用,相信可以加快企业导入生成式AI应用的脚步。

此外,优必达也看好未来的产业升级需求,将Lilith-3.3-70B结合机器人应用,发展更多加值服务。以餐饮业为例,机器人不再局限于单纯的送餐功能,还能与顾客互动推荐餐点、协助点餐等,而应用在零售业,则可协助顾客快速找到目标商品,并实时提供完整的产品信息,大幅提升购物体验与效率。

「机器人应用已是必然趋势,也是优必达未来发展重点,我们将加大在多模态模型上的研发力道,让机器人能够更好地与人类互动。」郭荣昌最后强调。