以GPU算力治理为核心数码无限AI-Stack助攻企业落地AI应用
生成式AI技术普及加速,导入AI应用成为企业推动数码转型的重要课题。不过从概念验证到实际部署,过程中仍存在诸多技术与管理障碍。数码无限(Infinitix)CEO陈文裕指出,运算基础设施对企业的重要性愈来愈高,如何有效运用GPU资源,将是AI应用能否顺利落地的关键因素。
突破AI导入瓶颈 AI-Stack让GPU算力资源管理效率最佳化
陈文裕进一步表示,企业在AI导入过程中会面临两大核心挑战,首先是「该用AI做什麽?」,目前多数企业仍缺乏明确应用命题,不易从既有业务需求中抽象出适合的AI应用;其次是「该如何将AI导入企业内部?」,在找到应用方向后,仍须克服设备部署、算力资源配置、系统整合等技术门槛,数码无限的AI-Stack解决方案让数据完整且透明,并藉由简易直觉的友善界面快速配置,让GPU运算资源的使用效益最佳化。
AI-Stack的核心功能包含三大面向。首先是「GPU虚拟化切割」技术,此功能可依据工作负载需求,将单张GPU切割成2GB、4GB、10GB等不同规格的多个子单元,让不同任务能实时共享运算资源,将一般系统的30% GPU利用率提升至90%。
其次是「资源动态调度与策略弹性配置」,系统能自动排程工作任务与资源分配,例如将推论作业集中于白天执行,训练作业则安排在夜间进行,充分利用不同时段的资源需求差异。
第三项功能是跨节点GPU调度与分散式运算支持,可将多台GPU整合为统一的资源池,支持高效能分散式训练或高效能运算,任务完成后再自动释放资源,避免资源闲置。
AI-Stack采企业内部部署模式,透过直观的图形化界面,简化模型资源规格选择与部署流程。系统提供实时统计报表、成本分摊机制、详细使用报告等功能,协助企业精准控管AI资源使用状况,支持预算规划与声请作业。
此外,系统可支持尖峰与离峰时段的自动排程机制,避免资源浪费,同时确保重要业务在高峰时段获得充足的运算资源。
横跨多元产业场景 AI-Stack全面提升GPU应用效益
对于AI-Stack的应用范围,陈文裕指出,需要GPU进行AI研发或部署的产业,包括半导体全产业链(IC设计、制造、封测、PCB、终端设备)、医疗院所、金融金控、制造业、电子业、能源电力,以及政府与研究机构。应用模式则可分为两大类型。
一般自用型企业,可将AI-Stack作为内部AI开发与推论平台;算力中心型业者则可借此建立GaaS(GPU as a service)平台,透过Token计费、应用市集等模式进行商业化营运。
目前AI-Stack已有多起具体应用案例,其中位于东南亚的运营商导入AI-Stack后,成功转型为AI运算服务平台,提供自助租用、Token计价、应用市集等服务;IC设计业者善用AI-Stack的GPU切割功能,用于模型训练与轻量化部署验证;金融机构则利用平台,加快协助AI模型在不同开发阶段的部署速度,确保环境一致性,降低测试失败机率与版本漂移问题。
陈文裕接着表示,在技术与市场两大面向数码无限都具备独特优势。技术面上,该公司长期专注资源管理与虚拟化技术,具备GPU切割与实时调度的核心能力;市场面上,则熟悉系统整合商代理运作,与台湾、日本、马来西亚、泰国等地代理商建立长期合作关系。
此外,数码无限也于2020年获得NVIDIA Advisor Solution Partner资格认证,成为台湾唯一获此认证的AI软件公司。这项认证不仅提升了技术公信力,也协助该公司拓展日本、韩国与其他海外NVIDIA代理商合作,从而扩大国际市场能见度。
AI基础设施关键推手 数码无限落实「Beyond AI, to Infinity」理念
对于未来规划,陈文裕提到数码无限的角色定位已从GPU管理平台,逐步转型为全方位AI基础设施平台厂商。他强调AI时代对于完整基础设施的需求,不再仅聚焦于GPU硬件,而是建构涵盖系统、网络、存储、信息安全及管理的完整架构。
数码无限透过与当地外服务器品牌厂商、OEM及ODM制造商建立紧密合作关系,形成软硬件整合销售的生态圈,并将自身定位为软硬件桥接的关键中介者,让企业可透过AI-Stack的软件功能,有效调度硬件资源。
目前AI-Stack已历经两大版本迭代,GPU切割技术更发展至第三代。产品线采模块化策略,以IX代号系统发展出IXGPU、IXINFRA、IXLLM等功能模块,满足企业、数据中心等不同应用场景需求。
未来希望以AI基础设施关键平台供应商角色,协助客户快速、精准、有效率的管理基础设施,并加速AI应用部署,创造AI的实质商业价值。
陈文裕最后表示,数码无限的核心理念是「Beyond AI, to Infinity」。未来,将持续以产品与技术服务为核心,协助企业快速跨越AI导入门槛,实现AI价值落地,成为AI时代基础设施转型的重要推手。