振生半导体利用国网中心HPC 突破边缘AI芯片设计瓶颈 智能应用 影音
DForum0704
DForum0704

振生半导体利用国网中心HPC 突破边缘AI芯片设计瓶颈

  • 林佩莹台北

振生半导体获得国内外许多奖项肯定,包含AI量子安全芯片之技术独创性获得EEtimes金赏;获选台北市亮点企业、科技管理奖、新创一百大等殊荣。2025年更是获得国科会 IC grand challenge 以及经济部AI智能创新大赏的首奖。振生半导体
振生半导体获得国内外许多奖项肯定,包含AI量子安全芯片之技术独创性获得EEtimes金赏;获选台北市亮点企业、科技管理奖、新创一百大等殊荣。2025年更是获得国科会 IC grand challenge 以及经济部AI智能创新大赏的首奖。振生半导体

物联网与边缘运算需求急速成长,具备网安防护能力的边缘AI芯片成为产业关注焦点。然而,传统AI模型难以直接对应芯片架构、网安机制与AI推论缺乏协同设计等技术挑战,成为业界发展的主要障碍。振生半导体利用国网中心H100 GPU高效能运算资源,成功建立从模型设计到芯片验证的完整技术流程,为台湾边缘AI芯片产业注入新动能。

振生CEO张振丰表示,边缘AI产业目前面临三大技术瓶颈:首先,多数AI模型以云端或通用型GPU为设计基础,缺乏针对边缘芯片的优化流程,无法有效对应PE Array、on-chip SRAM等硬件架构。

其次,现有模型普遍缺乏端点网安保护,未内建轻量签章或存储器加密设计,推论过程易遭拦截破解,且网安机制多为独立模块,整合时产生效能瓶颈;第三,边缘装置受限于体积、成本与功耗考量,可用算力与存储空间大幅受限,而无人机、监控等应用场域需要实时推论反应,无法依赖云端传输,要求AI模型必须具备「地端自主运算」能力。

用HPC提升开发效率  网安模块整合打造差异化优势

面对上述挑战,振生藉由导入国网中心H100 GPU资源,在模型训练、压缩与模拟流程方面取得显着突破。技术长罗宇呈指出,公司透过高效能运算支持,团队能够同时进行多版本模型的平行训练实验,大幅加快开发周期。

在模型压缩优化方面,振生成功建立支持INT8精度的轻量模型,具备压缩与快取优化功能,同时保持95%以上准确率。更重要的是,团队利用H100的算力模拟模型在不同资源配置下的运算特性,包括算子密度、存储器访问频率、算力瓶颈等,为芯片RTL设计、快取配置与控制模块设计提供精准依据。

透过国网中心资源导入,整体芯片设计与验证周期成功缩短约40%,并建立起可重复使用的模型压缩与硬件映射工作流程。

罗宇呈提到,振生特别重视网安防护能力的整合。团队将轻量签章验证与存储器加密模块整合至AI推论流程中,采用端点网安设计理念,使运算完全在地端完成,无需依赖云端连线,有效提升数据与模型保护层级。

此创新设计在实际应用中拥有明显优势。以边缘端人脸识别模块为例,该系统可应用于监控摄影机、门禁系统等设备,经过优化后的模型体积缩小至原始的25%以下,推论延迟小于50毫秒,部署功耗降低约30%。

同时,模型可直接部署至具on-chip SRAM与NPU的边缘AI芯片中,支持身份识别与网安签章验证同步执行。透过本次专案,振生建立起从模型设计、训练、硬件对应到验证的完整流程。

团队已完成视觉推论模型开发,此一完整的技术验证体系不仅有助于振生未来自主芯片开发时降低时程、成本与风险,更具备转化为商业IP模块的潜力。成果可延伸为NPU/AI Core模型推论模块设计蓝本,供后续IP授权、模块转售或定制化设计服务使用。

展望未来,振生计划将现有技术应用拓展至更多领域。在工业控制方面,将网安模块应用于机器视觉与设备控制模块,强化工控系统数据完整性。车载系统领域则导入低功耗AI模型搭配网安验证机制于ADAS芯片中,增强道路感知与行车安全。

智能医疗装置方面,AI结合网安芯片可应用于穿戴传感器与诊断设备,确保数据实时分析并符合隐私保护标准。透过此次成功合作,振生建构出整合模型设计、芯片架构与安全验证实例,并为台湾本土网安芯片自主研发能量的发展奠定重要基础,展现政府与产业携手推动半导体技术创新的具体成效。