NVIDIA Grace Hopper超级芯片在MLPerf推论基准测试中取得卓越成果
NVIDIA GH200 Grace Hopper超级芯片 首次亮相于MLPerf产业基准测试中,在所有人工智能推论加速器测试中均表现优异,进一步扩展了NVIDIA H100 Tensor Core GPU的领先效能。这些结果还展示了NVIDIA 人工智能平台在从云端到网络边缘的卓越性能和多功能性。NVIDIA另外宣布推出推论软件,能让使用者在效能、能源效率和总持有成本方面上得到显着的提升。
GH200连结Hopper GPU 和Grace CPU成为一个超级芯片。这个组合能提供更多存储器、带宽,以及能在CPU和GPU之间自动调节电力,以最佳化表现。此外,配备 8 个H100 GPU的HGX H100系统在本轮每个MLPerf推论测试中提供了最高的吞吐量。
Grace Hopper超级芯片和H100 GPU在所有MLPerf的数据中心测试中处于领先地位,包括电脑视觉推论、语音识别和医学成像,以及要求更高的推荐系统应用案例和生成式人工智能中使用的大型语言模型(LLMs)。
总体来说,这次测试结果延续了NVIDIA自2018年MLPerf基准推出以来,在每轮人工智能训练和推论方面效能领先的记录。最新的MLPerf测试中包括对推荐系统的更新测试,以及首次针对GPT-J进行的推论基准测试。GPT-J是一个具有60亿参数的大型语言模型,而参数是用来衡量人工智能模型大小的粗略指标。
TensorRT-LLM大幅提升推论效能
为了减少各种规模的复杂工作负载,NVIDIA开发了TensorRT-LLM,这是一种可最佳化推论的生成式人工智能软件。这个开源程序码在八月向MLPerf提交测试结果时尚未完成,能使客户能够在无额外成本的情况下,将其已购买的H100 GPU的推论效能提高一倍以上。NVIDIA内部测试显示,在H100 GPU上使用TensorRT-LLM,与以前的GPU运行GPT-J 6B相比,效能提升高达8倍。
这个软件源于NVIDIA与业界领先公司的合作,包括Meta、AnyScale、Cohere、Deci、Grammarly、Mistral AI、MosaicML(现为Databricks的一部分)、OctoML、Tabnine和Together AI,以加速和最佳化大型语言模型推论的过程。
MosaicML在TensorRT-LLM的基础上增加所需的功能,并将其纳入现有的服务堆叠。Databricks 工程部门副总裁 Naveen Rao 指出:「这绝对是一件轻而易举的事。」
「TensorRT-LLM 简单易用、功能多样且相当有效率。它为使用 NVIDIA GPU 的大型语言模型服务提供了最先进的效能,让我们能够把省下来的成本回馈给客户。」Rao 说。
TensorRT-LLM是NVIDIA全端AI平台持续不断创新的最新范例。这些不断升级的软件为用户提供了可随时间延长的性能,而无需额外成本,并且能适应当今多样化的人工智能工作负载。
L4 提升主流服务器的推论效能
在最新的MLPerf基准测试中,NVIDIA L4 GPU在各种工作负载上表现卓越,提供全面性的出色性能。例如,L4 GPU运行在精巧、功耗为72W的转接卡上,与功耗高出近5倍的CPU相比较,L4 GPU提供高出6倍效能。除此之外,L4 GPU内建专属的媒体引擎,在NVIDIA的测试中与CUDA软件合用能加速电脑视觉应用达120倍。目前可以从Google Cloud和许多系统制造商端使用L4 GPU。它们为从消费者网络服务到药物研发等多个产业的客户提供服务。
在边缘环境中效能提升
此外,NVIDIA应用了新的模型压缩技术,使在L4 GPU上运行BERT LLM的效能提升达4.7倍。这一结果在MLPerf的所谓开放组别(Open Division)中实现,这是用于展示新能力的一个类别。该技术预计将适用于所有人工智能工作负载。当在尺寸和功耗受限的边缘设备上运行模型时,它尤其有价值。
在另一个边缘运算领先范例中,NVIDIA Jetson Orin系统模块显示物件侦测的效能相对前一轮测试提升高达84%,这是边缘人工智能和机器人场景中常见的电脑视觉使用案例。
Jetson Orin的先行产品来自采用最新版芯片核心的软件,如可程序设计视觉加速器、NVIDIA Ampere架构GPU和专用深度学习加速器。
多功能的效能,广大的生态系统
MLPerf基准是透明且客观的,因此使用者可以依靠其结果做出明智的购买决策。它们涵盖了广泛的应用案例和情景,因此使用者知道他们可以获得可靠且部署灵活的效能。
在本轮测试中参与提交的合作夥伴包括云端服务供应商Microsoft Azure和Oracle Cloud Infrastructure,以及华硕电脑、Connect Tech、戴尔科技集团、富士通公司、技嘉科技、慧与科技、联想集团、云达科技和美超微等系统制造商。
总体来说,MLPerf得到了超过70家组织的支持,包括阿里巴巴、ARM、思科、Google、哈佛大学、英特尔、Meta、微软和多伦多大学等。
欲了解更多详细信息以及我们如何获得这些成果,请阅读技术博客文章。
于此次测试中使用的各种软件公开于MLPerf资源库,每个人都能取得这些世界级的成果。NVIDIA不断将最佳化结果放入NVIDIA NGC (GPU 加速软件目录)的容器中,提供GPU应用。
- 小螺丝到大数据:Bossard紧固件在AI服务器的应用
- AMAX引领生成式 AI 与实时运动数据革命
- 思想科技助企业加速落实 AI 应用,完整顾问服务突破创新挑战
- 首款AI心肺筛检在国际亮相!展现台湾医学影像创新实力
- 迎接后双轴转型时代 Google AI助攻台湾制造业迈向绿色企业
- 慧荣科技突破数据与功耗瓶颈 全新储存技术加速AI应用发展
- 台师大与丽台携手成立深度学习共同实验室 推动AI技术在教育与产业的应用
- 精诚软件获国科会GenAI Stars生成式AI企业应用竞赛「优质创新奖」
- 运用科技力守护民众生命财产安全 精诚集团协力宜兰县政府部署AIoT智能防灾
- 晶睿通讯AI安防解决方案 导入全新AI功能RealSight Engine
- 西门子推出下一代AI加强型电子系统设计软件
- F5与NetApp加速并简化大型语言模型AI部署
- 新思科技与台积电携手 为AI与多晶粒设计加速创新
- 友讯代理A10 Networks人工智能新蓝图 驱动可靠安全环境
- 边缘 AI:实时数据处理与自动化的革命
- 迎接AI时代:数产署与资策会运用AWS技术
携手伊云谷为企业打造黄金级竞争力 - 技嘉发表开创性的Z890主机板 展现真AI 制霸效能无极限
- 昕力信息与iKala携手拓展东南亚市场 首站支持越南制造业和金融业上云
- AI视觉释放LLM完整潜力,重塑智造管理
- Hitachi Vantara推出Virtual Storage Platform One为混合云储存提供基础
- 伟康科技聚焦金管会零信任与AI最新指引 赋能金融创新
- 医扬荣获「2024中坚潜力奖」 凸显智能医疗领域的市场竞争力与永续发展承诺
- AI将改变全球的商业模式 台湾企业应把握全球变局下的AI新机遇
- AWS邀请产官专家跨界激荡 梳理AI世界的新经济发展策略
- 日本JR东海选择AWS 于山梨磁浮线推动下时代高速列车的高效营运
- 教育部推AI学习教程 台师大联手丽台深化数码教育
- Radware推出EPIC-AI,在安全解决方案和服务中增加全新AI和GenAI功能
- 趋势科技携手NVIDIA AI Enterprise强化AI部署
- QNAP发表Qsirch 5.4.2正式版 强化AI语意查找提升NAS图片查找精准度
- 威强电与翱腾国际携手打造AI个人化线上医疗照护环境
- 群联aiDAPTIV+荣获Best of Show - Most Innovative AI Application奖项
- 宜鼎携手研华 旗下MIPI镜头模块支持最新AFE-R360系统
- 趋势科技推深伪侦测方案防范AI视讯诈骗
- 高通推出Snapdragon 4s Gen 2移动平台 整合AI实现强大的移动体验
- AMD释出AMD Fluid Motion Frames 2技术预览
- ROG推出全球首款AI双模电竞屏幕
- NTT DATA推出超轻型边缘AI平台
- 优必达携手富邦金控 化身AI啦啦队前进巴黎
- 具备AI加速功能的3.5寸单板电脑IB962
- 台湾的医疗中心采用NVIDIA加速运算技术推动生物医学研究发展
- H.I.T. 医疗生成式AI研究体系:引领医疗人工智能新纪元
- HDMI协会趋势观察 AI革新电视体验 8K应用快速成长
- 生成式AI考验HPC互联 矽光子技术将成大势所趋
- 研华与臻鼎达成战略合作 AI助力共铸PCB产业数智化绿色化发展
- 医扬推搭载辉达IGX平台医疗AI PC 全球首家可量产销售公司
- 艾创点数码 共创企业AI应用新纪元
- 台达「解密Cloud to Edge AI」于COMPUTEX 2024展出驱动AI技术
- 英飞凌发布新一代PSOC Edge微控制器产品组合
- NVIDIACEO黄仁勳将在COMPUTEX 2024前发表主题演讲
- 美光率先出货关键存储器 助力 AI 数据中心
- 研华SKY-602E3 GPU 服务器 以其紧凑的塔型设计革新人工智能应用
- 洞视科技有限公司 MacroInsight:引领AI智能应用,创新多领域
- 迪威智能看准商业应用缺口 推AI会议记录及声音转换 抢攻全球市场
- 杰腾智能以生成式智能制造架构JEDAS 整合最新智能制造解决方案
- 拥有AI影像识别 iSeek创新订阅制AI服务 掀市场革命
- 精诚集团捐赠辅仁大学Gemini Data AI图数据软件
- NVIDIA生成式人工智能研究在一秒内制作出3D形状
- 瞄准东南亚牙科市场 台湾牙e通登星国最大牙材展
- Dynabook 亮相AI EXPO 2024:为企业客户带来新解方
- 丽台助阵 以AI工作站和AIDMS推动全民AI大潮
- NEC携手能火、微软为卫武营推出全球首个可互动的「生成式AI贝多芬」
- OneDegree Global推出AI风险评估 满足不断变化的合规和治理需求
- 安勤智能交通展荷兰初登场 运用AI边缘运算助力低碳永续、无缝绿运输
- HPE协助运营商在6G、人工智能时代以及长远未来取得成功
- NTT DATA携手吉嘉电子 升级MES系统 迎接智造新时代
- 戴尔科技集团助企业打造具全新AI体验的现代化工作环境
- 台湾科技助樟宜机场打造高效室内定位服务
- Cadence推出全新Celsius Studio AI热管理平台
- F5 2024网络安全预测-AI成为威胁的增强器
- Check Point揭统一且全面安全平台 开创AI驱动和云端交付网络安全未来
- 安提推出首款NVIDIA Ada Lovelace架构MXM图形模块 加速AI应用升级
- NTT DATA携手璨扬启动RISE with SAP升级上云并导入生成式AI技术
- Alibaba.com全球同步上线「AI生意助手」
- 昕力信息连续两年夺下台湾精品奖 三项MIT软件大放异彩
- 以AI融合独特五字诀营运心法 陞泰科技打造最适化智能安全监控系统
- 想像 vs. 现实:AI 视觉智造的时代?
- 2024科技趋势 - 影响安防产业的5大科技趋势
- Amazon亚马逊技术长Werner Vogels 2024年及未来技术趋势预测
- 趋势科技2024网安预测报告:科技跃进与政经局势交互作用 网安局势添变量
- 导入AI让设备变聪明 亚炬智能监测系统提高维修保养业营收
- 微软Azure OpenAI助力HAPPY GO数码化精准行销
- 昕力信息连续两年夺下台湾精品奖三项MIT软件大放异彩
- AWS与Salesforce深化合作 更轻松地建构可信的AI应用程序
- AMD为微软客户提供全新AI与运算功能
- 华硕、NVIDIA、阳明交大产学合作 培育前瞻艺术人才
- VMware扩展Tanzu平台功能 为生成式AI经济构建应用
- 人工智能和自动化:中小企业不可错失良机
- 摩尔斯微电子与Xailient携手改变智能摄影机的未来
- AIoT赋能创造多元价值 新时代智能建筑成形
- 美光推出主流PCIe Gen4数据中心 SSD
- 制造业迎接AI时代 线上设厂的革新趋势
- 零壹科技携手Pyramid Analytics为企业提供一站式智能AI决策解决方案
- 最新MLCommons AI推论结果 凸显英特尔产品在AI领域的强大竞争力
- 明基医与光明智能取得台湾第一个TFDA认证牙科AI软件
- NVIDIA Grace Hopper超级芯片在MLPerf推论基准测试中取得卓越成果
- 圆刚再推新款边缘AI运算解决方案VerMedia Box PC-D133ONB
- 威盛电子全力推动智能工厂烟火识别防爆侦准系统
- 智能制造永续的基石: AI驱动决策
- 趋势科技报告指出:2023上半年网络犯罪市场正利用AI工具提高效率
- VMware协助企业轻松驾驭生成式AI的力量
- o9引领供应链计划迈向新时代:整合生成式人工智能的顶尖计划平台
- Google Cloud与NVIDIA合作推动人工智能运算、软件和服务
- 安勤科技推出智能零售解决方案Renity AIR
- AI推论首选!华硕新一代边缘电脑PE1100N
- 高通与现代汽车集团合作为移动专用车打造信息娱乐系统
- AMD研究指出IT主管看好AI将改变其业务方式并正在加大投资
- 迎战AI新时代 HPE产业应用论坛
- AIDMS助力 中医大附医与亚大资工携手以AI助病患安心居家洗肾
- Menlo Security以AI驱动技术重新定义上网安全
- 正新橡胶扩大导入Profet AI方案
- 海韵电子助力AI产业蓬勃发展 提供环保高效的电源供应解决方案
- 淮南寰宇与法腾科技联手打造lntellinet智能网管平台
- 用AI制作形象影片,实威国际推动制造业新时代的数码转型
- 民视携光禾感知打造AI虚拟主播
- 明基材料成功导入AI应用 改善制程与突破生产瓶颈
- 万亿米智检重新定义AOI瑕疵检测准确率的新标准
- o9 Solutions以其AI赋能的规划平台革新供应商协作流程
- NVIDIA 与微软合作加速企业就绪生成式AI发展
- 戴尔科技集团和NVIDIA推出Helix计划以实现安全的地端生成式AI
- SAP助力企业拥抱AI致胜未来
- NVIDIA:全球需求量大 AI芯片销中禁令扩大应无伤短期营运
- 身心财都要健康 Lydia AI 再推APP助健康及财务规划
- ChatGPT应用于制造业有谱? 工研院机械所:可朝7大方向发展
- 亚博福尔摩沙全代理语音智能客服 开展客服新时代
- 全球AI服务推展进入战国时期 国家团队整合已成必行之势
- 透过AI演算分析模块o9致力永续指标纳入供应链规划流程
- DUGAA透过AI协助企业效率化分析海量数据
- AI视觉打造Gogoro人机协作未来产线
- Beseye云守护研发最新AI监控解方
- 安图斯AI运算平台 为企业和教育领域提供可靠解决方案
- 手机市场难乐观 日零组件厂期待车载拉业绩
- 迪威智能Noise Eraser:提升音讯品质,重新定义声音体验
- 搭载AI智能商机 精联电子首创5G工规移动电脑并支持ARCore技术
- 新思科技推出Synopsys.ai为芯片制造商打造全面性AI驱动EDA套件
- 创鑫智能云端用人工智能推论芯片在AI世界评测赢得最佳能效比
- 从AI到LLM:建置有序的人工智能模型作业流程
- 安勤科技投资柏瑞医 合作开发AI疾病辅助筛检系统
- cacaFly强化云端技术力 通过Google Cloud 专业认证
- Moldex3D 2023实现未来塑造
- 精诚与Gemini Data领先于台湾推出OpenAI商业应用
- 晶睿通讯整合旗下新品建构全方位AI安防解决方案