椽经阁 - 徐宏民专栏

徐宏民

台灣大學信息工程学系教授

现任台灣大學信息工程学系教授，曾任富智捷（MobileDrive）技术长暨副总经理，推动ADAS及智能座舱系统产品进入全球车用市场。纽约哥伦比亚大学电机博士，专精于机器学习、电脑视觉、自驾车、机器人等领域。为讯连科技研发团队创始成员，慧景科技（thingnario）共同創始人，NVIDIA AI Lab計劃主持人；曾任IBM华生研究中心客座研究员、美国微软研究院客座研究员。习惯从学术及产业界的角度检验技术发展的机会，担任多家科技公司AI策略顾问。

Energy + Intelligence：AI竞赛新指标

过去几年，全球大型语言模型（LLM）的早期竞赛几乎都围绕在「评测指标」上。硅谷公司们所引领的这场「AI军备竞赛」，倚赖公开评测基准（benchmark）来展现AI实力：从 MMLU 的跨学科知识、BBH的复杂推论、GSM8K的数学应用、HumanEval的程序设计，到HellaSwag的常识推论、以及Winogrande的语境理解，这些测试成了模型在赛场追逐的技术指标。叙事也极为直接：分数代表能力，分数就是王道。于是，技术优化的路径几乎被锁定——设计更大的模型、注入更多的數據、投入更庞大资本、集中高密度运算资源。然而，当各家模型在标准化测试中不断刷新纪录，「这些评测是否真能代表真实场域」的疑虑也随之浮现。为了凸显AI的场域能力，2024年起，Google与 OpenAI 先后尝试让模型挑战国际数学奥林匹亚（IMO）题目，被视为复杂推论的终极考验，但这些挑战，终究无法反映大众日常的使用场景。于是，美国柏克莱大学研究团队打造的Chatbot Arena，透过大规模真人盲测，让使用者的「体感」直接成为裁判，建立一个更贴近市场的「用户价值」新战场。同时，开源社群则以下载次数、社群优化程度作为佐证，强调模型在实际应用中的应用性。于是，在传统基准分数之外，用户体验与主观感受逐渐成为另一个攸关胜负的评价指标。对于后进者而言，要在AI竞赛中打破既有格局，必须找到不同的切入维度，创造出非对称的攻防空间。这在中国科技公司身上表现得尤为明显：一方面受制于地缘政治，高端芯片的取得受限；另一方面则处于内部竞争极度激烈的环境。在双重压力下，他们不仅追逐「效能极致」，更积极在「系统层」寻求突破。透过垂直整合，挑战者试图以降低训练与推论的「成本」作为切入点，将AI的价值主张，从单纯比拼模型「智能高度」，拓展到「商业效益」的务实层面。这意味著，竞争焦点从「谁更聪明」、「谁的体验更好」，进一步扩展为「谁更务实」：除了「能不能做到」、「好不好用」，还得回答「能不能普及」。 AI 竞赛中积极追赶的Google，发挥自身在數據中心的多年经验，提出另一个关键指标，永续（Sustainable）LLM。在最新发表的研究中，Google 团队揭露：当用户发送一个文字提示（prompt）给Gemini模型时，平均需要消耗 0.24 Wh能量、0.03克二氧化碳，以及0.26毫升水。换句话说，1次文字生成的能源成本，大致相当于看电视9秒钟，或饮用5滴水的等效能耗。需要注意的是，这些数据是以Gemini应用的能耗「中位数」文本提示为基准，并仅限于文字问答场景，尚未涵盖影像或影音等更复杂的生成任务。此外，研究范围也只涉及推论（inference）阶段，而不含更高能耗的训练过程。即便如此，这份报告仍让外界难得窥见营运中大型语言模型背后的「AI 能源帐单」。根据其他研究，目前 LLM 的训练与推论能耗比例约为4 : 6，显示推论已成为整体AI能源足迹中不可忽视的主角。更有意思的是，透过这个研究，我们也看到大模型推论时，各能耗的占比。结果显示，AI加速器（TPU/GPU）消耗约58%的能量，接著是主机CPU与存儲器约占24%，而數據中心的基础设施负担（包含冷却、电力转换等overhead）与备份／高可用性设备共占约18% 。这样的分布非常值得注意：超过一半的能源用在模型运算本身，然而近乎一成也不能被忽略地用于「系统维持与可靠性保障」的功用。更让人惊讶的是，Google 报告同时指出，在过去一年，透过硬件（如 TPU、通讯、储存等）与軟件堆叠的优化，AI 推论的能耗1年内降低33倍，碳排放则下降44倍。这显示能效提升的速度，远远超过我们对摩尔定律的想像。显然在系统层级「Energy + Intelligence」共同考虑下，存在非常大的发挥空间。能源不仅是珍贵资源，更界定AI智能的边界，也迫切需要永续洁净能源的支持：因为「净零碳排」（Net Zero）要求。在这方面，Google 已逐步展开布局：在碳会计的Scope 2范畴（购买电力的间接排放）中，近年持续加码全球各地的再生能源采购，包括太阳能与风能，主动透过市场签订长期的洁净能源合约，确保數據中心与业务能获得稳定的低碳电力。同时，Google也尝试将數據中心转换为绿能资产，并借由参与电网的「需量反应」（demand response）服务，于尖峰时段调整用电量，提升电网稳定。可以预见，随著大型语言模型进入「效率优化」的新阶段，系统层级的调校将比单纯模型演算法更为关键。Google 报告中已开始纳入Scope 1、Scope 2与Scope 3的碳排放计算，而Scope 3更直接牵涉到供应链：从芯片、服務器、网通零组件到各类供应商的碳排责任，最后都会加总进国际云端与AI营运商的ESG帐本。如果国际CSP大厂、前瞻AI模型公司加速要求供应链提供ESG指标，我们在地的ICT供应商，是否已经准备好？这意味著ESG不再只是合规清单，而是全球市场透明度与竞争力的核心要求。对臺湾ICT产业而言，大语言的永续指标至少带来3个启示：第一，效能不再是唯一圭臬，效益才是。芯片与服務器不只要快，更要省，否则难以在全球 AI 供应链中站稳脚步。第二，Net Zero正在成为产品竞争指标，能源效率与碳排揭露将成为跨国合作的必要条件。第三，治理力就是竞争力——能否把算力、能耗与永续整合进企业叙事，将决定企业在全球舞臺的份量。AI的新指标已经浮现：从技术到商业，再到责任与环境（能源）成本，AI竞赛的下半场将不只是「谁更聪明」，而是「谁能在智能与能源之间找到平衡」。对产业而言，同时考量「Energy + Intelligence」，是产品策略与产业定位的新常态。

Energy + Intelligence：AI优化能源效率与韧性

Intelligence需要能源当作燃料供应，同样的，AI技术的发展，也正提升能源的韧性以及效率。AI与能源互相为用：AI需要更可靠、更干净的电，能源系统也需要AI提供准确预测、快速维运，以及可信赖的控制。当我们开始纳入「AI for Science」探索材料与化学新结构、能源探勘，以及地球天气的基础模型，更可以理解为何Energy+Intelligence为企业及国家贡献的关键竞争力。AI不仅是能源消费大户，也正在各个面向优化新能源应用，包括：（一）发电方式、来源的探勘、发电优化，（二）电网稳定，及（三）降低耗电及用电端优化。在发电与储能端，AI正加速能源资源的探勘与新材质研发。透过地震波与电磁感应数据分析，AI可更精准侦测地热资源；在海域与山谷，AI对潮汐与风速的长期预测，能帮助规划最佳的风机与潮汐发电位置。材料科学领域也因AI for Science而出现突破，例如AlphaFold2在蛋白质结构预测的成功，有机会用来加速电池与太阳能板材料开发。过去太阳能发电每提升1%可能需耗时数年，AI有机会将开发周期缩短30~50%，并在固态电池、氢能储能等新兴领域找到更安全、更高能量密度的材料组合。AI正在成为解决再生能源「间歇性」问题的核心工具。风电、太阳能、潮汐等发电量深受天气影响，输出曲线常常在几分钟到几小时内大幅波动，这意味著其他发电机组（如天然气、煤、水力）必须實時补上缺口，或透过储能设备平滑输出。AI的价值在于提前预测这些变化，让调度单位能在几小时甚至几天前准备好备援計劃，因为各个能源系统启动的成本以及需要的预置时间不同，从几秒到几个小时。Google DeepMind与英国国家电网的合作案例显示，透过AI预测风电输出，准确度提升直接让风能的经济价值增加20%。同样的，臺湾也正使用AI系统预测未来4到72小时太阳光电的变化，提供电力调度依据。再生能源预测与地球的天气系统变化息息相关。生成式AI的进展也推升「地球系统基础模型」的整合，例如最近《Nature》上发表的AURORA基础模型，能同时处理空气品质、海浪、台风与天气预测，比传统数值分析快上数十倍，且能在不同地区与时间条件下预测，对于掌握再生能源间歇性的太阳光辐射、风速、潮汐等有很大的助益。同时，准确的天气预测（大雨、温度）也能掌握用电端的用量趋势，协助智能电网分区负载平衡、电池充放电优化，甚至办公大楼与工厂的需量反应（减少电网用电）。当预测能力与调度能力打通，AI不只是再生能源的辅助工具，而是让再生能源成为稳定、可规划的资源。在维运端，AI的价值在于找回「可回复损失」，并缩短从侦测到修复的时间。以太阳光电为例，电站层级的停机、组串层级的污损与遮荫、电气层级的接触不良与误停，都会造成可观的损失。數據驱动的诊断可以在至小时级侦测到异常型态，配合工作单与现场流程，将修复时间压到最短；在风电、燃气与燃煤机组上，同样的技术可用于振动与温度特征的早期侦测，以延长寿命、降低突发停机。我们的经验发现，在大型太阳能案场使用AI驱动的监控服务，可以将发电损失由5.5%降至0.9%，以短期臺湾20 GW的太阳能目标（2025年时）来看，可以省下将近4个超大型太阳能案场的规模。在新一代电网中，稳定供电不再只是「发多少、用多少」的平衡，而是必须在复杂且瞬息变化的情境下，同步协调发电、充放电、价格预测与供需调度。这需要在边缘（edge）實時运算与决策的AI系统，透过傳感器与IoT架构收集數字电表、风机、变压器、输电设备等實時數據，提前预警设备异常、降低停机风险。同时协调各种发电来源、储能电池与用电端，组成虚拟电厂（VPP），在尖峰时段回馈电网。传统多依赖规则式控制，如今可结合强化学习（Reinforcement Learning），在模拟中反复优化策略，提升调度效率。由于能源已被欧盟《AI Act》列为高风险应用，这类系统必须兼顾可解释性与审查机制，确保关键决策既快速又可追溯。在此情境下，EdgeAI也会逐渐在能源扮演关键角色。能源转型不仅带来产业结构的重整，还创造智能电网与绿能服务的新机会。当AI融入能源，发电、输配、储能与用电端不再彼此独立，而是透过演算法与實時數據紧密整合，形成具备韧性、可优化且能交易的动态網絡，让能源成为可被弹性调度的资产。数据呈现这一趋势背后的产业规模：AI在再生能源市场的规模，从2022年约6亿美元，预计将跃升至2032年的46亿美元，年复合成长率达23.2%。同时，智能能源市场（smart energy）在2022年约为153.8亿美元，预测将成长至2030年约316.4亿美元，年复合成长率约9.6%。显而易见，Intelligence与Energy的结合已成为全球基础建设的双引擎，在AI主权、能源安全、与气候议题三重压力下，更是国家与企业竞争优势发展关键。

Energy + Intelligence：AI时代的能源挑战与产业契机

历史的轨迹显示，过去生产力的提升总伴随高密度的能源转换与工业效率提升：从水力、蒸汽、电气化、汽车与石油，到IT与互聯網，如今轮到AI。LinkedIn創始人Reid Hoffman新书提到的「Energy + Intelligence」之所以关键（之于国家或是企业），点出可负担的算力决定智能边界，而算力终究受限于可取得、可扩充的电力与基础设施。当全球掀起「主权 AI」竞赛（涵盖经济、国防、研发、教育与价值体系），大型语言模型一次训练动辄上亿美元，带动半导体与服務器的巨额投资；更关键的是，推理（Inference，指模型训练完成并部署后的实际运作）已取代训练成为主要负载（约增至百倍等级），持续放大对能源与电网的需求。Intelligence需要Energy驱动。关键在 token 经济学（参考前文）；虽然 2021到2024 技术进展，让每token成本大约下降3个数量级，但总token需求持续成长（例如近来财报揭露微软（Microsoft）的用量1年约放大 5 倍、Google的月用量年增达数10倍）。能耗端的成长也很直观：一次生成式查询约耗电2.9 Wh，约为传统查找0.3 Wh的近十倍。再加上Edge AI的普及，自驾车、工业电脑（IPC）、机器人、个人装置与穿戴都开始具备推理能力。当产品体验走向「more tokens, more capable」，AI數據中心成为企业、国家竞相投资标的。AI數據中心（AIDC）急遽推升电力需求。AIDC在满载运转时，其耗电量可达10万户家庭的等级，超大型设施甚至放大20倍，相当于200万户。以美国为例，全国已有数千个數據中心，加拿大也接近500个，且新建规模持续增加。这些场站不仅需要更高电压与直流（DC）供电，还必须采用芯片直冷（DtC）等先进散热技术才能支撑高密度运算。根据多方预测，全球數據中心年耗电量在2030年前可能较2024年成长超过1倍，其中AI应用将是主要驱动力；IEA估计，在2030年， AI与加密货币合计将贡献全球电力需求成长的4%。在能源结构转型与碳排的限制下，这股快速窜升的用电压力，正同时考验电网扩充、再生能源布建，以及供应链的应变速度。不只需要电，AIDC甚至AI供应链也需要来自再生能源的「绿电」，以满足碳盘查与国际采购规范。绿电采购与碳管理从形象工程变成出货门槛，买了绿电并不代表风险消失，案场差异、契约条件与实际发电偏差都需要数据与流程来支撑。企业应把绿电、用电与生产节奏同时考量，用可稽核的工具模拟与结算，让采购组合真正对冲价格与排碳风险，同时提升营运韧性。不只AIDC，AI驱动进展的无人出租車同样可能加重都会电力需求。比如某个都会区（如臺北）每日用电约20 GWh，若一半出租車（约 1.25 万辆）改为自驾电动车，每日额外耗电约0.8 GWh，占全市日用电的4%。若充电集中在夜间6小时完成，瞬时功率需求可达140 MW，相当于多一座中型电厂的负载。这种转型虽能减碳并提升运输效率，但也对电网容量、调度与充电设施提出挑战，必须透过排程、储能与實時价格匹配，避免交通电动化成为新的负载风险。因此，新一轮的电网升级以「去碳化」、「分散化」与「數字化」为核心方向。随著再生能源（太阳能、风力等）渗透率持续攀升，电网面临低惯量与高波动的挑战。天气变化，可能在分钟内改变发电输出，冲击电网稳定与调度反应。同时，分散式发电资源（屋顶光电、储能、可移时用电）大量出现在电网末端，传统以集中式大型机组为核心的调度模式已无法应付这种「多点、小规模、高波动」的新样貌。这种结构变化不仅迫使电网架构升级，也催生新的营运模式与市场服务，例如實時需量反应（demand response）、虚拟电厂VPP、微电网（microgrid）等。要支撑这样的系统，企业与电力公司必须将平臺从单纯监测升级为可跨厂牌、跨协定、跨场域的「监测＋控制＋數據交换」EMS（Energy Management System），并将预测直接纳入控制逻辑，同时在设计阶段预留关键机电、储能与部分制程为可调度资产，让用电从成本转化为可创造价值的资源。近来有案例显示，大型數據中心可在电力需求高峰时暂时降低 IT 负载或启用备援电源，参与需量反应市场，这不仅有助电网稳定，对营运方也是额外收益来源（例如美国部分云端业者与 ISO/RTO 合作，在夏季尖峰时段提供数十至上百MW的可释放容量）。能源已不再只是营运成本，而是产品交付与市场竞争的先决条件。对制造业与云端服务供应商而言，在电价波动与供应紧绷下维持稳定供电，直接影响合约履行与客户信任。若能将场域设计为可调度资产，不仅可透过需量反应与虚拟电厂降低成本，亦能在电网紧急时反向供电创造收益。这波Energy + Intelligence的趋势正推动电网更新，涵盖高压变电、储能、智能傳感与监控、跨场域控制与预测平臺等，并带动相关供应链在臺湾的成长动能。这既是支撑本地AI生态的必要条件，也是切入国际能源解决方案市场的契机。

Edge AI产业来了吗？

相较于目前大语言模型应用绝大部分在云端服務器上推论，Edge AI（边缘AI）强调在装置上独立执行AI模型。这种架构差异在于：可大幅降低因網絡传输造成的延迟，确保實時反应，即使在无網絡离线下也能运作；數據不上传云端，确保數據私密与安全性。Edge AI有机会满足许多新应用场域中对低延迟、高私密的关键要求。这半年来，透过技术突破、产业需求，以及发展轨迹，我们看到Edge AI的产业轮廓，正逐渐形成。模型演算法的高度竞争使得Edge端可用的AI模型愈来愈强大。近年来出现许多参数量在13B～70B级的精简模型，透过知识蒸馏、量化压缩、模型剪枝以及多专家混合（MoE）等技术，这些小模型在使用较少参数的同时还能大幅提升性能，缩小与大型模型的差距。同时也配备了各种终端应用极度关键的推理（reasoning）能力，包括控制、决策、因果、规划等。SoC与存儲器规格配置同样是促成Edge AI崛起的要素。目前主流高端智能手機、NB的NPU（AI运算核心）已经接近100 TOPS，足够让这些终端模型每秒生成数十个token（语意单元），满足应用场域（文字、语音对话）的生成品质要求。同时，透过低位元精度（如8或4位元）来表示模型权重，有助于大幅降低总位元数，使现有存儲器配置即可支持终端AI推论，释放AI从云端走向终端的巨大潜力。另一方面，各大厂商也在其芯片产品蓝图中，明确规划未来的算力提升，进一步强化Edge AI可行性与效能。在初期应用情境中，智能手機成为Edge AI生态重要桥梁。手机不仅是首批受惠于AI能力提升的装置，更自然作为云端与各类在地智能装置之间的桥梁。透过手机，无线耳机、汽车、AR眼镜等装置都能与云端和手机上的AI模型连动，实现多模态的Edge AI应用。例如，耳机可使用手机（AI模型）實時翻译语音，车载系统可依靠手机辅助娱乐信息，眼镜则利用手机处理视觉、语音任务。智能手机作为随身超级终端，串联各种周边装置，历史轨迹也告诉我们，当網絡封包（packet）的成本逐步下降，通讯功能便普及至各类终端设备。10年后（2017 年），移動产业达到高峰，无论是应用生态系或硬件供应链都蓬勃发展。同样地，随著token成本不断下降，AI 能力延伸至新型态终端设备，触发全新应用场景，也是值得期待。延伸报导专家讲堂：鉴往知来：packet（互聯網）vs. token（大语言模型）垂直产业中也听到应用面需求。过去手机SoC供应商的技术团队，首要工作是优化品牌手机中鏡頭应用的智能功能，但从2024年开始，优化手机中LLM执行效率，成了品牌客户的关键需求。工业场域中，也对于推理功能加速决策效益，工业机器人的执行效率多所期待。过去几年，NAS在中小企业中大量采用，年复合成长率超过 15%，显示这类用户对數據管理与在地运算的高度需求。如今，这些用户也期待能在终端设备上，享受到大型语言模型所带来的自动化与知识管理功能。近来市场数据也显示Edge AI正逐渐萌芽。在最新的季报中，苹果（Apple）新款M4芯片强调AI效能，推动2025年第1季Mac营收年增15.5%，更值得注意的是，新芯片也在2024下半年吸引新用户进入苹果体系。高通（Qualcomm）因手机与车用AI需求激增，手机业务创新高，汽车业务更年增55%，公司也宣称「Edge AI是未来业务成长主要推力」。NVIDIA的Orin车用AI平臺单季营收年增103%，并与联发科合作布局一系列全新终端SoC。芯片设计商与设备供应商正从Edge AI中实际获利。也同时看到OpenAI 以约 65 亿美元的全股票交易方式收购了由前苹果首席设计长 Jony Ive 共同创立的 AI 硬件新创公司 io。这股趋势Edge AI已从概念走向实质商业成长。尽管前景看好，Edge AI推广仍面临多重挑战。首先是应用场域的扩展：用户需求差异极大，不同行业与装置对模型大小、功能要求各异，业者须在通用性与定制化间取得平衡，如何取得具泛化能力的精简模型，解决场域问题，至关重要。其次是功耗与效能的权衡：终端装置受限于电池与散热条件，高复杂推理恐导致过热与续航缩短，对芯片设计与电源管理设下更高要求。再者，生态系初期碎片化，硬件架构多、軟件缺乏统一标准，让开发者必须针对各平臺个别调适，增加成本与阻碍创新。这些挑战若未克服，恐将削弱Edge AI的经济性与可扩展性。不过，回顾移動产业的发展历程，也为今日的Edge AI前瞻团队提供宝贵借镜。

鉴往知来：Apps（移動網絡）vs. Agents（大语言模型）

在前一文中，我们类比互聯網（Internet）以及现今大型语言模型（LLM）的发展轨迹，特别是互聯網的核心传输单位—封包（packet），LLM生成单位—语意单元（token），在基础设施、商业模式发展上呈现出明显相似性。透过回顾packet的发展路径，我们试著描绘出token驱动的AI未来发展轨迹，并预判在产品形态、服务模式与产业价值链上的可能样貌。另一可供借镜的历程，是应用程序（App）在移動網絡时代所引爆的创新与变革。如今，在LLM/LVM多模态大模型推动下，一个以「Agent」为核心的应用生态正逐步成形。延续上文，我们尝试从App的崛起历程，看见代理（Agent）以及边缘AI（Edge AI）未来的可能路径。2007年开始，移動App实现實時互动与高速數據交换，移動用户大量增加，源自于網絡封包传输成本逐步下降，智能手機的运算效能与续航力的进展。App Store的出现更将过去分散、复杂的网页互动模式，整合为图形化、易于操作的应用程序界面，大幅降低使用门槛，使數字服务真正「移動化」、「普及化」。App 不再只是单一功能工具，更透过推播、定位、社群整合等特性，深度嵌入使用者生活。这也带动「长尾效应」—不仅少数爆红应用，而是无数利基型App满足多元、个人化的需求。这场从网页到App的转变，不只是界面革新，更兴起全新App驱动的生态系，翻转整个數字服务的生产与分配模式，也同时快速推升移動設備的需求（2017年达到高峰）。App Store 建构出一套双边市场机制，一端连结开发者创新、另一端连结全球使用者，使原本无法规模化的服务得以商品化、在地化与全球化。过去崭露头角的數字服务如Uber、LINE、Instagram皆倚赖App生态兴起，而App的爆发也带动芯片、傳感器、模塊、电池、存儲器等硬件需求，重塑移動設備供应链结构，并促成新兴品牌与 ODM/OEM 的崛起。Statista统计显示，全球App下载量自2010年的60亿次，成长至2023年的1,430亿次，反映出App模式背后强大的规模经济与網絡效应。臺湾厂商在这波移動化浪潮中，从晶圆代工、封装测试到系统整合与 App 开发皆深度参与，建立完整供应链与生态網絡。这段历程不仅重塑移動产业结构，也为即将兴起的AI代理（AI Agent）模式提供宝贵借镜——当使用者界面再次从App进化为Agent，我们是否能抢先洞察使用需求、运算架构、标准制定与硬件整合的关键优势？如果App是移動網絡时代的使用界面，那么由大模型LLM/LVM驱动的Agent，可能是 AI 时代的核心入口。Agent不仅理解自然语言（及各种傳感信號），还得具备任务规划与执行能力，从单纯对话升级为數字助理。透过多模态推理与工具链结，Agent的应用场景正快速扩展至自动化工作流程、专业咨询、教育训练与知识辅助等领域。未来极可能出现类似「Agent Store」的新型生态系，就如当年App Store一样，汇集多样化、可重组的智能模塊，满足多样性需求。这将加速硬件与軟件的分工整合，促进各种垂直应用场域（如工业、医疗、中小企业、消费者市场）中智能代理的落地机会。随著近来高效率推理模型的快速演进，以及LLM开源生态的蓬勃发展，更进一步推进这样的可能性。同时，终端市场的实际需求也正在浮现，如中小企业的知识管理、自动化应用，以及工控领域中實時推理能力的渴望，也回应了市场的需要。终端装置的硬件规格，也逐渐具备支撑Agent所需的AI算力与存儲器条件。随著LLM开源社群快速演进，如13B等级模型已能在一般移動設備上顺利推理，token生成速度亦逐步接近应用需要，Edge AI的落地门槛正快速降低。根据预测，Edge AI芯片市场将自2023年的24亿美元，成长至2033年的252亿美元，年复合成长率高达26.5%。各大系统与芯片业者也已积极布局AI手机、车用SoC与AI PC平臺。未来，Agent将可自然地嵌入手机、筆記本電腦、AR眼镜、TWS耳机、机器人等多元终端装置，成为新一代语言互动与任务导向操作的使用界面。当然，Agent技术的普及仍面临诸多挑战，除了使用者數據的授权与使用，日益增强的自主性也带来安全、隐私、监管与伦理等层面的高度关注，技术本身的复杂度亦不容小觑。然而巧合的是，这些挑战与机会的交织，恰如2007年移動網絡时代初启时的情境—从应用模式、生态系到硬件需求与供应链架构，皆酝酿著重塑的可能。Agent的发展，正释出一种熟悉而微妙的信號，预告另一波产业典范转移的起点。

鉴往知来：packet（互聯網）vs. token（大语言模型）

从信息技术演进的历程来看，过去数十年来互聯網（Internet）的核心传输单位—封包（packet），与现今AI时代的大型语言模型（LLM）生成单位—语意单元（token），在基础设施、商业模式发展上呈现出明显相似性。透过回顾packet的发展路径，我们可以摸著石头过河，描绘出token相关技术的潜在演进轨迹，并预判其在产品形态、服务模式与产业价值链上的可能样貌。何谓封包（packet）？封包是互聯網數據传输的最小「信息单位」。所有透过網絡传输的信息（不管是信件、语音、甚至影片串流）都被拆解为多个封包，每个封包内含传输信息等重要信息，确保數據在庞大复杂的互聯網中，正确无误地抵达目的地。过去数十年，網絡基础设施的投资便是围绕封包品质的确保（如错误重传机制）、提升传输效率（如帶寬升级、數據压缩），以及整体系统吞吐量（throughput）的扩展而展开。正是如此，过去三十年来，我们才有日益丰富的網絡服务，如信息沟通、电子商务、社群媒体、影音娱乐等。而在LLM中，token则成为关键「智能单位」。语言模型在处理自然语言时，将一段文字信息拆解成多个token，每个token代表不同的语意片段，经由模型运算后再组合（生成）为有意义的内容。与封包相似，token的数量和生成效率直接影响运算成本以及使用者体验。例如，过去3年AI运算基础建设投资的大幅增长，就是为了确保LLM模型的能力（token品质）以及服务品质（token生成效率），甚至近期边缘装置上token处理能力的提升，也正逐渐颠覆AI应用的场域边界，向更多元、實時且全新的场域扩张。单看过去三十几年互聯網packet的发展，我们发现token也在走类似的进程。不管是基础建设，或是3个技术优化方向，包括「品质保障」、「效率提升」，以及整体「系统吞吐量的扩展」。品质保障：網絡早期透过TCP/IP协定来确保封包传输的正确性，而LLM则透过scaling law加大模型、使用更多训练數據，甚至后来以思维链（Chain-of-Thought；CoT）为基础的推理技术，确保生成的token内容正确且提供高品质推理服务。效率提升：随著帶寬提升和數據压缩等技术的成熟，封包传输成本大幅降低；同样地，token处理成本亦透过模型蒸馏（distillation）、量化（quantization，使用较少位元表示数值）、KV Cache等张量（tensor）降维压缩，或是使用更有效率的架构（如MoE）来降低运算量，甚至有机会使大模型有效地运行于终端装置。系统吞吐量扩展：过去互聯網透过光纤技术和提升边缘设备（交换器、路由器等）大幅提升數據传输量,或是使用内容传递網絡（CDN）等技术提高封包全局效益；在LLM领域，數據中心的垂直扩充（scale-up，提高算力、存儲器等提升单一服務器效能）与水平扩充（scale-out，高速網絡连结、排程提升分散式系统效能）、或是采用云端—边缘混合架构（Cloud-Edge-Hybrid）等，实现整体系统更高的token处理吞吐量，满足未来多元且實時的应用需求。循著过去互聯網发展的主轴，我们可以预见AI技术即将引爆的下一波变革—智能「去中心化」（普及化），低成本token开始在终端设备上运行。情境将如同2007年移動網絡兴起之际，packet进入移動設備，催生智能手機，也推动Uber、LINE等全新服务的诞生，引爆长达十数年的移動生态系蓬勃发展。互聯網数十年来最佳化packet传输技术，带动網絡服务的快速普及，特别在移動網絡时代，我们见证大量新应用与商业模式的诞生。这段历程也为观察生成式AI提供重要参照—当前token的品质提升与单位成本下降，正如当年packet优化所引发的技术扩张与资本投入，预示著新一波智能设备与创新应用的兴起。随著token处理成本持续降低，AI有望成为如網絡般的关键基础设施，深刻重塑产业结构。近来多个开放LLM模型在效能与成本上的突破，更强化LLM商品化与大规模应用的趋势。未来如何因应？过去的历史已经显明，在技术变革时，应以开放的态度，极力接近实际场域，理解技术应用发展方向，甚至与合作伙伴共同设计开发，参与组建生态系。更积极的作法，是投资（国际）学研单位，甚至新创团队，理解新的场域应用，以及技术演进。鉴往知来，回顾packet的发展经验（许多企业经营层也曾亲历其境），将使我们更有效地掌握token所带来的颠覆性机遇。对信息电子产业的投资者与决策者而言，更是攸关未来竞争优势的关键课题。每一次产业典范的转移，总会带来新的硬件、服务、企业、生态系，甚至整个产业格局的兴起与殒落。当我们已清楚AI大模型即将重塑未来十年的产业样貌，或许网际（移動）網絡曾走过的历程，正可作为产业AI战略规划的重要借镜。

智能驾驶产品开发？先解决數據问题(上)

先进驾驶辅助系统(ADAS)或是未来大家期盼的全自驾(两者统称为「智能驾驶」)，都是接下来新兴造车产业关键性的产品，DIGITIMES的研究也显示相关产品如感应器、镜头、线材、MCU、AI芯片、軟件、服务等的营业额以及成长性都相当可观。

电动车时代　还是秤斤论两卖电子零件？

汽车产业进入典范转移，电动车以及自驾车商机涌现。业界预估，以每年全球汽车产量9,000万臺换算，所需的半导体与被动元件消耗量，等同于20亿支智能手機(过去几年智能手機的最高年度销售量还不到15亿支)，可以想像背后可能的庞大商机。

Tesla为何自己设计芯片？

Tesla前些日子召开AI Day，揭露他们在自驾车未来的AI軟件以及芯片布局。目前市值最高的汽车品牌，在乎的技术是AI軟件以及运算芯片上的突破。前几年还不清楚为何Tesla抱怨车用芯片供应商提供的芯片不敷需求，要自己设计，几年之后他们推出自己的车用芯片，包含了12个CPU，一颗GPU，2颗NPU (每颗算力36.86 TOPS)。而原因日益明朗：深度软硬整合。

降低自驾技术數據成本

前面的文章提到Tesla之所以能抛弃雷达(Radar)或是激光雷達(LiDAR)而使用全视觉的技术，其中一个要素是使用大量的训练质料来提升「感知」以及「预测」能力。另一个自驾团队Lyft Level 5近期研究也发现足够的训练數據可以大大提升自驾品质：在预测的工作上如果训练數據由10小时提升为1,000小时，每1,000英里自驾出错机率会降为11分之1。训练數據在自驾上扮演了关键的角色，特别是目前的演算法都采用了以深度学习为基础的架构。

订阅椽经阁电子报

新文章上刊时发送，提供您DIGITIMES专家及顾问群的最新观点、见解。

ST(GPM)

热门报导

1
2
3
4
5
>>