智能应用 影音
Jony Ive的设计思维
我曾经以iPhone为载具,发明一种具有位置传感功能的万用无线遥控器。当你在房间中指向任何家电(如冷气机)时,iPhone会自动成为该家电的遥控器。这一类的创意是基于智能手机的发展而来。智能手机已成为一个重要的硬件平台,可以发挥创意,特别是在拍照摄影功能方面,可以开发出许多创意应用,甚至改变人们的行为方式,被《生活》(Life)杂志誉为Cameraphone Revolution(摄影手机革命)。而iPhone的成功,其中的一位功臣是艾夫(Jonathan Ive,习称Jony Ive)。他是当时苹果的首席设计师,在推动移动创意方面有关键性的影响力。艾夫的创新作品包括iPod、iMac、MacBook Air、iPhone和iPad。他对细节的狂热关注超越表面的外观。这些作品的关键特点在于使用的便利性和简洁性。作为一个艺术设计师,艾夫与科技专家Steve Jobs密切合作,共同创造出具有艺术品味的科技产品。艾夫的标志性设计象徵着当时处于低谷的苹果(Apple)的复兴和重返巅峰。在科技领域中,很少有设计具有如此大的影响力。艾夫的透明且丰富多彩、同时极简洁的美学成为苹果成功的关键所在。他为苹果设计光滑且符合人体工学的产品,彻底改变科技设计,并为个人通讯设备建立新的美学标准。艾夫的设计方法受到Dieter Rams的影响。从美学和哲学的角度来看,Rams的设计原则贯穿艾夫的作品。艾夫于1992年加入苹果,那时正是公司遭遇困难、几乎面临破产的时期。他对公司只专注于电脑科技感到担忧,他说:「我曾担心周旋于以电脑科技本位的事业部门,并涉足各种产品的广泛领域会很困难。然而,出乎我的意料,这并未成为问题,因为我们设计的是包含许多不同组件的系统,包括耳机、遥控器、鼠标、扬声器和电脑。我喜欢在这些相对较新的产品类别中工作,专注于基础的创新设计。即使只是参与一个产品的开发,也能立即改变整个产品类型和相关系统的历史。」艾夫和苹果的成功因素在于其设计工作室的运作方式,类似于一家外部设计公司,但只为苹果这个单一客户服务,并位于公司的核心位置。这个工作室的规模非常小而可控。尽管苹果拥有数万名员工,但艾夫的设计工作室只有约20名设计师和同样数量的支持人员。最重要的是,艾夫的团队有权将他们的设计实现为最终产品。艾夫的团队主动参与产品的开发,而非仅仅被动设计。iMac和其他数十种产品并不是由苹果的工程团队主导,而是在艾夫的设计工作室中构思出来的。苹果以前曾以工程为主导,但Jobs和艾夫改变这种思维,让当时的苹果非常重视设计。艾夫告诉《时代》(Times)杂志:「物品和它们的制造是不可分割的。如果你了解一个产品是如何制造的,你就能在思考产品的外观之前,了解它们的用途、工作原理以及应该使用什麽材料制造。这种工艺的概念正在复兴。」艾夫与Jobs对此有着相同的看法,艾夫表示:「我清楚记得Jobs宣布,我们的目标不仅仅是赚钱,而是创造出伟大的产品。这种理念所做的决策与过去苹果的决策截然不同。」Jobs和艾夫建立了一个强大的工作关系,这成为苹果成功的核心,Jobs甚至称艾夫为他在苹果的「精神伴侣」。2012年,艾夫被英国皇室封爵。尽管获得荣耀,艾夫强调:「我不喜欢独自受到关注。设计、工程和制造这些产品需要大型团队的努力。」台湾资通讯的学生往往搞不懂问题前就开始做专题。结果是浪费时间。我们应该牢记艾夫的话,在最初的设计下功夫: 「在设计过程的开始,一个小小的改变就能在最终产品中定义出完全不同的产品(A small change at the beginning of the design process defines an entirely different product at the end.)。」 
产业垂直整合要多深? (二)
智能手机问世后,产业又重启考虑垂直整合的议题。 PC有较长的历史,而且CPU寡头垄断企业的地位近乎无可撼动,电脑业者可以藉垂直整合主要半导体元件入价值链,差异化本身系统产品的机会并不大。 相对的,智能手机当时才开始起步,主要厂商藉其销售量来支持其手机CPU的设计,用以差异化其产品的功能,如苹果(Apple)、三星(Samsung Electronics)、华为等。垂直整合的考虑再度浮上台面。 不过这次的价值链垂直整合只及于IC产品设计这一层,而半导体制造环节则选择利用已逐渐发展成熟的代工平台。手机IC设计主要在CPU这一块,CPU大幅度决定手机功能,是手机企业核心竞争力的重中之重。垂直整合止于IC设计此一环节,能避开半导体制造环节必须自已持续投入巨额研发费用的无底洞,这是手机系统业者最合宜的价值链垂直整合长度。 后来的汽车产业也有类似的企图,特别是在电动车/自驾车的领域,包括Tesla、比亚迪、小米等企业。这些电动车的终极目标自然是自驾车,包括各级别的自驾芯片,譬如Tesla的FSD(Full Self-Driving)芯片及软件,也许会更积极扩张至AI平台,譬如Tesla的Dojo芯片及超级电脑系统。能设计车用的核心芯片及其运作统统,似乎也可掌握未来汽车产业的核心竞争力。 但是汽车与其它电子系统有根本性的差别。虽然未来电动车/自驾车有时候被戏称移动的电脑,但是它基本上它是人的载具,牵涉到人身安全,因而引发后续的法律、风险与保险等相关问题。人命牵涉到文化中最基本的价值问题,而各国在此方面的认知存有分歧,这些分歧也可能造成市场的碎片化。另外,这些价值的认知即便在同一国家中亦可能存有差异,也可能造成市场发展缓慢。 从这个问题出发,统一半导体元件标准也许是建立规模经济的解决方案。虽然在统一标准的过程中由于各地法律和文化的差异会比较困难,但是在标准统一之后,在各地的法律修定、保险规章费率、系统环境支持等方面可以快速发展,这是扩大整体规模经济的方式。也就是说,对于攸关安全的半导体零件以及人工智能、运行平台制定统一的标准,而产品的差异化及竞争力则置于其他面向。目前已有几个机构正在推动制定汽车半导体元件的标准,譬如国际半导体产业协会(SEMI)。这也许是Tesla在此阶段就将FSD软件公开授权的原因,目前已经有许多车厂宣布支持此一方案。Tesla在此阶段始推动统一标准无疑是深思熟虑的结果:目前尚未达到需要大幅牵动法律修改的自驾程度,此时先推动标准的统一,阻力会少很多,最多只是商业考量,而非汽车企业较难着力的修法程序。等到统一标准形成、变成既成事实后,修订法律也会比较容易进行。而Tesla Dojo芯片和系统,也专注于影像识别的AI,这是自驾车系统最基础的平台功能之一。 有些汽车企业甚至垂直整合入晶圆制造厂的环节,譬如博世(Bosch)和比亚迪。这会重蹈以前系统厂商与半导体厂终归分离的覆辄吗?不一定。 这几家的晶圆厂都是以功率元件为主要产品,包括 power MOSFET、IGBT和SiC等。功率元件的获利方程序与前述典型的藉持续投入研发、快速推进制程以获取超额利润的手段不一样。这不是说功率元件不需要研发,只是比较集中在元件的结构与材料,而呈现的结果主要是耐压、电的性能和可靠性的提升。  功率元件的制造主要在8寸厂,制程也还停留在0.20~0.25微米以上,这是因为要耐高压、电需要较宽的线幅,提高元件性能只能靠元件结构和材料。以IGBT为例,从1980年代出现迄今,总共也只经历7个时代。它的演进远较逻辑和存储器产品缓慢,研发经费可以在较多年限摊提。 在功率元件的领域,研发的规模经济门槛较低,这也解释在此领域还存有大小不等的IDM公司的原因。 汽车企业垂直整合功率元件半导体制造厂在,短期间内可以缓解过去几年在车规功率半导体供需不平衡的问题。但是长期来看,汽车的核心价值会往AI与网络倾斜,能源的变换会变成标配,这个垂直整合是否合理还有待观察。 另一个有趣的议题是有些IC设计公司宣称他们是系统公司—另外的其实只是不做声响、悄悄在做而已,在异质整合成为技术演进主流的年代,这个趋势几乎无可避免。电子系统的核心功能将被整合在单一的先进封装内。电子系统产业与半导体产业如何在长价值链中分工或融合,这是企业该开始问一问自己的议题。
产业垂直整合要多深? (一)
一个产业的加值链通常包含多个加值节点,一个产品/服务的最后价值,即是这些个别加值的总合。传统的企业竞争策略理论会告诉你一个企业能够整合进比较多的主要加值环节、成为企业核心能力的一部分,企业的竞争力会比较强。而且,在面临产业加值链变迁时,企业比较有韧性,更能争取时间以及资源去因应变迁。  半导体自成一个产业,2023年产值到达约6,000亿美元,与PC、手机、服务器等电子系统产业是同一个数量级的产值;另一方面,半导体又是各电子系统产品产业加值链的一环。于是电子系统与半导体的垂直整合,便反覆地成为产业内的策略考虑之一。  70年代主要的美国半导体业者是英特尔(Intel)、德仪(TI)和摩托罗拉(Motorola),其中TI有消费性产品,也有政府契约的产品;摩托罗拉是通讯公司。当时系统公司投入半导体产业有两主要目的:1.投入新兴的关键科技;2.公司核心能力的垂直整合。这两个主旋律在产业内重复出现。  80年代日本主要的半导体公司如NEC、东芝(Toshiba)、日立(Hitachi)、富士通(Fujitsu)、三菱(Mitsubishi)等,以及韩国的三星(Samsung Electronics)、现代(Hyundai)和Gold Star,其背后无不有电子系统公司的身影。倒是台湾80、90年代的主要半导体公司绝大部分都是单从投资新兴关键科技的观点出发,这对于后来的发展影响巨大。  垂直整合当然不是企业在产业内竞争的唯一致胜手段,如规模经济等也会影响竞争的结果。  半导体产业是高科技产业,获得超额利润的主要手段,是藉先于同侪利用尖端技术推出性能更优越的产品,而这种型态的竞争是持续的。持续的技术研发需要巨大资金不间断的投入,商业机构的资金自然是来自于营业利润的累积,营业额的规模大致决定能投入持续研发经费的尺度。在愈接近物理尺度极限时的研发工作变得更为复杂艰难,此时规模经济的因素就变得格外显着。  对于此规模经济考量的因素下,80、90年代最大的次产业DRAM以及逻辑芯片分别演化出不同的样态,以取得在规模经济考量下的最适应模式。  DRAM次产业采取在产品界面标准化策略,促进规模经济的发生—DRAM变成大宗商品(commodity)。大宗商品在流通、用量上较诸专用商品上有天然的数量优势,进一步确立规模经济。  如果半导体产品与电子系统厂商垂直整合,半导体产品的销售原先有竞业的问题—很难想像,譬如,三星手机设计的CPU芯片苹果(Apple)愿意使用。但是因为DRAM界面采用统一标准,竞业因素变得不重要,因此半导体厂产品的总体潜在市场(TAM)扩大了。如此也有负面效果。DRAM产品界面标准化后,原先在系统价值链垂直整合的综效就被打了折扣:大宗商品可从市场中择优取得。  另外,领先的DRAM公司还利用DRAM与2D NAND Flash制程的相似性,跳跃性的扩大存储器制程的研发规模经济,一次性的拉开与存储器产业中第二梯队的差距,形成今日存储器产业三足鼎立的态势。  逻辑产品品类比较分散,过去主要产品CPU处于寡占状态,近乎虚拟的统一标准;其他产品次市场的份额较小,即便统一产品界面标准也难以形成有效的规模经济。所以逻辑产品采取不同的途径来取得规模经济:共享相同或兼容的制程平台,这就是代工次产业概念的滥殇。  存储器产业以统一的产品界面标准,以及代工产业以共享的制程平台,形成各自规模经济,也反转电子系统产业垂直整合半导体的原先企图。
智能城乡应用永续经营三关键
新竹县政府主办一场「智能城乡论坛」,我受邀担任下半场综合讨论的与谈人。题目为「以公私合作推动智能城乡发展」,由行政处长周秋尧及都市发展与环境教育基金会荣誉会长林建元共同担任主持人,分享智能城市发展前景与趋势,及新竹县面临的机会与挑战。会场听众询问,新竹县发展智能城乡的策略为何? 对于智能城乡应用的永续经营,我认为应该考虑3个问题:首先,要清楚区分必要与非必要(Must-have or Nice-to-have)。将智能城市应用区分为「必备」或「可有可无」反映它们对日常生活产生影响的不同程度。在某些情况下,这些应用的存在或缺乏可能不会显着改变城市居民的日常体验。然而,必须承认这些应用的成功或失败取决于它们的功能性以及它们是否能够融入城市结构。以智能家庭应用而言,电动窗帘大家都感新奇。但要花大钱建置,可能就无人问津。因此这是一个「可有可无」的应用,而非「必备」的应用。第二,需分析维运成本(CAPEX vs OPEX)。很多应用勉强建置,无力维护。智能城市应用的失败案例包括未能满足期望或缺乏必要基础设施的情况。此类缺陷可能包括使用者界面不足、数据处理效率低下或连接性不足。这些挫折强调在部署智能城市解决方案之前,进行健全规划和充分测试的重要性。台湾的失败案例不胜枚举,一个成功案例是YouBike,很务实地在许多台湾的城镇提供服务。在国内大陆,很多类似YouBike的服务太过花俏,OPEX太高而失败。第三,要能够选择有用数据(To data or not to data)。不知如何使用数据,就不会有智能城乡。我提出智能农业的成功案例,是我们帮兰花工厂进行非影像兰花黑头侦测的应用。城市最应该运用的数据是交通数据。而智能路灯是最好的载具,应在现有的路灯挂上智能平台,而非取代现有路灯系统。在台湾,许多智能城市应用的存在与否并未对居民的日常生活产生显着影响,他们的生活维持着往常的方式。而很多「必备」的智能城市应用都是因为政府法规要求。在卫福部一个显着而成功的案例是在医疗应用中推广快速医疗互通资源(FHIR)。FHIR已成为医疗保健领域的一股变革力量,促进电子健康记录的安全交流,并在各种医疗系统之间促进互操作性。其成功是对设计良好且有效实施的智能城市应用在关键领域(尤其是医疗保健)中可能产生积极影响的明证。智能城市应用失败的主要原因是将简单的问题复杂化,同时缺乏解决问题的实际移动力。很务实的解决上述3个问题,智能城市有永续经营的机会。我给的答案,应该都适用于所有城市。
宁可信其有的迷信
台积电熊本厂(亦可称为日积电,Japan Advanced Semiconductor Manufacturing;JASM)日前不久举行开幕仪式,一时冠盖云集,台日双方重要的政经人士均出席开幕盛会,见证此历史性的一刻。媒体对此重要的事件有诸多的报导,在此不再赘述,但是不知读者是否注意到日积电的英文标示,是用英文小写的,尤其是j上面画龙点睛的一红点,也正象徵日本国徽。如果读者注意到日本对外重要的活动,其中的J都一律用英文的大写,我尤其喜欢大谷翔平代表日本国家棒球队时,队衣上那非常流线英文大写的J,形貌近似于日本的国土。也许读者会说台积电的英文也是用小写的,这就是关键所在。台积电tsmc为何舍弃英文的大写,而改用小写?台积电蒋爸(指蒋尚义)曾跟我说,这是经过高人的指点,因为大写的T出不了头,小写的t可以出头。虽说是迷信,但是台积电决策者能从善如流,宁可信其有,也是美事一桩。所以日积电大写的J出不了头,小写的j可以做到。在此不禁想到AT&T也将商标由原先大写的T,增加了小写的版本,难道是受到台积电成功的影响?在科技产业中如果说起迷信事件,绿色的乖乖算是其中最为人所谈论的,你很难想像在先进半导体的机房中,摆了为数不少的绿色乖乖。绿色代表机台在正常的运转,为了保持机台的稳地度及妥善率,绿色乖乖是绝对少不了的。这一开始也许只是个别的行为,但是在心理作用的怂恿下,逐渐扩展为全民运动。就连超微(AMD)的苏妈(指苏姿丰)来台会见在台员工,也要跟绿色乖乖合照张相。这个习惯也曾被英国BBC所报导,当时还有人戏称,我们真正的护国神山秘密,被别人给揭穿了。前不久我们公司在国内工厂的机台一直有状况,我就请要去国内维修的工程师随身带几包绿色乖乖,大概效果不错,国内的工厂随后通知我们,要寄一大箱的绿色乖乖给他们。这类避邪趋吉的做法,如果善用的话,倒也可以振奋人心激励士气。美国在独立战争中,有段时间陷入与英军的苦战。但当战事延伸到纽泽西州时,华盛顿(George Washington)将军率军在恶劣的天候下勇渡特拉华河,突袭英军逆转战事,被视为是美国独立扭转乾坤的一役。但是在行前却人心惶惶,华盛顿将军于是召集相关的军官及士兵,从口袋掏出一枚硬币,说掷币的结果如果是人头面朝上,代表得到上天的祝福,会打胜仗。果然掷币结果是人头面朝上,且一连几次都如此,军心因而大振,最后取得关键胜利。事后华盛顿将军拿出那枚硬币,结果硬币的两面都是人头。在军中不仅有很多迷信甚至是禁忌,个人服役时是海军的雷达部队。海军最忌讳的是餐桌上吃鱼不能翻身,因为这意谓着会翻船。有回我不小心将鱼给翻了身,身旁的军官看我一脸惊吓样,连忙说我们是陆上部队,不信这一套。至今我还感谢这位帮我解围的军官。 
罗夏克测试与大型语言模型
我一直尝试将不同的工具和大型语言模型(LLM)结合,这是将传统软件工具进行数码转型最快的方式。例如曾将鱼骨图管理加上ChatGPT,效果甚佳。接下来我想尝试将LLM和罗夏克墨渍图结合,进行心理投射测试时。然而,我尝试将ChatGPT和罗夏克墨渍图」(Rorschach Inkblot Test)结合,进行心理投射测试时,ChatGPT的表现就有点荒腔走板,言不由衷。罗夏克测试使用10个墨渍图案,每个墨渍图案几乎具有完美的对称性。其中5个墨渍是黑墨,2个是黑墨和红墨,另外3个是彩色的。这些墨渍图并非随机或偶然的设计,罗夏克(Hermann Rorschach, 1884~1922)精心设计每一个墨渍图,使其尽可能具有模棱两可和「矛盾」的特点。罗夏克将墨渍图开发为诊断精神分裂症的工具。后继者则扩大使用于一般的个性测试。无论是在心理学还是文化上,这个测试本身有着惊人的生命力。罗夏克测试不仅仅关于你看到什麽,更重要的是你如何看待它。大多数的墨水渲染看起来像无意义的形状,但罗夏克墨渍图确实可以看出不同的东西,给个人的创造力留下空间,但这些墨水渲染也有一种真实的结构,可以客观地检查你所看到的东西是否符合标准或超出范畴。罗夏克是一位瑞士精神科医生,曾师从荣格(Carl Gustav Jung)。相较于罗夏克,弗洛伊德是一位文字型的人,他的心理学完全关乎言语疗法,因此早期如ChatGPT的LLM较容易插入(plug in)弗洛伊德的测试。罗夏克认为,看见比说话更深刻,我们如何看待事物更能展示出我们是谁。最近,多模式学习模型(Multimodal LLM)就更能适应罗夏克的测试。罗夏克在发明测试后不久就去世了,此测试在他无法控制的情况下朝着各种不同的方向发展。在美国,神秘的内在风格、个人魅力,是什麽让你在人群中脱颖而出等特性,皆以不同罗夏克测试的变形版进行测验。第二次世界大战爆发,罗夏克测试被大量运用于临床心理学领域。它被用于纽伦堡的纳粹审判,也被用于越战期间丛林中的农民。专家对于不同被测者的反应会有奇妙的解读。例如,您如果在10张卡片中有4个以上的性(Sexual)回应,可能暗示存在精神分裂症;如果被测试者的性回应过少,可能暗示性挫折。罗夏克在墨点卡片湿润的状态下将它们沿中心轴对摺,使它们都具有对称性,被测者很容易将它们旋转90度,解读它们像是水中的倒影。若被测者是罪犯,则镜像回应被用来区分精神病患者和非精神病患者。对图形细节的关注可以解释为冲动或警觉性,亦即能够看到他人忽视的事物。然而,如果过于关注细节,则可能表示对平凡事物的着迷,僵化的强迫性思维,有时还可能涉及偏执狂。之后有大量论文发表对各种对象的测试,有些光怪陆离,有些还颇为搞笑。罗夏克测试引发许多争议,一些严谨的学者开始展开研究。一项于2013年进行的重要研究,回顾所有与该测试所声称测量的方面相关的研究,剔除不够严谨的部分后,证实当前的罗夏克测试的可行性。这些墨水测试具有客观的视觉特性,测试本身有着具体的历史和用途,只要按照特定的方式运作,其结果就有意义。罗夏克测试显然不是容易驾驭的工具,若能巧妙地以微调模型或检索增强生成(RAG)融入LLM,其威力必然大增。
核融合电能何时能商业运转? (二) —产业的进程
核融合反应炉的研发起始于50年代。相较于英国在1956年已经开始商业运转的核分裂反应炉是晚了不少。  早期核融合反应炉的最大问题在于电浆的约束:哪种机制可以约束住温度高到几乎可以融毁一切物质的电浆? 延伸报导名人讲堂:核融合电能何时能商业运转? (一)—核融合反应炉的工程挑战当时的核融合是当成基础科学议题来研究的。核融合反应炉何时可以商业运转发电?这个问题在上世纪的标准回答都是30年后—意思是还早着呢,一次一次接着跳票。  最近的氛围已有显着变化,近年来市场资金总计投入近50亿美金用于核融合反应炉的研发,目前以此为主题的新创已接近40余家。  近年来最令人振奋的消息之一,是2022年12月5日美国劳伦斯利佛摩国家实验室(Lawrence Livermore National Lab;LLNA)与国家点火设施(National Ignition Facility;NIF)合作的核融合反应有净能量收益(net energy gain)。  此次实验采用的约束机制为ICF,共192管红宝石雷射以圆对称射向置于圆心的原料颗粒(pellet)均匀加温。投入的雷射能量为2.05百万焦耳(MegaJoules;MJ),产出的核融合能量为3.15MJ,能量增益系数Q=3.15/2.05>1.5,核融合反应本身的确能释放出能量!这是个里程碑式的实验。  负责任的媒体还会加注其实那2.05MJ是由300MJ的电能产生的,遑论若依传统能量转换途径,核融合能得先转换成热能、热能再转换成电能,转换成电能的效率还得打一个大折扣。若真能成为发电设施,不只是反应炉,整个系统要有净能量增益。这样算来,粗估的核融合反应炉的净能量增益至少要Q>10才能涵盖系统中其他的能量消耗。商用系统还有一段路要走。 无论如何,原来是基础科研的问题转变成工程问题。工程问题可以分而治之(divide and conquer),研发速度因而加快。譬如LLNL与NIF的计划中的红宝石雷射若换成二极管雷射,能源输出效率可以提升30倍,这样就是稳稳向前迈一步。  另一个促使进展加快的因素是新创的投入。这些新创与公共机构形成夥伴关系(public-private partnership),专注于一些特殊核融合反应炉发电的机构、机制或原料等技术,可以基于公共机构较周延的基础科研结果,快速进入商业运转阶段。  当商业资金开始投入一个新技术时,由获利动机驱动的研发显示加速进展的可能。最近一个例子是量子电脑的发展。  IBM在发展出第一代、第二代量子电脑时,预计的量子算力是以每年倍增的指数成长,这已是比摩尔定律—每18个月倍增—更积极的技术路标。发展迄今其实现状比这技术路标快多了!  另外一个看起来比较不显着,实质上很重要者,是机器学习已经投入核融核反应炉的研发,最主要的两个领域是在材料开发和反应炉结构,以及核融合反应参数的优化。  所以,核融合反应炉何时可以开始商业化?最乐观的是2030年初期,这个日期出现在一些新创公司网页和新闻。保守些的呢,有生之年。但是这不是以前谈的30年后,因为持这样主张的人也同时谈2050年的碳净零排放,核融合反应炉发电不再是遥遥无期的。 (作者为DIGITIMES顾问) 
香侬的智能
香侬(Claude Shannon, 1916~2001)被誉为信息理论之父。图灵(Alan Turing, 1912~1954)则被称为计算机科学之父。1943年,香侬和图灵相遇于纽约市的贝尔实验室。尽管他们的研究题目不同,他们讨论彼此的工作,其中包括有关图灵的「通用机器」。图灵相当惊讶,香侬在一片程序码和计算机的海洋中,将艺术和文化视为数字革命不可或缺的部分,将之称为「数字DNA」。香侬在1943年告知图灵梦幻般的想法,如今已经成为现实,因为所有媒体都以数码化呈现,涵盖数百万的「文化事物」和庞大的音乐收藏。香侬在艺术、信息和计算之间建立的早期联系,直观地描绘我们今天正在经历的未来。图灵在1950年发表论文〈计算机与智能〉(Computing machine and Intelligence),首次谈到人工智能(AI),并提出「图灵测试」,为信息研究领域创建智能设计的标竿。图灵测试说,如果一台计算机能够欺骗人类相信它是人类,那麽它就应该被称为智能计算机。香侬则直接订出机器学习的目标: 「创造出击败世界冠军的象棋程序;撰写出能够被知名文学期刊选用的优美诗歌;编写能够证明或反驳黎曼猜想(Riemann hypothesis)的数学程序;设计一款收益超过50%的股票选择软件。」今日,香侬的第一个目标已在2017年由AlphaGo达成。机器学习常见的做法,是将随机事件相关联的预期信息量(expected amount of information)加以量化,并衡量概率分布之间的相似度。今日则被用作衡量概率分布信息内容的指标,则是香侬提出的信息熵(Shannon entropy)。香侬熵背后的基本概念是所谓事件的自信息(self-information),有时也称为惊奇性(surprisal)。自信息的直觉是这样的。当观察到一个不太可能发生的随机事件时,我们将其与大量信息相关联(这代表当不太可能发生的事件发生时,我们获得极大的信息量)。相反,当观察到一个很有可能的结果时,我们将其与较小的信息量相关联。将自信息视为「事件发生会造成我们多大的惊奇」非常有帮助。例如,考虑一个始终会落在正面的硬币。任何硬币投掷的结果都是完全可预测的,我们永远不会对结果感到惊讶,这意味着我们从这样的实验中获得的信息为零。换句话说,其自信息为零。如果硬币的落地面的随机性增加,则每次投掷硬币时都会有一些惊奇,尽管超过50%的时间我们仍然会看到正面。因此,自信息大于零。最大的惊奇量是在硬币是公平不偏的情况下获得的,即落在正面或反面的机会都是50%,因为这是硬币投掷结果最不可预测的情况。基于上述非正式的需求,我们可以找到一个合适的函数来描述自信息。对于一个具有可能值 x1, . . . , xn 和概率质量函数 P(X) 的离散随机变量 X,任何介于0和1之间的正单调递减函数都可以用作衡量信息的指标。还有一个额外且重要的性质,那就是独立事件的可加性;两次相继的硬币投掷的自信息应该是单次硬币投掷的两倍。对于独立变量来说,这是有意义的,因为在这种情况下,惊奇或不可预测性的数量变为两倍。藉由上述特性,香侬熵被应用于测量与一组概率相关的不确定性或信息内容。香侬熵通常用于决策树(decision tree)和其他AI模型,以量化数据集的不纯度或混乱度。例如在决策树算法中,香侬熵用作在每个节点上对数据进行分割的依据。目标是最小化熵,熵较低的节点被认为更「纯粹」或更具信息。为每种可能的分割计算熵,选择导致熵最大程度减小的分割。这个过程在决策树不断增长的情况下进行递归性地重复,得到我们想要的答案。香侬在1948年提出信息熵的概念,影响到80年后的今日机器学习的发展,真奇人也。 
核融合电能何时能商业运转? (一)—核融合反应炉的工程挑战
 原子是以原子核中的带正电质子的数目来决定原子序的。原子核中除了质子外,还有数量大致相仿的中子,这些质子与中子以强作用力(strong interaction)束缚在一起,这就是核结合能(nuclear binding energy)。  核结合能的物理基础强作用力,在短距离内比化学作用的物理基础电磁作用强100倍,因此核反应的能量远大于化学作用的能量。  铁(原子序26)的同位素群与镍(原子序28)是元素中平均核结合能最高的,也就是最稳定的元素。以铁同位素群为例,核结合能可以高达8.8百万电子伏特(MeV)。物理驱使物质转变成较稳定的结构,所以原子序比铁高的原子就会透过核分裂(nuclear fission)转变成较小的原子;而分子序较小的原子则倾向透过核融合(nuclear fusion)转变成原子序较高的原子。前者已应用于现今的核能发电,而后者就是目前全世界研发开始升温的核融合发电。  核融合为什麽比核分裂更具吸引力呢?第一个原因是核融合的过程及其废料有较低的幅射性。第二个原因是如果核融合反应炉无法正常运作,它不会如核分裂反应炉因连锁反应(chain reaction),导致核反应炉融毁(nuclear reactor meltdown)而近乎无法收拾。核融合反应炉无法正常运作时,核融合反应停了就停了。另外还有个原因是核融合反应的原料,近乎取之不竭、用之不尽。  最常使用的核融合反应的原料是氘(Deuterium)和氚(Tritium),二者都是氢的同位素,也就是说和氢原子一样,每个原子核都含有一个质子,但是氘和氚的原子核还分别具有1个和2个中子。使用氘和氚当成核融合反应原料的原因是它的散射截面(scattering cross section)—也就是核融合反应发生的机率最大,所释出的能量最多,高达17.6MeV。  氘在自然中稳定存在,可以从海水中提取。但是氚具有放射性,而且半衰期很短,只有12.3年,自然界中只存有30~40kg,所以核融合反应炉必须在反应的过程中自己产生足够的氚,以维持连续的核融合反应。这是核融合反应炉设计时必须考虑的因素之一。  核融合反应时需要较高的温度,氘和氚在此环境下以离子的形态存在,也就是氘和氚中的原子核和电子是分离的,这就是电浆态(plasma)。氘离子和氚离子都带有一个正电荷,它们之间存有库仑排斥力。这就解释为什麽氘和氚被选为核融合反应原料的原因:其排斥力最小,但是原子核较大,较容易碰撞,而且碰撞机率高。  要克服电磁互斥力让氘离子和氚离子进行核融合反应必须符合一定的条件。基本上要离子的密度、温度和其能量约束时间(energy confinement time)的乘积大于一定数值,这是核融合反应炉能维持稳定运作的条件,术语叫「点火」(ignition)。  能持续维持核融合反应的温度大概在10~20keV之间,约等于8,000万度到1.6亿度之间,这比太阳核心的温度还高。要维持这样高的温度,以及高的离子密度,必须把离子束缚在一个有限的空间中,这就是核融合最核心的工程问题之一:约束(confinement)。约束的方法比较多的是用磁场(Magnetic Confinement Fusion;MCF)来约束离子的行径;另一个是靠惯性(Inertial Confinement Fusion;ICF),利用震波(shock wave)来压缩及点燃离子;还有二者的混合形态MTF(Magnetized Target Fusion)。为了提高磁场,高温超导(High Temperature Superconducting;HTS)胶带被用于磁约束核融合反应炉上。 由于离子的集体形态电浆比较接近液体,而处于特殊状况的液体会产生较为激烈的行径,譬如扰流(turbulence)。离子的稳定性一直是核融合反应炉的一个工程挑战。  氘离子和氚离子反应后产生氦离子(即是阿尔法粒子)和中子,其中氦离子擕带核融合约5分之1能量,之后转移能量让原料能维持在高温、可以持续核融合反应。但是氦离子得想法排掉,避免影响后续核融合反应的发生。  中子以动能的形式携带约5分之4的核融合能量,这是核融合反应炉产生能源的主要形态。中子不带电,不受磁场束缚,会四向逃逸。想利用它的动能转化成一般涡轮机可以使用的能量,得用防护墙先拦着,将其转化成热能。  另外由于前述的原因,氚必须在核融合反应炉中自己产生,防护墙上得覆盖含锂元素的繁殖毡(breeding blanket)。当中子撞击到锂时,会产生氚。中子在整个核融合过程中可能会消耗、流失掉一部分,繁殖毡上还必须加入铍或铅元素。当中子撞击到这些元素之后,会产生2个中子,这样中子的数目就得以增加,让核融合反应炉中的氚得以持续补充,维持反应炉的持续运作。  这大概就是主流的氘-氚磁约束核融合反应炉所需面临的主要工程挑战。  
半导体的经济学思维
最近读了几本关于经济学的书籍,对于经济学家利用逻辑分析、数学模型或田野调查等方法来解释或预测人类或社会的经济行为,如成长、衰退、贫富等,留下深刻的印象。不免起心动念东施效颦,想要对自己所理解的半导体产业及人才做一番解析。众所周知,半导体产业链可略分为上中下游,在此上游定义为晶圆制造,中游为IC设计,下游则为系统应用。愈往上游走,知识所需的层面就愈基础且深入,也愈硬件导向;往下游走所需的知识就愈广泛,愈偏应用及软件。半导体人才的培养彷佛也有上中下游的概念。以前在学生时代,听过老师们提起如何培养一位最适切的半导体人才,就是在大学时念物理,硕士时读材料,最后再攻读电机博士。由理科到工科,也由基础到应用。先来谈人才的养成。有不少半导体领域的专家,都是在大学时念物理,之后在博士时转念电机,而卓然有成。前国立阳明交大校长张懋中院士便是此思维下的翘楚,经由物理及材料的训练,最后拿到电机博士,并成为半导体界国际知名学者。顺流而下似乎是水到渠成,但是逆流而上呢?大学时念电机,而博士研究转攻物理,甚至是理论物理,没有太多成功的案例。约莫二十年前,台大物理系的招生广告中,曾高调地宣传,当时在台积电任职副总以上人士,毕业最多的学校是来自于台大物理系。最近材料专家彭宗平教授,也在媒体表达了,在园区半导体业很多的主管是材料系毕业的。这些都说明了,顺流而下是趋势,也是个好的选择。产业界又如何呢?先经过了晶圆厂或IDM厂的历练,转而从事IC设计,而成就一番事业者大有其人。之前在IC设计领域红极一时的晨星半导体,其创业团队就是来自于世大集成电路,从事晶圆代工。但是在IC设计表现优异的公司,转而往上游晶圆制造发展,锻羽而归者却时有所闻。十几年前矽统科技自建晶圆厂,就是个失败的例子;最近又有专攻功率IC设计的公司,在盖自己的晶圆厂。毕竟IC设计所需的半导体制程技术种类繁多,不是一座晶圆厂就能够涵盖的;此外两者的文化差异颇大,晶圆厂需要严谨的态度及做事方法,要经营的好需要有高的产能利用率,在在都与IC设计的思维不相符。但是中游的IC设计与下游的系统应用间的隔阂,却不是这麽显着,两者之间存在着既合作又竞争的态势。IC设计公司已不再是单纯地提供芯片,而是要提供一个解决方案。苹果(Apple)就是鲜明的例子,不论是电脑所使用的CPU,或是智能手机内的AP处理器IC,都是自己所设计。近来云端服务业者,也开始自行设计AI的芯片。只要是量够大掌握出海口,且能找到合适的团队,系统应用业者是可以往中游的IC设计去发展。但是也有失败的例子,如不久前OPPO便结束旗下的IC设计公司。华为这几年受到美国的制裁影响不小,创始人任正非曾公开表示,未来就是要用钱来砸数学家或物理学家,回过头来把自家属于上游的根基做好做稳。我在美国留学期间,参加过一场光电领域的研讨会,会议最后的问答时间,来自加州理工学院(Cal Tech)的光电大师Amnon Yariv教授,就在黑板上写了马克斯威尔(Maxwell)的4个方程序,然后说所有的解答都在里面。事实上,在电机半导体领域最常使用的欧姆定律,就只占这4个方程序的一小篇幅。Open AI 创始人Sam Altman最近宣称,要花费巨资自建多座先进的晶圆厂,生产AI芯片。换言之就是由下游,直接挑战上游。经济学有趣的地方在于,永远都会有另外一只手(on the other hand)。有原则就会有例外,这是在处理经济问题,经常会发生的。Altman是否会成功,且拭目以待。