中國曝光機發展現況:DUV
在中美貿易戰中,美方施力的重點在於箝制中國高科技的發展的進程,特別是半導體、人工智慧和量子計算,而前二者息息相關。 在半導體方面,美國的管制近乎遍及全產業鏈,從設計工具(EDA)、產品、製程設備乃於材料的禁運,中國自然是以國產替代以提高自給率,這也是涵蓋全產業鏈的回應。 中國在半導體設備領域的弱點包括電子束測試機(e-beam tester)、離子植入機(ion implanter)和曝光機(lithography equipment)。 電子束測試機是量測機台,基本上是用來偵測除錯,不是製造過程的一部分。離子植入機—特別是高能量(~1MeV)的,對於高壓碳化矽(SiC)MOSFET的製程至關重要。現在的電動汽車電壓已早從600V邁向800V、1200V。沒有高能量離子植入機無法製作車規高壓功率元件,對於中國電子產業的零件自製率影響巨大。 最令人關注的自然是曝光機(lithography equipment)。曝光機的能力代表先進製程的終極解析度(resolution),又與先進技術節點(technology node)直接相關。先進製程的主要應用之一是與算力高度相關的各式XPU,特別是專注於人工智慧應用的GPU;另一個應用也是在人工智慧晶片架構中的高頻寬記憶體(High Bandwidth Memory;HBM)。 從2024年9月起,中國就陸陸續續的傳出各式曝光機進展的相關消息,對於全世界的半導體產業,這自然是頭等的新聞焦點。 首先是中國工信部指導目録中的DUV曝光機,在2024年9月公布。 本質上,這就是一台乾式的DUV曝光機,光源是氟化氬(ArF)的準分子(excimer)雷射,氟化氬雷射波長為193奈米 。 此曝光機的解析度為65奈米,如果假設系統中其他性質都已達最佳化,則其物鏡(objective lens;系統中用於收集光線、用以呈像的主要透鏡)的數值孔徑(NA,愈大解析度愈好)推算起來大概是0.75。如果要進一步改善解析度,還要經過另一陣子的努力以達目前產業前沿水準0.93的數值孔徑。也就是說,在光學系統的發展目前還處於較早期階段。 至於其疊加精度(overlay accuracy;上下層圖案的對齊精度)為8奈米。要能產生65奈米臨界尺寸(Critical Dimension;CD)的製程,上下層的疉加精度要達臨界尺度的20%左右,也就是13奈米。如果要做雙重曝光(double exposure),則疊加精度必須提高到13/2奈米=6.5奈米。顯然此台曝光機目前的解析度就是65奈米,而且無法透過雙重曝光的手段進一步提升製程的解析度。 再往前的路,除了前面所述在物鏡的數值孔徑需持續提升之外,另外還需要往浸潤式(immersion)方向移動,利用水的折射率(refractive index)1.44較真空的折射率1為大的因素,提高曝光機的整機解析度,這樣才可能達到28奈米的解析度。至於像FinFET這樣的精密元件,部分製程就要動用到雙重乃至於多重曝光。浸潤式曝光機使用新機制以改變波長,自然要面臨新的問題,譬如水的純淨度的控制以給水溫均勻恆定的維持等。這個部分自然也有機構早已從事研發,譬如中國中科院長春光學精密機械與物理研究所正在開發的數值孔徑為0.8的浸潤式物鏡;承擔浸潤式曝光機的光源攻關任務的是中國中科院光電院、微電子所孵化出來的科益虹源;電源模組則是由中國中科院安徽光機所的團隊承擔開發任務。多梯次技術平行開發是可以想像的技術發展方式。 自2023年以來偶有上海微電子已開始交付其28奈米浸潤式DUV的新聞,機型為SSA/800-10W,疊加精度為1.9奈米,最近一次的傳聞為2025年1月7日交付。惟上海微電子公司產品目錄無此型號,沒有官方發布,亦無可靠媒體報導。根據其型號中的10W字樣,此機型最多為原型機,因為其光源能量不足,無法支撐量產所需之吞吐量(throughput)。這條工信部指導目録的消息沒有公司送原型機(prototype)到晶圓廠用線上製程調適機台的後續報導,所以出貨與否未可知;而且從原型機到量產機,總是要有好些時日。 至於前一代的90奈米 DUV機台已自2022年交付過幾台,初期主要的問題是系統不夠穩定、down time太長、因光源功率不足(20W)致使設備吞吐量太低。所以,這條新聞對於中國積極發展曝光機國產替代的意義要重於先進技術的實際突圍。
DRAM 製程發展方向:3D DRAM
從20奈米以後,DRAM製程開始龜速前行。從19奈米到11奈米之間,以每次1~2奈米的速度進展,跌跌撞撞地經歷1x、1y、1z、1a、1b、1c以及未來的1d,共計7個製程。雖然現在仍使用平面(planar)DRAM製程,卻早已經大幅的利用與晶圓垂直的第三維度,使得DRAM在效能、功率上,還能有實質的提升;在晶片的密度上進展比較遲緩,看來有點雞肋,但是對於有些應用—譬如高頻寛記憶體(HBM),稍為提升密度還是有實際用處的。要達到HBM每個世代的記憶體容量標準,只有特定的製程世代有能力提高到如此高容量的記憶體晶片。但是在每位元成本方面,製程的推進因為製程變得複雜,對於降低位元成本已毫無貢獻。以三星電子(Samsung Electronics)現在的1b製程為例,就使用5層EUV,因而所費不貲。DRAM市場短期內不會平白消失,但是如果其製程推進還是繼續如此緩慢,仍然會逐漸失去其高科技產業的特性;高科技產業之所以能獲取高額的利潤,是因為其科技的快速推進可以重複運作。現在DRAM製程的緩慢推進、乃至於停滯是DRAM業者共同的夢靨。10奈米以下,目前各DRAM業者共同的技術推進方向大致是3D DRAM,只有三星會在1d製程之後試圖導入垂直通道電晶體(Vertical Channel Transistor;VCT)。垂直通道電晶體基本上是將晶圓上平面電晶體的結構豎著長,減少每記憶體單元的底部面積,從傳統的6f2縮小為4f2,其中f(feature size)為半導體製程的特徴尺寸,譬如半金屬間距(half metal pitch)。這樣的製程推進,大概稍大於10奈米級製程推進一個世代的效益,然而這只是一次性的方法—下一步可沒另一個方向可以再利用了。最主要的是垂直通道電晶體與未來的3D DRAM製程完全不沾邊,研發的努力只能使用一陣子。因此並不是所有DRAM公司都做此想。3D DRAM的引入第一個問題不是為何要引入3D製程,而是為什麼到此時才引入3D製程?畢竟所有的DRAM大廠都有3D NAND的技術。當2013~2014年3D NAND技術開始被引入時,DRAM的製程也早已在25~20奈米左右,即將進入龜速前進的10奈米級製程年代。用已經成熟的3D製程技術來推進舉步維艱的DRAM製程似乎是理所當然。問題還是出在DRAM的結構上。一個線路要能夠用3D製程來製作,有幾個先決的條件。首要的是線路要有高度的重複性,無疑的,記憶體的陣列是3D製程應用的首選。在此點上,DRAM是符合的。再來是各層記憶體之間要有可以共用的材料。以TCAT(Terabit Cell Array Transistor)3D NAND的技術為例,各層之間記憶體單元的閘極控制(gate control)材料複晶(polysilicon)以及電荷陷阱(charge trap;用來儲存NAND訊號的單元)材料氮化矽(silicon nitride)是可以在各層之間共用的,因此垂直方向的製程整合相對簡單,32層的記憶體可以用4、5層光罩來完成。但是3D DRAM的結構就沒有這麼幸運,電容部分必須完全隔開以避免記憶體單元之間的訊號交談(cross talk);通道部分因為DRAM追求高機動性(high mobility),不能用在高寬高比深溝中的輕摻雜(light doped)複晶做半導體,各層記憶體之間可以共用的材料只有字線或位元線,端看3D DRAM是要求垂直製程的簡化或面積的極小化。另外,DRAM效能遠比NAND為高,所容許的訊號延遲(latency)很低。各層記憶體之間因緊密相鄰所產生的感應電容(induced capacitance)等效應都會降低DRAM的表現以及訊號的協同,因此3D DRAM的確比3D NAND的工程問題要複雜得多,這也解釋為何3D DRAM製程遲遲沒有上路。無論如何,DRAM產業維持高科技產業特性除3D DRAM外已幾乎沒有前路,譬如以前在文獻中經常被提及的無電容(capacitorless)DRAM,其資料保留時間(data retention time)遠不能與目前的DRAM相比。2023年7月長鑫在IEEE的International Memory Workshop發表其對3D DRAM的規劃,三星也在同年的Symposium on VLSI Technology and Circuits發表其3D DRAM的技術論文。可見關於3D DRAM的議題各公司早已準備很久,只是研發結果發表的時機及場合各有考量罷了。根據長鑫的設計,2D DRAM的電容—電晶體垂直堆疊的組合在3D DRAM中就被橫擺著成為一層中的一個記憶體單元。長鑫模擬出來的記憶體單元有多大呢?橫躺的電容約500奈米、電晶體200奈米,加上字線和位元線,一個記憶體單元橫方向的尺度接近1微米。長鑫採取的製程是字線垂直到下邊的接觸平面,這個做法會讓記憶體單元的面積稍大,但是垂直的整合製程會比較簡單。在技術發展的初期,先做出來再做好是合理的策略。至於記憶體陣列旁的周邊線路(peripheral circuits),師3D NAND的故智,會在另外的晶片上製造,然後用混合鍵合(hybrid bonding)與上層的單晶(monolithic)記憶體多層陣列封裝在一起。字線和位元元線的金屬間距都是70奈米。用以前DRAM製程定義半金屬間距來看,這個起始製程大概就是35奈米節點,與3D NAND剛開始時的30~40奈米製程相彷。這樣的3D DRAM堆疊32層後,所得的記憶體容量與1b的2D製程相彷。堆疊64層後容量就與10奈米以下第一世代製程0a相彷。這個堆疊是個可以重複的進展,DRAM的高科技產業屬性因此得以維持。目前有發布大概推出時程的是三星,大概在2026~2028年之間,與2D平面製程會並存一陣子,這與3D NAND剛出來時的策略也相同。假設3D DRAM的確是可行的技術,有2點值得評論。第一個是高頻寬記憶體是否會沿著目前的方法向前推進?目前的HBM是多個DRAM晶片以先進封裝堆疊以達到較大容量,其中先進封裝的費用佔總成本的相當部分。如果記憶體容量可以用單晶的3D製程來增加,成本有可能降低。但是這是比較長遠的事。另外一個議題有關於地緣政治。長鑫在其文章中說是業界第一次揭露3D DRAM技術,其實業界各自默默研發都很久了,但是長鑫對於3D DRAM的應用可能會特別有感。一方面目前長鑫的製程大概在1z節點,與領先公司有2、3代的差距。開始採用3D DRAM製程,可以快速拉進距離,畢竟那是一個新戰場。最重要的是3D製程中,技術的重心將從光刻搬移至蝕刻,這是長鑫在EUV資源受制約的狀況下,最可能的突破口。所以各公司3D DRAM製程的實際發展狀況和開發能力外界也許看不清楚,但是長鑫比較有可能投入較多資源是合理的預期。
DRAM 製程發展方向:DRAM結構在製程微縮中的挑戰
DRAM在1970年問世,取代以前的磁芯(magnetic core)記憶體,成為計算機馮諾伊曼架構中的一個重要模組。在1984~1985年之間,因為個人電腦及工作站的興起,DRAM變成半導體市場中市佔最大的單一產品。 因為DRAM製程的進展直接決定記憶體容量,以及DRAM有較大的市佔,有能力累積足夠的資金以投入下世代的製程研發,DRAM自問世以後就成為摩爾定律主要技術推手(technology driver)。肇因如此,自1980年代後陸續投入半導體產業的日本,以及其後的南韓、台灣,許多公司都選擇投入DRAM此一次產業,因為這代表投入半導體產業中最先進的製程。 但是DRAM的製程領先地位在2000年初不久之後首先被NAND超越,之後邏輯製程又超越NAND,成為半導體製程技術的驅動者。 DRAM開始偏離摩爾定律並不是之前促使DRAM成為技術驅動者的因素消失了。事實上,到2024年為止,記憶體仍穩佔半導體市場的4分之1左右,而是DRAM的基本結構在20奈米以下遇到尖鋭的挑戰。 DRAM的記憶體單元(unit cell)結構為1T1C,亦即一個讀取電晶體(access transistor)和一個電容。選電容當成訊息儲存單元天經地義-電容是電路三元件電阻、電感、電容中的一員。 電容上電荷的有、無代表訊息的「1」和「0」,需要讀、寫電容上的訊息時,就開啟讀寫電晶體。基礎物理教育告訴我們電容上的電荷,即使維持電容兩邊平行電板(parallel plate)的電壓差不變,電荷也會隨著時間逐漸流失。電荷流失的速度與兩片平行電板之間的距離成反比,與平行電板的面積以及在平行電板之間物質的介電常數(dielectric constant)成正比。因為電容上的電荷會隨時間流失,所以電容上的資訊必須經常更新(refresh),目前DRAM中的資訊刷新時間為64ms。 為了要控制個別的記憶單元,每一個單元的電晶體的閘極(gate)連有字線(word line),施加電壓後可以讓電晶體處於開啟狀態,可以用來執行讀、寫或更新的操作;位元線(bit line)則連接電晶體的汲極(drain),將自電容通過已開啟電晶體的電荷送到感測放大器(sense amplifier)偵測0或1的訊號。如棋盤線交錯的字線和位元線可以準確定位一記憶體單元,讓周邊線路挑選以讀寫其中訊息。以上就是DRAM運作的大概架構。 DRAM製程持續推進的挑戰,也正源自於這1T1C的架構。製程微縮的方向,與DRAM使用的電晶體以及電容所需的物理特性是朝反方向走! 首先遇到的是電容值的問題,2000年左右的電容值必須保持在40fF(femto Farad)左右,那時的電容已開始利用晶片上的垂直方向此一維度,電容要嘛挖成深溝(trench)狀,放在電晶體旁的下方;要嘛堆壘成圓柱狀(cylinder or pillar),置於電晶體上方,也就是利用垂直於晶片的方向面積的延伸來增加電容的面積。 但是製程的微縮會讓圓柱的底部縮小,電容的面積因而減少,電容值也會隨之降低,所以必須增加電容的高度,以增加電容的面積,藉以維持電容值在一定的數值以上。以10奈米級別製程為例,電容值必須維持在10~20fF以上。 但是減少圓柱底部面積、增加圓柱高度,就是增加圓柱的寬高比(aspect ratio),這會造成蝕刻製程的難度,圓柱底部較尖銳的形狀也會造成新的電性問題,所以寬高比就停留在1:50,難以再推進。 至於電晶體,記憶體的與邏輯線路的注重不同的特性。邏輯電晶體注重效能(performance),也注重漏電流(leakage current)及其它特性;DRAM電晶體首重漏電流,因為這對電容保存訊息的能力是致命。 電晶體存在漏電流的原因之一是柵極感應汲極洩漏(Gate Induced Drain Leakage;GIDL),指的是在柵極的位勢(potential)高於汲極的位勢時,即使電晶體處於關的狀態,電流仍然會從汲極洩漏流向襯底(substrate)。 這個問題是歷年來DRAM製程推進都要面對的問題,而且愈來愈嚴苛。 DRAM近年應對這個問題的措施包含在電晶體結構的變更,包括凹槽式通道陣列電晶體(Recess Channel Array Transistor;RCAT)、鞍鰭電晶體(saddle-fin transistor)、具有閘極工作功能控制(gate work function control)的埋柵(buried gate)電晶體等結構。 但是製程微縮也是朝不利於漏電流控制的方向移動。由於電晶體通道變短,於其上的閘極對於通道上的電流操控能力變弱,這就是短通道效應(short channel effect)。漏電流的降低也高度挑戰製程研發。
鑑往知來:packet(網際網路)vs. token(大語言模型)
從資訊技術演進的歷程來看,過去數十年來網際網路(Internet)的核心傳輸單位—封包(packet),與現今AI時代的大型語言模型(LLM)生成單位—語意單元(token),在基礎設施、商業模式發展上呈現出明顯相似性。透過回顧packet的發展路徑,我們可以摸著石頭過河,描繪出token相關技術的潛在演進軌跡,並預判其在產品形態、服務模式與產業價值鏈上的可能樣貌。何謂封包(packet)?封包是網際網路資料傳輸的最小「訊息單位」。所有透過網路傳輸的訊息(不管是信件、語音、甚至影片串流)都被拆解為多個封包,每個封包內含傳輸資訊等重要資訊,確保資料在龐大複雜的網際網路中,正確無誤地抵達目的地。過去數十年,網路基礎設施的投資便是圍繞封包品質的確保(如錯誤重傳機制)、提升傳輸效率(如頻寬升級、資料壓縮),以及整體系統吞吐量(throughput)的擴展而展開。正是如此,過去三十年來,我們才有日益豐富的網路服務,如訊息溝通、電子商務、社群媒體、影音娛樂等。而在LLM中,token則成為關鍵「智能單位」。語言模型在處理自然語言時,將一段文字訊息拆解成多個token,每個token代表不同的語意片段,經由模型運算後再組合(生成)為有意義的內容。與封包相似,token的數量和生成效率直接影響運算成本以及使用者體驗。例如,過去3年AI運算基礎建設投資的大幅增長,就是為了確保LLM模型的能力(token品質)以及服務品質(token生成效率),甚至近期邊緣裝置上token處理能力的提升,也正逐漸顛覆AI應用的場域邊界,向更多元、即時且全新的場域擴張。單看過去三十幾年網際網路packet的發展,我們發現token也在走類似的進程。不管是基礎建設,或是3個技術優化方向,包括「品質保障」、「效率提升」,以及整體「系統吞吐量的擴展」。品質保障:網路早期透過TCP/IP協定來確保封包傳輸的正確性,而LLM則透過scaling law加大模型、使用更多訓練資料,甚至後來以思維鏈(Chain-of-Thought;CoT)為基礎的推理技術,確保生成的token內容正確且提供高品質推理服務。效率提升:隨著頻寬提升和資料壓縮等技術的成熟,封包傳輸成本大幅降低;同樣地,token處理成本亦透過模型蒸餾(distillation)、量化(quantization,使用較少位元表示數值)、KV Cache等張量(tensor)降維壓縮,或是使用更有效率的架構(如MoE)來降低運算量,甚至有機會使大模型有效地運行於終端裝置。系統吞吐量擴展:過去網際網路透過光纖技術和提升邊緣設備(交換器、路由器等)大幅提升資料傳輸量,或是使用內容傳遞網路(CDN)等技術提高封包全局效益;在LLM領域,資料中心的垂直擴充(scale-up,提高算力、記憶體等提昇單一伺服器效能)與水平擴充(scale-out,高速網路連結、排程提升分散式系統效能)、或是採用雲端—邊緣混合架構(Cloud-Edge-Hybrid)等,實現整體系統更高的token處理吞吐量,滿足未來多元且即時的應用需求。循著過去網際網路發展的主軸,我們可以預見AI技術即將引爆的下一波變革—智能「去中心化」(普及化),低成本token開始在終端設備上運行。情境將如同2007年行動網路興起之際,packet進入行動裝置,催生智慧型手機,也推動Uber、LINE等全新服務的誕生,引爆長達十數年的行動生態系蓬勃發展。網際網路數十年來最佳化packet傳輸技術,帶動網路服務的快速普及,特別在行動網路時代,我們見證大量新應用與商業模式的誕生。這段歷程也為觀察生成式AI提供重要參照—當前token的品質提升與單位成本下降,正如當年packet優化所引發的技術擴張與資本投入,預示著新一波智能設備與創新應用的興起。隨著token處理成本持續降低,AI有望成為如網路般的關鍵基礎設施,深刻重塑產業結構。近來多個開放LLM模型在效能與成本上的突破,更強化LLM商品化與大規模應用的趨勢。未來如何因應?過去的歷史已經顯明,在技術變革時,應以開放的態度,極力接近實際場域,理解技術應用發展方向,甚至與合作夥伴共同設計開發,參與組建生態系。更積極的作法,是投資(國際)學研單位,甚至新創團隊,理解新的場域應用,以及技術演進。鑑往知來,回顧packet的發展經驗(許多企業經營層也曾親歷其境),將使我們更有效地掌握token所帶來的顛覆性機遇。對資訊電子產業的投資者與決策者而言,更是攸關未來競爭優勢的關鍵課題。每一次產業典範的轉移,總會帶來新的硬體、服務、企業、生態系,甚至整個產業格局的興起與殞落。當我們已清楚AI大模型即將重塑未來十年的產業樣貌,或許網際(行動)網路曾走過的歷程,正可作為產業AI戰略規劃的重要借鏡。
川普風暴與科技業的諸多挑戰(14):留下一線生機
留一個伏筆,掌握最後的生命線。意思是你如果不夠強大,像是烏克蘭人一樣,手上沒有一張像樣的牌,那你就等著任人宰割了!台積電董事長魏哲家說,蓋一個廠大約需要2.5年,而且這是在水電、土地不缺的情況下。要蓋3奈米的工廠,一次三條線,如果能調整到符合客戶需求大概要5年。例如硫酸等化學材料,在美國購買的話是5倍的價錢,從台灣運到洛杉磯,再用卡車送到鳳凰城,這樣還便宜很多,如果您是企業家會如何算計呢?當年在亞利桑那州幫英特爾(Intel)蓋廠的那一批人,早就不知去向了,工人、施工機構都要從亞利桑那州以外找,再碰到每個州的立法條件不同,光是1.8萬條的法規修正就花了3,500萬美元,可以想見在台灣以外的地方設廠,難度比大家想像的更高。這一路相隨的是帆宣、益登等這些台灣設備公司,帆宣董事長高新明說,我們早就等在亞利桑那州了,台積電要什麼都全力配合。對比美國高高在上的要台積電去美國投資,日本卻是戒慎恐懼的深怕台積電不高興,台日之間的互動,從以往日本人俯視的角度,換成平起平坐。但日本廠有更大勝算的關鍵,是日本的產業文化與本土產業需求。過去台積電確實也可以從日本拿到不少訂單,但以後就近供應,而且Sony、電裝(Denso)那些參與投資的日本公司都是長期經營的業者,兩者合作是台日雙贏。在台積電決定再加碼投資1,000億美元時,川普(Donald Trump)改口說:「算他們厲害」。但不是台積電厲害,而是台灣無論在地緣政治或科技產業發展的路徑上正處於要衝,這種「要害」地位才是讓台灣不可或缺的關鍵。川普不是因為愛台灣而鬆手,是因為搞不定台灣才放手的。那什麼樣的情況川普會鬆手、放手呢,如果台灣「認慫」,或者不知死活,那麼美中都會把台灣當棄子打!MAGA現在是全世界的人共同的理解,但我們都知道川普理解的「美國再度偉大」,背後是美國優先、美國唯一。我常說,美國是以科技為利器,以金融、軍事為後盾,不斷的建構新的遊戲規則掌握全球的霸權國家。金融的利器中,最關鍵的顯然是美元與關稅。台積電戒慎恐懼,但台灣並沒有準備好中央研究院院士莊炳湟問,工廠搬到美國是美國暗示「台灣必將回歸」的訊息嗎?台灣朝野在面對台積電宣示在美國投資1,000億美元時,各自表態的內容差距很大,甚至有些離題。國民黨說「淘空台灣」,民進黨反擊說當年馬政府贊成西進是「布局」,今天台積電到美國卻成了「淘空」,兩黨完全沒有共識,也沒有論述的能力。那麼賴總統問張忠謀的時候,張忠謀應該怎麼回答呢?問的對象、能力、經驗不同,善於回答問題的人經常可以因材施教,所以我想知道賴總統是否問對問題,甚至問對問題的可能性有多高?如果平常不曾參與科技業的問答,就如同曾國藩說的:「未聞平日不能早起,而臨陣忽能早起者」。我也常說,在網路時代,加上有了人工智慧這個工具之後,所有的問題都有答案,但關鍵是您問對了問題沒有?如果總統問錯問題,那是誰的錯?當然是幕僚的錯。總統並非無所不知,甚至我們本該就不要期待總統無所不知,總統基於國家戰略上的需要,以及自己的道德高度向社會賢達請益是天經地義,而幕僚做好規劃乃是常態。但關鍵是賴總統的科技戰略幕僚是誰?或者有哪個高瞻遠矚的智庫專家已經做好準備,為總統府準備了十套、八套劇本。不久前,與一家超過200億美元的大公司CEO談起多變的時代,企業應該如何因應時。這位CEO說,雖然他反對,但他幕僚告訴他,應該花一筆錢找頂級的顧問公司做幕僚。台積電到美國投資明明有動搖國本的疑慮,政府的方法還是找幾個人「盍各言爾志」,那麼這到底是誰的問題?台灣明明已經是個年均3.5萬美元的中高所得國家,2024年超收稅金5,200億元,但國家戰略還在土法煉鋼,明顯有人失職,或者根本是「掉以輕心」。賴總統求教於張忠謀、魏哲家,這是禮賢下士,還是禮失求諸野,甚至是束手無策的不得已之舉?如果我們知道2024年台灣中央政府歲出總預算是新台幣2.88兆元,以32:1美元計算的話,正好是900億美元,那麼動輒投資1,000億美元的台積電,以及一年資本支出總額高達400億美元的台積電,用「富可敵國」來形容,才是貼切的說法。
川普風暴與科技業的諸多挑戰(13):鄉村包圍城市
中國的「信創計畫」以自主產能、技術替換外資、進口產品是既定政策,但已經購買的半導體設備可能暫時閒置,因為沒有訂單並不裝機,顯然中國採購的半導體設備並沒有充分利用。中國最近流傳的微影技術是還在實驗室的技術,並未商轉,中國小粉紅一面倒正面吹捧,背後是過度擴張的國家主義,離實際上可以商轉的技術還有很大的距離。危與機總是共存,甚至並行不悖。經川普(Donald Trump)動過「易筋」之術的美國,將會改變全球化的格局。主要的國家都想自保,「主權AI」只是個起步,更多國家希望建構自己的生態系,那麼對台灣而言是機會還是挑戰?此外,當資本的流向從過去兩年過度集中於以資料中心為核心的HPC,在DeepSeek攪亂一池春水之後,未來離「邊緣運算」(Edge Computing)當道的時刻並不遠,而邊緣運算更要有所區隔,因為他們面對的樣貌也有所不同。傳統的PC與手機是一塊,新興的產品在產銷兩端都有不同的樣貌,而穿梭在傳統與新興產品之間的可能是影響深遠的「智慧製造、工業控制」的中間環節。手機產業在2007年iPhone出現後的將近20年,中國是最大的獲利者。一方面14億的人口帶來龐大的數據流量,讓本土的新創公司擁有一個發展的溫床,而背後是2000年前後大舉前往中國建構生產體系的NB業者。在NB產業的連動支撐下,中國本土的紅色供應鏈崛起,加上日益繁榮的內部經濟,以及2008年成功舉辦奧運的經驗,讓中國人信心爆表,也顯露了與美國一爭長短的自信心。如果我們說手機產業是福星,其餘產業圍繞在手機產業的周圍共創、共榮、共享應該並不為過。現在全球十大手機品牌有八家中國品牌,中國手機廠不僅在新興國家大發利市,甚至在非洲都已經成為不可或缺的工具。中國人以鄉村包圍城市的策略,在智慧手機的時代發揮到極致,並且將競爭優勢擴張到新興產品上。哪些產品或產業將成為下一個階段走向邊緣運算時的關鍵產業呢?從電動車到智駕車的發展路徑上,我們要面對中國的電動車已經走出國門,全球的電動車過半來自中國,下一個接手的就是智駕車。當然在智駕車的發展過程中,牽涉到軟體的部分會有國家主權的問題,西方國家不會輕易放手,中國面對的挑戰遠比單純的把電動車,或者上下游產業一起往國外送的模式困難。從NB、手機產業延伸而來的電子產業供應鏈已經非常完整,在電動車之前,中國的網通設備、無人機產業已經席捲全球,只是在美中貿易大戰之前,大家心照不宣而已。現在中國在新興產業上的領導地位更從無人機進化到人形機器人、智慧眼鏡。以NB為主的PC產業至今還控制在台灣手上,沒有強大的PC產業,台灣也不可能在伺服器的上下游產業中勝出。
川普風暴與科技業的諸多挑戰(12):這是亞洲人的場子,也是中國人的場子
在很多國際會議中,中國總是派出一流高手參與,從美國、紐澳來的西方人不容易招架,甚至場內、場外的私下對話,也沒有太多人敢挑戰中國的論述。但頂尖聰明的人談的不是「Data level」的論述,而是專注於「Code level」的本質問題。AI牽涉到的不僅僅是美中兩大國的競合,更牽涉到二線國家如何維持AI主權的艱難課題。我所謂的二線國家包括德國、日本、印度、南韓,從原生技術、製造能量到新技術,如In-memory Computing,資料中心與背後的伺服器、冷卻技術,甚至把能源消費控制到最佳狀態,都是二線國家非常艱難的課題。更多的資料中心,顯然需要更多的能源,如果不能面面俱到,那麼局部性、關鍵性的領域又可以涵蓋哪些?搞清楚大環境的很難自稱是科技大國。「Either or not」 thinking,已經不足以答覆複雜的問題,華人傳統在天地之間留下「人」的思考更為重要,未來必須以人為本,讓更多人理解這些改變是必然,並提供他們參與的機會。但顯然現在中國的政策上並未顯現該有的「人味」。從說一套,到做同樣一套,顯然離理想的距離很遠。Intelligence with wisdom:是理想,但希望不是夢想我們面對的是「Open ended questions」,這種問題都不是用「Yes or no」來回答,人類的智慧深受考驗,ChatGPT或許給了我們一次重新定義民主的機會。我們很想問AI能做什麼,但新加坡人問的是AI能幫新加坡做什麼。人口少的新加坡不可能產生龐大的數據,而數據正好是未來的資產,新加坡該想的是自己的問題,台灣不也如此嗎?至於AI能幫人類做什麼,留給其他人去想吧。所以,我很清楚知道知識份子、意見領袖不是把美國、中國的觀念帶回家,就認為自己已經善盡職責,如果一個教授只能每天拿新聞「貼文」而沒有自己的看法,那他為什麼可以教書?當然,不斷出現的黑科技,也會改善能源的效率,打破框架,跨國共用資料中心可能嗎?台灣不僅需要考慮從菲律賓輸入電力,甚至應該與菲律賓討論共構資料中心的可能性。過去堅持擁核、反核的人,大概都沒想過如今我們會面對這樣的困境吧?既然如此,為什麼是少數不接受新知的人在幫我們做決定呢?
川普風暴與科技業的諸多挑戰(11):國際秩序的重整
是啊,中國人抱怨美國的非關稅障礙,但很多想進到中國市場的外國車廠、品牌,哪一家不是鎩羽而歸?當世界貿易組織的(WTO)規範成為聊備一格的規矩,現在真正訂定遊戲規則的是川普(Donald Trump),其次是中國的習近平,但任何想起而效法的國家要擔心沒有足夠的科技實力,也擔心被報復。全球化的時代飄然遠去,我們成了享受成果的最後一代!每個智駕車參賽者都知道Level 3的規格,但只有中國電動車可以落實。也許有人擔心智駕車的風險,如果您對科技的發展具備足夠的自信,每個人都可以輕易預測智駕車的事故率必然可以快速改善,中國人不會為了枝微末節的顧慮而延緩發展進度。小鵬汽車副董事長兼總裁顧宏地說,2026年中國Level 3的智駕車必然可以上路。這家才成立10年的公司,已經是行業裡的老鳥,中國全力推動電動車,也有很多國家安全與全球競爭的考量。中國更相信「智駕車是AI的天然牧場」,美國現有3.5億輛運作中的汽車,如果被翻天覆地的改變,那也可能是美中經濟實力的分水嶺。過去美國人以汽車定義了Mobility的意義,未來會是中國人來定義嗎?其他二線國家的觀察日本的Rapidus只是日本重建半導體產業的開始,當地都是50~60歲之間的老工程師,能做的事情是將自己的經驗傳承給下一代,而日本政府願意投資數百億美元用於可能沒有回收的事業,這是很多國家政府做不到的決心。地球人的賽場已經從地面一直打到太空,許多影音視訊的服務其實來自遙遠的天空。紐澳兩國之間已經有很多衛星通信的協作模式,美中兩大強權之外,澳洲加上日本、印度也可以在太空競賽中佔有一席之地。印度、日本、澳洲相互喊話,但仍缺臨門一腳。至今為止,太空科技的投資有80%來自政府部門的投資,一方面太空科技必須結合電子、機械、航太科技,是一種昂貴、高門檻的投資,二方面牽涉國家安全的議題,企業參與仍存在太多變數。新加坡已經發射超過30顆衛星,並利用這些衛星彙整各種服務,他們很明白國家的邊界與事業之間的關係正在被重新定義中。金融業必須知道透過無線網路交易的服務也正在被改寫中,新加坡與世界銀行合作正在實驗各種新的服務模式。但現實的世界裡,很多通信設備都來自中國,而台灣不是聯合國會員,連資料分享、發射衛星都受到很多的限制。在太空科技產業的角色不會是主要的角逐者,但就像AI一樣,台灣嘗試成為主要的設備供應商。
川普風暴與科技業的諸多挑戰(10):中國式的創新
電動車天生就是實驗AI最佳的場域,AI機器人產業談的是如何從2D進化到3D、4D以及無限延伸的可能,我聽到的不僅僅是技術的極限,更多是事業經營模式的創新。高瓴投資總裁張磊特別強調「中國不僅僅是技術創新,更是事業模式創新的領導大國」,來自中國的新創業者讓人印象深刻。新加坡政府每年提撥GDP的1%用於「Funding」新創產業,如果以台灣8,000億美元的GDP總量對比,台灣可以拿出80億美元。注意,他用的詞彙是「Funding」,不是用來辦活動、補貼研究機構的費用。ChatGPT改變世界,DeepSeek帶來風暴ChatGPT推出之後,NVIDIA扶搖直上,大家在讚美的同時,也有不少有心人在思考如何取而代之。我又想起Andy Grove說過的話:「如果您是產業領袖,別人會想盡辦法取代您,直到您一無所有」。中國的DeepSeek開了門,會有更多新創公司走上這條路,甚至看似堅不可摧的半導體製造也很難避免。我們可以預期前沿科技加速發展,更多的機會將來自邊緣運算的商機。機器人的控制會從2D、3D一直走向多元控制的結構,應用驅動是必然,也會給亞洲龐大的人口結構帶來機會。數位分身(Digital Twin)的概念,一開始被用在AR/VR/MR的消費性的應用上,未來卻很可能直接導入到智慧製造領域。就像量子電腦一樣,這不會是20年後才會兌現的新科技,而是10年之內將會活生生的出現在我們面前。硬體設備的演化也可能比大家想像的更快,但如何教育使用者,讓這些新科技成為大家熟悉的應用則是個高難度的挑戰。「規模」,甚至是「超大規模」(Hyperscale)才足以掀起市場上的新浪潮,但我們都要面對供應鏈上人為干擾的挑戰。但以後的終端設備絕對不會是「iPhone Like」的產品,如果這些產品一起點亮時,我們會從太空看到一個高亮度的地球,而從2025年初CES展中展示的智慧眼鏡來看,崛起的大多是中國的廠商。DeepSeek不僅挑戰了OpenAI,在導入智慧座艙、智駕車應用之後,進一步為中國軟體鬆綁,成為中國人口中的一大勝利。而中國也將自訂標準,例如在智駕車的規範中1,000米以下是低海拔,但中國在科技演化的過程中,會定義出低海拔的相關規範。而在這些議題上,中國的戰略是「Easy to adopt」,讓大家共享生態系,一旦參與者更多,淘汰更激烈,中國企業獲勝的機率就越大。
AI大語言模型無法馴服π
和一個人一生中相關的數字,都可以在圓周率的某一個位數找到。這是因為圓周率(π)是一個無理數,也就是說,它的十進制展開既不終止也不循環,並且其數字序列是隨機的。儘管目前沒有證據能證明圓周率的數字完全隨機,數學家普遍認為圓周率的數字分布沒有任何規律或模式,每個數字序列都有可能在某一位數中隨機出現。這意味著,無論選擇哪個數字組合,包括個人的生日、電話號碼或重要年份等,理論上都能在圓周率的某個位置找到。這些數字可能會在圓周率的某個長段中出現一次或多次,具體位置由數字的隨機分布決定。這種現象與數學中的均勻分布有關,這表示所有數字(0~9)在圓周率的各個位數上出現的機率理論上是相等的。因此,任何有限長度的數字組合都有可能出現在圓周率的某個位置。以最奇特方式運用圓周率的人,應屬高德納(Donald Ervin Knuth)。1969年時他開始發展一種計算機語言,讓使用者能夠以數位方式排版數學公式。接下來高德納花十年功夫,設計一套論文排版系統TeX,並以圓周率來當開發版本編號,由TeX3開始,現在的版本是TeX 3.141592653。人類於四千年前就嘗試找出π,但直到今日,我們仍然只是接近其實際數值。首次對π進行嚴格計算的,是西元前287至212年的希臘古數學家阿基米德Archimedes),他利用畢達哥拉斯定理計算內接於圓的正多邊形與外接於圓的正多邊形的面積,因為圓的實際面積必然介於這兩者之間,因此這些多邊形的面積提供了圓面積的上、下界。他明白這樣只能得到π的近似值,而非其確切數值。透過這種方法,阿基米德推導出π介於3.1429與3.1408之間。2021年8月19日,瑞士格里松應用科技大學(University of Applied Sciences of the Grisons)計算出圓周率最精確的數值達62,831,853,071,796位數。有趣的是,神奇的AI大語言模型無法馴服π。我問7種大語言模型,卻都給我不同答案。我詢問和我相關的4個數字:「May I ask at which digit position 1026 appears in the digits of pi? 」結果每個LLM給我的答案都不同。過去的測試中,總會有幾個LLM給出相同的答案,但這次完全沒有共識。我先試GPT,得到答案6284。接著要求GPT自我驗證:「What is the four-digit sequence starting at position 6284 in the digits of pi?」結果,得到的回覆是7590,而非1026。我試Grok,得到的回覆是1639,反向驗證,也沒得到1026,而是5807。我試Le Chat(Mistral.ai),得到的回覆是176451,反向驗證,得到3141。我試Qwen2.5-Max,得到的回覆是39,反向驗證,得到7169。我試DeepSeek,得到的回覆是8580,反向驗證,得到3099。我試Tulu 3,得到的回覆是2480,反向驗證,得到3282。我再試Gemini,得到的回覆是175319,反向驗證,他不告訴我答案,建議我找數學工具來算出。我最後試Claude,他不告訴我答案。這些大語言模型給錯答案的原因是,它們試圖自行編寫程式來找答案,但程式未能正確運行。我詢問Pi-Search頁面,它回答說:「字串1026出現於位置14678。這個字串在π的前2億位數字中出現20,130次。」這應該是正確答案。我的測試是在2025年2月24日。在告知GTP或Grok網路上特定數學工具可給答案時,它們的確會認錯,並依我建議,運用工具找到正確答案。隨著大語言模型的進化,也許未來能在第一次詢問時給出正確答案。
智慧應用 影音