人工智能虽好,但也有为人熟知的缺陷。机器学习训练时需要有大量的數據输入,而且在建立模型时,有天然的「维度诅咒」(curse of dimensionality)
维度是指一笔數據的特徴(features)数目,在數據空间中,这类數據就需要此特徴数目的维度空间中的点来表达。以制程为例,數據的特徴可能就包含温度、时间、长度、厚度等等参数,这个数目就是數據的维度。
空间的维度一旦变高,空间的体积成指数成长,即使有巨量的數據,在如此庞大的空间中數據点显得稀疏(sparse),传统的机器学习变得无法轻易的取得數據的相关性,有效的模型难以建立。
但是对于量子计算而言,维次不是问题,至少在通用容错量子电脑(universal fault tolerant quantum computer)出来之后绝对不是问题。量子电脑每增加1个量子位元,它可以处理的空间维次数目就可以翻倍,所以对于具有许多特徴(或者参数)数目、较少的數據群体,用量子电脑来执行机器学习就有显著优势。
2025年在Advanced Science由Zeheng Wang等发表的论文 “Quantum Kernel Learning for Small Dataset Modeling in Semiconductor Fabrication: Application to Ohmic Contact”应用量子计算于氮化镓(GaN)高迁移率晶體管(High Electron Mobility Transistor;HEMT)的量子机器学习研究,显示量子计算在少量數據—仅有159笔數據—的状况下,其预测表现远优于传统机器学习,预测数据也与实验结果相吻合。
这个研究的题目就是在硅片上外延(epitaxy)长氮化镓/金氮化镓的夹层,在2种材料的界面处形成一个HEMT的二维电子气体(2 Dimensional Electron Gas;2DEG)通道(channel)。电子通道中的电子是由GaN及AlGaN所注入(injection)的。为了能够让AlGaN端能有充份的电子注入,必须于AlGaN上长有金属堆叠(metal stack),并且与AlGaN的界面形成欧姆接触(Ohmic contact)。这样的层层堆叠之后,通常需要退火(anneal)的过程以稳固其分子结构。本研究的目的就是在建立在各种材料厚度、金属堆叠种类、退火温度及时间等参数的模型,借以寻求欧姆接触的最优解。
量子计算处理这个研究的方法与传统机器学习的方式有部分大致雷同—这也比较容易公平的比较二者的优劣。
首先将制程的37个参数以主成份分析(Principal Component Analysis;PCA)简化成5个参数,然后用变分自动编码(Variational AutoEncoder;VAE)合成新增數據,可以将样本数扩大。这两个步骤在量子计算与传统的机器学习中都一样实施,目的在简化模型建立的复杂度、增加样本数目。
量子计算比较不同的是将简化后的5个参数映射到5个量子位元上,实质上是将一个5维的空间嵌入一个2的5次方—32维空间中。然后在此高维度空间中以量子核(quantum kernel)两两比较各數據的相似性(similarity)。
量子计算比传统机器学习的优势为在高维度的空间中數據的非线性(non-linear)特徴比较容易显现,所以其所建立的模型比传统机器学习的要较精确。
这个量子计算于半导体制程的应用其实是在传统电脑上模拟量子位元及量子机器学习所得到的结果,但是模拟无碍于证明量子机器学习的优越性。
量子计算新算力的加入对于半导体的研发意义重大。仅凭少数的數據,就可以建立参数数目巨大的模型;工程批的数目可以大幅减少,研发时程缩短、经费下降。
摩尔定律虽然面临较过去严峻的挑战,但是半导体产业增加新经济价值的步伐因有诸种算力的加入而未曾放缓。