2023年9月的SEMICON Taiwan会议中,矽光子(Si photonics)技术引起热烈讨论。
在9月5日「矽光子国际论坛」中,笔者也受邀与台积电、日月光、工研院、美国Cisco及日本爱德万测试(Advantest)的专家同台,主持人是日月光CEO吴田玉,共同讨论矽光子技术在人工智能(AI)时代中,所能扮演的角色。以下是个人在这个议题中,所表达的看法。
众所周知,矽光子技术已经发展超过20年,主要是利用CMOS成熟制程,将处理光信号所需的光导管、调变器、光栅、耦合器,甚至光侦测器等主被动元件整合在矽基板上。目前唯一无法整合进矽基板者,是半导体雷射,因为涉及到不同的材料系统,只能以封装的方法处理。矽光子基板负责将光的信号转换为电信号,此为接收端,发射端就是将电信号经由雷射转换为光信号。由于使用成熟半导体制程,在微小化、整合度、量产的良率,甚至成本都具有优势。再加上使用光信号,对比于电信号,又有着高带宽、低延迟(low latency)以及低功耗的优势。
自从光纤通讯在1980年代被引进之后,一直担任信号传输的角色。初期在人类使用数据量还不大的时候,光通讯运用在长距离的传输,如海底光缆、大都会地区的网络。随着数据量的提升,光通讯开始进入区域网络。近来生成式人工智能(generative AI)的兴起,最大的数据产生及传输量是发生在AI服务器之间,因为任何一个大型的模型,都包含数百亿个参数,而每次训练所要花费的算力是惊人的,这些都依赖芯片彼此间的平行运算以及数据交换。
拜半导体先进制程之赐,目前处理或计算1个指令,只需要1~2 nsec的时间;但是数据传输速度的增幅,却永远跟不上算力的增加。光是在光纤内运行1米距离会产生5 nsec的延迟,因此AI服务器的算力有相当的时间在等待数据而停滞。若改用电信号来传输,等待的时间就更久了。解决之道当然就是将转换光信号的装置,愈靠近CPU/GPU/ASIC芯片愈好,以改善信号延迟,这中间最好避免掉电路板。因此,co-package optics(CPO)包含矽光子基板,便应运而生。
CPO目前主力是放在交换器(switch)内,将矽光子基板与处理电信号IC芯片,以堆叠(stacking)的封装方式结合,再连接上光纤,比邻于各式IC处理器,这就是最靠近及最低延迟的选择方案了。
在2000年代中期,IBM在其年度的技术展望(Technology Outlook),特别提出光连结(Optical interconnect)为未来技术的重点。IBM非常自豪于技术上的预测,也表示自己从来没有预测失败过,有的只是发生时间的早晚。彼时并不知道会有AI运算的蓬勃发展,也不清楚半导体的技术会进展到3纳米以下。但是很明确的是,人类在数据传输的使用量会持续地增加,而矽光子技术将在光连结上扮演重要的角色。
当时光连结的提出,也不清楚是会发生在芯片与芯片间(chip to chip)信号的连结,还是载板之间(board to board)信号的连结,或者是服务器架间(rack to rack)的信号连结。如今服务器架间的信号连结,甚至于架上的层与层之间(unit to unit),已经广泛地采用光连结技术。而芯片之间信号的连结,已经被台积电的先进封装技术3DIC/CoWoS/chiplet/fabric,使用电信号交换给解决了。
接下来的重头戏会是载板之间的信号连结,目前的主力还是使用电信号的连接,至于光的连结就拭目以待。
CPO结合矽光子技术,提供AI风潮中提升数据传输速度的最佳解决方式,这对于产业生态链却是一个巨大的改变。
传统使用插拔(pluggable)光模块的生态系,并不会坐以待毙。在今年(2023)的全球光通讯大会(OFC)上,linear-drive pluggable optics(LPO)即受到广泛的注意,被视为传统势力的一大反扑。
Linear-drive的概念是拿掉插拔光模块内re-timer/DSP功能,而增加在ASIC内信号处理的负担,如此便减低模块内的信号延迟及功耗。因此之故,可以再往前推进1~2个时代的产品,而整个产业生态链不会有太大的变化。如同半导体制程所使用的浸润式DUV微影设备,在不改变DUV曝光机的生态下,又往前推进几个时代,直到EUV曝光机接手。
矽光子CPO的时代终究是会来临,若LPO顺利推展,可能会使发生的时间延后。事实上,linear-drive的概念亦可以使用在CPO上,如此不论在信号延迟及功耗上,又会有更佳的表现。
本文感谢与郑鸿儒博士的讨论。
曾任中央大学电机系教授及系主任,后担任工研院电子光电所副所长及所长,2013年起投身产业界,曾担任汉民科技策略长、汉磊科技总经理及汉磊投资控股公司CEO。