在人工智能生成內容(AIGC)時代加速推進的背景下,智算中心對光互聯(lián)技術的需求日益迫切。AIGC的興起使得大模型參數(shù)呈指數(shù)級增長,數(shù)據(jù)中心算力需求激增,傳統(tǒng)電互聯(lián)逐漸暴露出帶寬、功耗及時延方面的瓶頸。光互聯(lián)技術憑借其高帶寬、低功耗、低時延的優(yōu)勢,正迅速成為支撐智算中心高效運行的“神經(jīng)網(wǎng)絡”。
近日,凌云光在第十四屆“硅基光電子技術及應用”暑期學校中發(fā)表了題為《智算中心光互聯(lián)技術進展》的主題報告,詳細梳理了光互聯(lián)技術的發(fā)展脈絡,并聚焦于Scale-Out與Scale-Up架構下的核心演進路徑。報告深入解析了可插拔光模塊、共封裝光學(CPO)、線性驅動可插拔光學(LPO)等關鍵技術,以及光電路交換(OCS)應用和光子引線鍵合(PWB)、玻璃通孔(TGV)等先進封裝工藝。
AIGC時代對智算中心的光互聯(lián)網(wǎng)絡提出了“兩高兩低”的要求:高帶寬、高可靠、低功耗和低時延。隨著AI大模型參數(shù)的迅速擴展,網(wǎng)絡帶寬成為核心瓶頸,而網(wǎng)絡的高可靠性、低功耗和低時延特性也是確保AI模型訓練順利進行的關鍵。為滿足這些需求,AI網(wǎng)絡架構普遍采用數(shù)據(jù)并行、流水線并行與張量并行等策略,并分為Scale-Up和Scale-Out兩種架構。
在Scale-Out網(wǎng)絡方面,可插拔光模塊與CPO技術的協(xié)同演進成為關注焦點。隨著AI模型的快速迭代,全球光模塊市場迎來爆發(fā)式增長,400G與800G光模塊成為主流,而1.6T和3.2T光模塊也在加速研發(fā)。Retimed可插拔光模塊、LPO、線性接收光學(LRO)和多芯光纖(MCF)光模塊等技術的不斷發(fā)展,進一步優(yōu)化了功耗與密度。同時,OIF已啟動“High Density Connector”項目,推動前端可插拔與近封裝光學(NPO)的發(fā)展。
CPO技術通過將光芯片與交換芯片封裝在同一基板上,顯著提升了帶寬密度和能效。Nvidia等企業(yè)在CPO方面取得了重要進展,但其產業(yè)鏈成熟度、生態(tài)兼容性及可維護性仍有待提升。相比之下,LPO在功耗表現(xiàn)上達到當前可插拔形態(tài)中的最佳水平,但擴展性受限。單Lane 400Gbps技術的突破也為未來高速光互聯(lián)提供了重要支撐。
在Scale-Up網(wǎng)絡方面,光I/O(OIO)的崛起成為突破傳統(tǒng)電互聯(lián)瓶頸的關鍵方向。OIO通過將光芯片與計算芯片共封裝于同一基板,實現(xiàn)了更高的帶寬密度、更低的延遲與功耗。Google等企業(yè)在Scale-Up架構中引入了基于OCS與可插拔光模塊的OIO方案,并逐步實現(xiàn)從400G、800G到1.6T的演進。同時,Ayar Labs、Avicena和TSMC等企業(yè)也在光電合封方向取得了重要進展。
除了上述光互聯(lián)技術外,空芯光纖和長距相干傳輸?shù)认冗M光技術也值得關注。空芯光纖以其低時延、低非線性、低損耗和寬譜特性,在超算、數(shù)據(jù)中心互聯(lián)(DCI)和海纜等應用中展現(xiàn)出巨大潛力。而長距相干傳輸技術的創(chuàng)新方案則實現(xiàn)了更為高效的大容量長距傳輸,大大提升了長距離通信的穩(wěn)定性和性能。
面對高速光互聯(lián)技術的加速演進,凌云光圍繞光模塊測試與光電芯片設計封裝,構建了一套完整的解決方案。在高速光模塊產線測試方面,凌云光推出了面向800G/1.6T IMDD模塊的自動化測試方案,實現(xiàn)了高效分選與穩(wěn)定交付。在光電子集成芯片測試方面,凌云光構建了高精度測試體系,適用于硅光/InP等多平臺芯片的全波段分析。在光電子集成芯片封裝方面,凌云光重點布局PWB與TGV兩大核心技術,支撐高密度光電集成需求。
當前,光互聯(lián)正邁入新階段,模塊形態(tài)不斷演進,封裝集成技術持續(xù)升級,網(wǎng)絡架構也在重構。凌云光以其深厚的技術布局,積極參與并引領這一技術浪潮,為AIGC時代智算中心的高效運行提供核心支撐。