ICC訊 6月19~20日,2024中國光網絡研討會在北京成功舉辦。在會議期間,海思光電先進光電實驗室主任滿江偉博士發(fā)表題為“星云光模塊助力智算中心光互聯(lián)技術發(fā)展”的主題演講,分享智算中心網絡對光互聯(lián)的技術需求以及海思光電面向智算中心光互聯(lián)的星云系列光模塊產品。
近年來,大模型的爆發(fā)性發(fā)展帶動了AI智算中心向超大規(guī)模集群演進。大規(guī)模計算集群中的NPU/GPU高性能互聯(lián)成為影響網絡性能的關鍵因素,并且正在經歷著快速迭代演進。不斷加快的產品換代催生光互聯(lián)接口的代際升級,面向AI光互聯(lián)的光模塊正迎來爆發(fā)性增長。
滿江偉博士在分享中指出:運營商的數(shù)據(jù)中心分布廣泛,涵蓋從城市的核心數(shù)據(jù)中心到區(qū)域的邊緣接入數(shù)據(jù)中心,部署環(huán)境復雜且面臨鹽霧、硫化、水汽等復雜場景挑戰(zhàn),因此對于光模塊的長期性能和穩(wěn)定性有較高的要求。IPEC國際光電委員會正在協(xié)同全產業(yè)鏈伙伴探索電信級光模塊可靠性保證。同時,AI智算中心向大規(guī)模集群演進的過程中,由于采用了大規(guī)模并行計算,AI計算相比通用計算具有更高的集約度和更大的能耗,因此在大帶寬、低時延、低功耗、高可靠、智能化等多個方面都對光互聯(lián)模塊提出了新的挑戰(zhàn)。
海思光電立足AI智算中心的光互聯(lián)需求,聯(lián)合計算、網絡等領域進行協(xié)同創(chuàng)新,推出面向AI智算中心的星云系列光模塊,從五大維度適配AI智算需求,提升計算網絡效率:
-- 大帶寬維度:依托基于VCSEL的多模光芯片和基于TFLN、EML及硅光的單模光芯片,打造400G、800G短距光互聯(lián)產品,匹配AI智算中心的互聯(lián)需求。持續(xù)提升單Lane速率,推進光模塊向更高速率演進
-- 低時延維度:推進系統(tǒng)側、模塊側的協(xié)同處理,采用低時延FEC等措施降低端到端時延。此外,針對業(yè)界討論熱點之一的LPO方案,持續(xù)關注其在標準化、互聯(lián)互通等方面的挑戰(zhàn)與進展
-- 低功耗維度:在電/光/系統(tǒng)級等多個領域進行協(xié)同優(yōu)化,充分挖掘技術潛力,構建系統(tǒng)級的功耗優(yōu)化方案來降低per-bit的功耗
-- 高可靠維度:AI智算網絡的鏈路故障來源于光纖鏈路、連接器、光電轉換單元、系統(tǒng)設備等多個部分。針對AI計算對高可靠光互聯(lián)的需求,從系統(tǒng)層面進行統(tǒng)籌考慮,采用光/電聯(lián)合設計,提升光模塊長期工作的穩(wěn)定性和系統(tǒng)的可靠性
-- 智能化維度:引入AI技術提升光模塊和智算網絡的可運維性,通過對光模塊、光鏈路參數(shù)的數(shù)據(jù)檢測分析,對光模塊本體、光電鏈路健康度進行診斷;同時,與設備層面進行聯(lián)動,主動預防網絡故障
滿江偉博士最后指出,AI及AI智算網絡正處于前所未有的加速發(fā)展階段,這對光互聯(lián)既是機會也是挑戰(zhàn)。海思光電打造的星云系列光模塊將繼續(xù)適配AI智算網絡對光互聯(lián)的關鍵需求,賦能高可用、高可靠、智能化等業(yè)務場景,助力AI數(shù)據(jù)中心的蓬勃發(fā)展。