本文轉載自微信公眾號“光通信充電寶”,作者馮振華博士,訊石經允許略作刪改。
本篇為800G MSA白皮書解讀的第二篇。開始之前,先復習一下之前我們講過的根據光模塊支持的協(xié)議規(guī)范大致判斷其支持的傳輸距離。SR通常對應幾百米,多模傳輸;DR一般對應500m,并行單模傳輸,F(xiàn)R對應2km, 一般CWDM傳輸。
1. 用于800G SR場景的8x100G方案
a) 800G SR應用場景需求分析
對于100m級別的數據中心內傳輸,業(yè)界其實一直受到VCSEL傳輸技術每通道速率極限約為100G的的困擾,似乎難以繼續(xù)提升速率。 這也是國內數據中心廠商最初采用的技術,采用多模傳輸技術,支持的距離僅為30~50m,因而只能覆蓋有限的SR應用場景。800G MSA的目標是為SR應用開發(fā)低成本的8x100G光模塊,至少保證SR中大部分重要的應用,支持60~100m傳輸,如圖1所示。進一步地說,就是800G MSA工作組企圖定義一種通過高度集成的方式使成本線性下降的發(fā)射機技術,以便能夠在早期的時候快速推向800G高密度光互連市場。低成本的800G SR8通過提供低成本的串行100G服務器連接可以支持當前數據中心的演進趨勢:交換機端口不斷增長,每個機架服務器數量不斷減少。如圖1所示,800G MSA工作組將基于100G PAM4技術為單模光纖互連定義一種低成本的物理媒介相關子層(PMD)規(guī)范。另外,由于SR應用低延時的需求,800G MSA光模塊中將采用KP4 FEC來實現(xiàn)糾錯,其它的DSP算法還包括簡單的時鐘恢復和均衡。還需要為PSM8模塊定義一種連接器以實現(xiàn)與8x100G相連。
圖1. 800G SR8/PSM8光模塊結構框圖及800G MSA規(guī)范范圍
看起來相比于常規(guī)的SR模塊,800G SR8將不再采用基于VCSEL的多模方案,而是采用并行單模傳輸方式,即PSM8,調制格式為PAM4,包含DSP芯片。
b) 8x100G方案可行性分析
正如上面所分析,單通道100G的速率可能限制了400G-SR8中多模方案繼續(xù)向800G-SR8的演進?;贗EEE的理論模型,我們可以推測當波特率達到50G波段時多模光纖MMF支持的傳輸距離將不超過50m,如表1所示。主要限制因素不外乎VCSEL的調制帶寬和MMF的模間色散。雖然通過優(yōu)化器件和光纖設計,借助于強大的DSP算法可以將傳輸距離延伸到100m左右,但代價是高成本,大延時和功耗?;诖?,MSA 可插拔800G光模塊工作組推薦采用單模傳輸技術來實現(xiàn)800G-SR8場景互連。
表1. 基于IEEE理論模型推測MMF帶寬與傳輸距離的關系
為了確?;趩文9饫wSMF的方案具有更低的成本和功耗,必須為800G-SR8定義合理的PMD標準需求。PMD層定義至少需要滿足以下三個原則:1)允許基于多種方案的發(fā)射機技術,如DML,EML及硅光SiPh。2)為達到目標鏈路性能,器件所有的潛能都能被充分利用。3)只要滿足可靠的鏈路性能,盡可能放松PMD層的參數指標。下面將結合實驗研究結果針對這三個原則進行說明和分析。首先在功率預算方面,基于單模的800G-SR8預計與400G-SR8很類似,唯一的區(qū)別是需要為新定義的PSM8單模連接器定義插損。這意味著直接采用當前400G-SR8互連中成熟的光電器件,DSP芯片就可以滿足800G-SR8的功率預算要求。因此,除了定義PSM8連接器之外,定義800G-SR8 PMD規(guī)范的最大挑戰(zhàn)就在于找到合適的發(fā)射機光調制幅度(OMA),消光比(ER),發(fā)射機眼圖閉合代價(TDECQ)以及接收機靈敏度。為了找到這些合適的指標,MSA工作組測試并評估了一些不同的發(fā)射機的BER性能,如圖2所示。
圖2. (a采用目前商用400G DSP芯片測試的EML發(fā)射機的BER與OMA結果;(b) 采用目前商用400G DSP芯片測試SiPh發(fā)射機的BER與OMA結果;(c)采用目前商用400G DSP芯片測試DML發(fā)射機的BER與OMA結果
上述實驗結果是在單波長100G PAM4信號上基于商用400G DSP芯片實時測得的BER與OMA關系曲線。其中EML和SiPh的100G結果可能已經被大家所熟知,因為近幾年一直在討論它們,不過基于DML方案的靈敏度也還算不錯,只是誤碼平臺稍微高了一些,但只要低于KP4 FEC的BER閾值就行。由于硅光發(fā)射機的損耗大一些,所以其出光功率較其它方案小,因此在定義800G SR8最小OMA指標的時候需要盡量考慮適當放寬松。注意到上面DML的結果中雖然利用了比EML和SiPh器件帶寬小的DML器件,但是采用比IEEE定義的400GE參考接收機強大的商用DSP芯片,還是可以達到較好的均衡效果,實現(xiàn)與EML和SiPh類似的OMA靈敏度,滿足800G SR8功率預算。在800G SR8應用中為了充分釋放DSP的潛能,接收機遵從性測試如TDECQ需要重新定義以匹配商用DSP芯片實際的均衡能力,比如抽頭數多于當前所定義的5個抽頭。另一方面考慮到SR場景下更低的靈敏度要求以及800G光模塊中嚴格的功耗限制,在將來的800G光模塊中也會推薦使用低復雜度的DSP模式。消光比ER作為直接與功耗相關的指標,理論上只要保證鏈路可靠傳輸,ER越低越好?;谝陨系姆治觯琈SA工作組認為基于SMF的低成本、低功耗的方案可以用于800G-SR應用的有前景的解決方案。2. 用于800G FR場景的4x200G方案
a) 800G FR場景需求分析
基于PAM4調制技術的單通道200G傳輸是強度調制直接探測(IMDD)系統(tǒng)下一個重要的技術里程碑,也是實現(xiàn)4通道800G光互連的基礎,甚至還可以基于它進一步實現(xiàn)1.6T高速互連。如圖3所示,工作組將定義全套的PMD和部分的PMA層規(guī)范,包括在112G電輸入信號上包裹一層新的低功耗、低延時的FEC方案,以改善調制解調器的凈編碼增益。業(yè)內聯(lián)盟的目標之一是為發(fā)射機和接收機次組件開發(fā)新一代寬帶電、光模擬器件,包括常用的模數轉換器ADC和數模轉換器DAC。為了滿足可插拔800G光模塊對功耗的嚴格要求,下一代200G PAM4 DSP芯片將會采用更低結點CMOS工藝來制造,如7nm/5nm,并且還需要采用低復雜度、低功耗的數字信號處理算法來對信道進行均衡。
圖3. 800G FR4/PSM4光模塊結構框圖及800G MSA規(guī)范范圍
4x200G 的FR互連方案看起來有兩種實現(xiàn)路徑,一種是4對單模光纖的PSM4方案,另一種采用基于CWDM4的單對光纖方案,對外的光口密度上還是有比較大的差異,CWDM4模塊的成本和復雜度應該也是有明顯增加的。
b) 4x200G方案的可行性分析
由于在LAN-WDM中需要采用TEC進行溫度控制,而在單通道200G的應用中希望避免溫控。800G-FR4的功率預算將基于CWDM4來分析。與功率預算相關的因素主要包括:鏈路插損,多徑干涉MPI,差分群時延DGD,發(fā)射機和色散代價TDP。根據IEEE標準中發(fā)布的模型,MPI和DGD導致的代價計算如表2所示。由于單通道200G的波特率比100G高,因而色散導致的代價肯定會更大。工作組推薦的合理的TDP值為3.9dB。綜上,如果考慮接收機的老化,耦合損耗,典型發(fā)射機的出光功率,工作組認為200G PAM4接收機的靈敏度需要在-5dBm左右。
表2. 800G-FR4功率預算分析
相比于100G, 200G的波特率加倍,導致SNR劣化3dB,可能有必要采用更強的FEC糾錯碼來維持-5dBm的靈敏度,并且避免在Pre FEC BER門限之上出現(xiàn)誤碼平臺。因此需要如之前所說的,光模塊實現(xiàn)的時候需要在KP4 FEC之上額外包裹一層低延時,低復雜度的FEC。新的FEC糾前誤碼門限的設置可以根據實際光鏈路性能、功率預算的需求來決定。
工作組還通過仿真和實驗來進一步分析了單通道200G的鏈路性能。鏈路中采用器件的參數,如表3所示。實驗結果表明當新FEC的BER門限設置為2e-3時,接收機的靈敏度可以達到目標,如圖4(a)所示。但是實驗中采用了最大似然序列估計(MLSE)算法來補償信道中由于窄帶濾波引起的強烈碼間干擾ISI。圖4(a)中的虛線代表的是基于實驗器件參數仿真的結果。與實驗結果一起,仿真研究表明系統(tǒng)性能的限制因素是DA/AD,驅動及電光調制器等器件的帶寬。假設未來幾年高帶寬器件會推向市場,仿真中基于同一系統(tǒng)但將器件帶寬設置得更大后,發(fā)現(xiàn)在DSP中僅采用前向均衡算法(FFE)就可以在Pre FEC BER=2e-3時滿足相應的靈敏度要求,結果如圖4(b),這與理論期望是相符的。表3. 實驗和仿真中用到的器件參數
圖4. (a)現(xiàn)有器件帶寬條件下,單通道200G實驗和仿真結果,(b)采用改善帶寬的器件后單通道200G的FFE均衡仿真結果
基于上述分析,仍然建議在800G-FR4場景的遵從性測試中滿足相應的TDECQ指標。只是在測試TDECQ時采用的參考接收機的FFE抽頭數需要增加到一個合適的值,該值是多少也是值得進一步討論研究的。當然,如果未來100Gbd器件的能力(帶寬)不及我們預期的話,將還是不得不在FR4場景中考慮使用更復雜的算法如MLSE,那也就意味著需要開發(fā)新的合規(guī)方案。
c) 4x200G封裝方案分析
為了保證高速信號在Nyquist頻率范圍內(即56GHz)考慮信號的完整性,4x200G發(fā)射機和接收機的封裝設計需要重新考慮。圖5中給出了發(fā)射機的兩種可能的實現(xiàn)方式。方法A是傳統(tǒng)的方案,Driver與調制器放一起。相比,方案B中倒裝設計的Driver芯片與DSP芯片共封裝在一起來優(yōu)化RF傳輸線上信號完整性。這兩種技術都是目前可以實現(xiàn)的。初步仿真研究表明,采用方案B能得到較好的結果并且?guī)捒杀WC大于56GHz。方案A的S21頻響曲線上的紋波可能是由于Driver輸入上的信號反射導致的,這可以通過Dirver的匹配設計來優(yōu)化,從而進一步改善方案A的最終性能。
圖6. 發(fā)射機的兩種封裝方式。S21仿真中考慮了RF傳輸線(紅線),走線及調制器,使用的EML芯片3dB帶寬假設是60GHz
而在接收端需要減小寄生電容來實現(xiàn)高帶寬的光電探測器(PD),同時配合大帶寬的跨阻放大器(TIA)來保證接收機的帶寬。采用當前的半導體技術來實現(xiàn)這樣的器件是沒有技術問題的。甚至內業(yè)已經有公司投入了大量的精力來研發(fā)相應的產品,預計1~2年內就能達到量產。另外,PD和TIA之間的連接也很重要,需要優(yōu)化和分析,因為寄生效應會影響性能。
d)單通道200G中的前向糾錯編碼(FEC)
總的來說,前面已經提到需要PreFEC BER 門限為2e-3的更強的FEC方案來確保200G PAM4接收機的靈敏度要求。圖7給出了級聯(lián)方案和替換方案的對比結果。第一種方法中,中間光口不再采用KP4 FEC,而替換成新的更大開銷的FEC,這在總開銷和凈編碼增益方面是有優(yōu)勢的。第二種方案中,采用級聯(lián)FEC方式,將KP4繼續(xù)保留為外層編碼,與新的內碼聯(lián)合使用。這種級聯(lián)碼的好處是時延和功耗小,因而更適用于800G-FR4的應用場景。
圖7. 800G FEC方案:全新替換FEC Vs 級聯(lián)KP4 FEC
將如圖8所示的代數碼與KP4串聯(lián),是實現(xiàn)2E-3 BER門限FEC較直接的方法,最小化功耗和端到端的時延。單誤碼糾正能力的Hamming碼和雙誤碼糾正能力的BCH碼都是這種級聯(lián)方案中代數碼的合適選擇。這兩種內碼的開銷約為6%,結合一個64個測試Pattern的簡單軟入硬出(SIHO)遞推譯碼算法,Hamming和BCH碼都能實現(xiàn)優(yōu)于2e-3門限的糾錯性能。在400GBASE-R中定義的符號分布本質上可以作為級聯(lián)編碼的奇偶交織器,10k bit的延時也足夠用來與光纖中引入的噪聲進行去相關。
圖8. KP4和線性碼的級聯(lián)方案結構圖
3. 800G DR場景的可能方案
如表4所示,實現(xiàn)800G DR有四種路徑。首先,800G MSA中定義的SR8方案可以直接拓展500m的傳輸范圍。由于并行光纖方案需要更多的光纖,這種應用下長達500m的光纖成本可能是個問題。其次,基于現(xiàn)有的FR4方案僅需要將收發(fā)器件加倍就可以提供2x400G CWDM方案,這看起來是在光纖資源消耗和方案成熟度上取得了不錯的平衡,但其成本和功耗可能會限制其實際應用。第三,下一代的單通道200G方案(PSM4或CWDM4)可能可以覆蓋DR的應用。這種方式僅需要4對收發(fā)光模塊,看起來具有最低的功耗和成本。但由于業(yè)界成熟度、實際可行性方面還有待進一步證實,因而這種方案何時能商用的時間尚不明確 。
表4. 800G DR的四種可能方案
總的來說,目前討論了用于800G DR的四種可能方案,工作組將繼續(xù)關注每種技術路線的發(fā)展情況,在將來合適的時候給出推薦的方案。
4. 總結與展望
800G可插拔MSA將率先定義800G-SR8和FR4兩種場景的光模塊。在SR8場景中,為了將更多的技術納入考慮范圍,引入基于SMF的單模方案,工作組考慮對PMD層的一些關鍵參數作出適當調整,最終使得OMA和ER的要求得以放松來減小功耗,并且用于TDECQ測試的參考接收機也需要重新定義。工作組還展示了單通道200G光傳輸用于800G FR4應用的技術可行性。實驗和仿真結果表明需要在光模塊中增加一個低延時,低功耗的FEC編碼子層來實現(xiàn)目標功率預算。有關這種新FEC的技術細節(jié)將會在800G-FR4標準規(guī)范中展示以便于實現(xiàn)多廠家互通。同時,器件帶寬提升及模塊的封裝設計優(yōu)化也是需要深入研究的兩個問題。
800G可插拔MSA預計將于今年Q4發(fā)布第一版規(guī)范,少量已經在做原型驗證的器件及第一批800G光模型預期在2021年可以出樣品。400GE產品已經在市場上開始起量,800G可插拔光模塊將會利用新的生態(tài)系統(tǒng)來為下一代25.6T和51.2T交換機提供更高的互連密度以實現(xiàn)高性價比的單通道100G和200G光互連。
展望800G以上速率到1.6T,業(yè)界開始看到了可插拔光模塊可能存在的局限性。采用經典的PCB,用于C2M互連的SerDes不太可能擴展到單通道200G的速率,這時候需要將模擬電子器件/芯片和光器件更靠近交換芯片。無論業(yè)界最終會選擇共封裝光學(CPO),或是板上光學(OBO),亦或是升級版的可插拔,該MSA定義的單通道200G將會為800G和1.6T互連的必要的基礎單元,重要性和意義不言而喻。
以上技術內容基本上是我對照白皮書翻譯過來的,為了避免理解的偏差,我盡量采用的是直譯的方法,中間可能穿插了些許評論。當然受限于本人的才識和能力,錯誤和疏漏在所難免,還望大家指正。