本文轉(zhuǎn)載自微信公眾號(hào)“光通信充電寶”,作者馮振華博士,訊石經(jīng)允許略作刪改。
今天咱們來(lái)聊聊光模塊相關(guān)的標(biāo)準(zhǔn)進(jìn)展及光模塊相關(guān)技術(shù)的發(fā)展趨勢(shì),內(nèi)容上將分為兩個(gè)部分,一個(gè)是客戶側(cè)光模塊,主要面向中短距離光互連的,另一個(gè)是線路側(cè)光模塊,面向城域和長(zhǎng)距光傳輸?shù)摹?
下面首先介紹以太網(wǎng)的發(fā)展及速率接口演進(jìn)趨勢(shì),然后分別介紹IEEE 802.3、OIF及其它聯(lián)盟推出的最新標(biāo)準(zhǔn),最后展望一下未來(lái)光模塊技術(shù)的演進(jìn),如板上光學(xué)(OBO)或共封裝光學(xué)(CPO)。簡(jiǎn)單概括起來(lái),行文思路就是客戶側(cè)光模塊從概念入門到game over。
一、以太網(wǎng)技術(shù)發(fā)展和演進(jìn)
馬云. 蓋茨說(shuō)過(guò)“互聯(lián)網(wǎng)將改變?nèi)藗兩畹姆椒矫婷妗?,?duì)不起我實(shí)在是分不清這話到底比爾蓋茨有沒(méi)有說(shuō)過(guò),但我想說(shuō)的是以太網(wǎng)將改變互聯(lián)網(wǎng)生活的方方面面。過(guò)去的二十年里,以太網(wǎng)技術(shù)已經(jīng)被廣泛用在了企業(yè)園區(qū),家庭寬帶,工業(yè)控制,安防監(jiān)控等領(lǐng)域,未來(lái)更大帶寬,更低時(shí)延的以太網(wǎng)相關(guān)技術(shù)還將進(jìn)一步滲透到智能制造,智慧城市,自動(dòng)駕駛,5G承載,云計(jì)算、數(shù)據(jù)中心等場(chǎng)景,可能無(wú)時(shí)無(wú)刻不在影響我們的生活。
圖1. 以太網(wǎng)相關(guān)的應(yīng)用場(chǎng)景
面對(duì)新的應(yīng)用,以太網(wǎng)的速率也在不斷增長(zhǎng),如圖2所示,從最初的10M,100M到最近標(biāo)準(zhǔn)化的400G,接口速率已經(jīng)翻了4萬(wàn)倍。進(jìn)一步應(yīng)對(duì)數(shù)據(jù)中心每?jī)赡杲粨Q機(jī)容量翻一倍的需求,于2018年,以太網(wǎng)聯(lián)盟就已經(jīng)明確了在未來(lái)的幾年內(nèi),將推出下一代以太網(wǎng)速率,800G和1.6T。
圖2. 以太網(wǎng)速率標(biāo)準(zhǔn)演進(jìn)趨勢(shì)
為了支撐相應(yīng)的接口速率,就必須得規(guī)范對(duì)應(yīng)的光模塊技術(shù)。下面首先介紹客戶側(cè)的光模塊標(biāo)準(zhǔn)。
二、客戶側(cè)光模塊標(biāo)準(zhǔn)
其實(shí)我之前在公眾號(hào)里也多次提到過(guò)部分的短距光模塊相關(guān)的標(biāo)準(zhǔn)。今天再次從多個(gè)方面來(lái)匯總一下。
表1. 最新的以太網(wǎng)接口光模塊標(biāo)準(zhǔn)
如表1所示,當(dāng)前以太網(wǎng)接口規(guī)范對(duì)應(yīng)的光模塊速率、傳輸距離及電接口,目前尚未完全完成的標(biāo)準(zhǔn)主要集中在25G/50G EPON,100G FR/LR, 400G FR4/LR4-6,以及100G/400G 80km級(jí)的ZR。在此再次回顧一下之前說(shuō)過(guò)的,KR,CR,SR,DR,LR,ER,ZR的意思。K表示背板互連,C表示銅線互連,S表示短距100m以上,多模光纖,D表示500m,并行單模光纖,F(xiàn)表示2km,通常是CWDM單模,L一般表示長(zhǎng)距10km,單模光纖,E表示延長(zhǎng)距離到40km, ZR表示80km級(jí)互連,通常要用相干探測(cè)了。字母R后面的數(shù)字一般表示并行光纖或者WDM通道的數(shù)量。不同PMD規(guī)范不同的距離,其實(shí)在光模塊技術(shù)上大致對(duì)應(yīng)了采用的激光器/調(diào)制器,如表2所示,多模的一般用VCSEL,長(zhǎng)距一般要用EML,ZR可能需要用到相干的IQ調(diào)制,顯然隨著傳輸距離的增加,調(diào)制技術(shù)越來(lái)越復(fù)雜,也就意味著成本越來(lái)越高了。
表2. 不同PMD規(guī)范對(duì)應(yīng)的傳輸距離、媒介和復(fù)用技術(shù)
在這些標(biāo)準(zhǔn)中,50G的PAM4調(diào)制是關(guān)鍵,得到了IEEE802.3bs, cd,cn等工作組的關(guān)注,成為50G到400G接口標(biāo)準(zhǔn)的基礎(chǔ)。其中bs,cd已經(jīng)于2017年和2018年底完成,cn系列標(biāo)準(zhǔn)將于2020年完成。
對(duì)于最近業(yè)界關(guān)注較多的是用于DCI和CATV應(yīng)用的80km光接口相關(guān)的標(biāo)準(zhǔn),IEEE早在2018年11月就成立了802.3ct工作組,開(kāi)始標(biāo)準(zhǔn)制定。其中用于DCI的是400G/80km, CATV是100G/80km。這兩種ZR應(yīng)用中,目前業(yè)界認(rèn)為只有通過(guò)數(shù)字相干技術(shù)才能實(shí)現(xiàn)80km級(jí)的高速傳輸,并且還需要利用WDM來(lái)提高單纖的容量。去年11月,IEEE ZR標(biāo)準(zhǔn)進(jìn)一步細(xì)分為100G ZR (100G,80km)和400G ZR (400G, 80km)分別由802.3ct, cw工作組負(fù)責(zé)。并且IEEE 400G ZR的信道間隔從原來(lái)的100GHz更新為75GHz,這將需要更長(zhǎng)的時(shí)間來(lái)完成標(biāo)準(zhǔn)化相關(guān)的討論。類似的,在OIF組織下,400G/最長(zhǎng)120km的標(biāo)準(zhǔn)400ZR interop,也決定開(kāi)始75GHz間隔技術(shù)標(biāo)準(zhǔn)1.1版本,之前的1.0版本是100GHz間隔。
另外,在FR/LR這種2km/10km級(jí)別的接口標(biāo)準(zhǔn)方面,IEEE 802.3cu去年3月啟動(dòng)了100GBASE FR/LR及400GBASE FR4/LR4。該系列標(biāo)準(zhǔn)的重點(diǎn)是引入100G PAM4調(diào)制和CWDM復(fù)用的波長(zhǎng)網(wǎng)格。相比于50G PAM4,更高的單波速率在減小收發(fā)器件數(shù)量和降低成本方面有優(yōu)勢(shì)。 由于CWDM波長(zhǎng)間隔20nm的寬度,如圖3所示,允許使用不制冷的激光器,進(jìn)一步降低成本。顯然,引入單通道100G的技術(shù)對(duì)于實(shí)現(xiàn)高速光模塊即有利于降低成本,又能有效增強(qiáng)可制造性(通道數(shù)少,光模塊更容易做)。另外,802.3bs和cd工作組也采用LAN WDM波長(zhǎng)分配方案,如圖4所示。很明顯,LAN WDM波長(zhǎng)間隔僅為800GHz(4.5nm),需要使用TEC控制波長(zhǎng)漂移,但是它工作在O波段零色散附近,高速傳輸時(shí)受色散影響較小。相比之下,CWDM傳輸可能會(huì)受到較大的色散影響,特別是相比于MZM,EML還是有啁啾的影響,這對(duì)于400GBASE LR來(lái)說(shuō)可能是挑戰(zhàn),802.3也覺(jué)得這個(gè)400G只能支持到6km,即400BBASE-LR4-6。不過(guò)對(duì)于100G/lamda MSA工作組來(lái)說(shuō),它們采用了不同的波長(zhǎng)來(lái)解決色散問(wèn)題,因此MSA定義了400GBASE-LR4-6和400GBASE-LR4-10兩種規(guī)范。
圖3. CWDM的波長(zhǎng)分配
圖4. LAN WDM的波長(zhǎng)分配
對(duì)于800G光接口,2019年成立了兩個(gè)MSA工作組,一個(gè)是QSFP-DD800 MSA,另一個(gè)是800G Pluggable MSA。在最新發(fā)布的800G Pluggable 白皮書中考慮可能采用單通道100G PAM4實(shí)現(xiàn)800G SR,采用單通道100G或200G來(lái)實(shí)現(xiàn)DR和FR場(chǎng)景。對(duì)于后續(xù)的1.6T的話,單通道200G可能是必須的。而對(duì)于LR/ER/ZR等更長(zhǎng)距離的800G應(yīng)用,數(shù)字相干技術(shù)將是更合適的選擇。
圖6. 不同速率接口的調(diào)制方式
從圖6可以看出,目前在400G以下速率的接口中,單通道50G PAM4和100G PAM4是主流調(diào)制方式,而對(duì)于800G以上速率,單通道200G PAM4甚至相干技術(shù)將可能占主導(dǎo)地位,也許三四年左右,這一需求將會(huì)出現(xiàn)。
總體上來(lái)看,IEEE802.3只是定義了光發(fā)射機(jī)和接收機(jī)的光電方面的總體性能。具體的參數(shù)如機(jī)械尺寸,PIN引腳定義,管理接口定義等是由業(yè)內(nèi)的多源協(xié)議MSA規(guī)定的。當(dāng)前,多種MSA規(guī)范的熱插拔光模塊被廣泛商用。對(duì)于100G,CFP/CFP2/CFP4和OSFP最為流行,而對(duì)于100G以上(200G/400G)業(yè)內(nèi)更傾向于QSFP-DD,OSFP,它們的封裝形態(tài)及主要參數(shù)如下圖。
圖7. 100G+客戶側(cè)模塊主流封裝形態(tài)
不得不說(shuō),隨著數(shù)據(jù)中心內(nèi)部流量不斷快速增長(zhǎng),交換機(jī)容量、端口密度和接口速率都將面臨嚴(yán)峻挑戰(zhàn)。特別是光模塊的電口到交換機(jī)內(nèi)部的交換芯片之間的PCB走線將影響信號(hào)完整性,并且交換機(jī)面板上的功耗也會(huì)成為瓶頸。為了解決這兩方面的問(wèn)題,業(yè)界也在挖掘新的機(jī)會(huì)來(lái)替代當(dāng)前這種可插拔光模塊,這就是后光模塊的話題了。
三、后光模塊時(shí)代
叫后光模塊時(shí)代似乎有點(diǎn)危言聳聽(tīng)的味道,但或許去光模塊將成為未來(lái)一段時(shí)間內(nèi)的趨勢(shì)。業(yè)界也有越來(lái)越多的聲音來(lái)探討以后的光模塊是怎樣的,交換機(jī)的架構(gòu),設(shè)備形態(tài)是怎樣的。甚至18,19,20連續(xù)三年OFC上都有專題討論相關(guān)的問(wèn)題,論題無(wú)非都是,可插拔光模塊是否會(huì)被廢棄?什么時(shí)候廢棄?被什么技術(shù)取代?
全面而正確地回答上面這三個(gè)問(wèn)題,會(huì)很難。我只能挑目前主流的觀點(diǎn)結(jié)合我自己的看法來(lái)說(shuō)幾點(diǎn)。
圖8. 交換機(jī)容量及光模塊速率演進(jìn)趨勢(shì)
a) 當(dāng)前的這種光模塊與設(shè)備的互連方式肯定會(huì)被取代,因?yàn)楫?dāng)前交換機(jī)的最高密度是1RU上可插32個(gè)400G光模塊,對(duì)應(yīng)的容量12.8T。數(shù)據(jù)中心交換機(jī)的容量每?jī)赡攴槐叮瑑扇旰缶蜁?huì)出現(xiàn)51.2T的需求了。假設(shè)業(yè)界那時(shí)800G光模塊已經(jīng)成熟并且尺寸功耗夠小,交換機(jī)還能變大一倍,那樣2RU下最大也就能提供51.2Tb的容量了,可是再繼續(xù)提升就幾乎不可能了,至少基于當(dāng)前的可插拔模塊的路徑是走不通了。
圖9. 光模塊及光芯片組需求量預(yù)測(cè)
b) 后光模塊技術(shù)的市場(chǎng)需求應(yīng)該會(huì)在2024年左右出現(xiàn)。兩方面原因,一是交換機(jī)容量到達(dá)51.2T的瓶頸會(huì)在2024年左右突顯,如圖8所示;二是Lightcounting機(jī)構(gòu)預(yù)測(cè)以太網(wǎng)數(shù)據(jù)中心光模塊需求量會(huì)在2026年下降,2024年光芯片組開(kāi)始起量,隨后的較長(zhǎng)的一段時(shí)間里與光模塊競(jìng)爭(zhēng)并成功搶占大部分市場(chǎng)。
c) 后光模塊時(shí)代兩個(gè)最具競(jìng)爭(zhēng)力的方案分別是板上光學(xué)OBO和共封裝光學(xué)CPO。下圖為三種技術(shù)對(duì)應(yīng)設(shè)備的直觀表示。其中光模塊方案,前面板上是高速電口,光模塊與交換芯片之間有較長(zhǎng)PCB走線;板上光學(xué)OBO方案則把光模塊直接放到交換機(jī)內(nèi)部的主板上了,面板僅留光口,寬度更高,功耗更易控制,高速PCB走線縮短,信號(hào)完整性也更好;共封裝CPO則直接把光引擎(收發(fā)模塊)與電交換芯片在一個(gè)襯底上封裝成一個(gè)芯片,集中解決散熱問(wèn)題,同時(shí)也可以省去很多的SerDes功能,節(jié)省功耗。
圖10. 光模塊,板上光學(xué),共封裝三種方案設(shè)備對(duì)比
d) 進(jìn)一步的,共封裝CPO方案也可能分為兩個(gè)階段,初級(jí)階段是通過(guò)在一層介質(zhì)上把電器件和光器件進(jìn)行2.5D封裝,組成多芯片模組(MCM)。終極目標(biāo)是通過(guò)硅通孔實(shí)現(xiàn)3D封裝,真正意義上進(jìn)行單片光、電芯片的封裝。如圖11所示。
圖11. 共封裝光學(xué)的兩種可能形態(tài)
e) OBO和CPO兩種形狀到底能節(jié)省多少功耗呢?見(jiàn)下表所示,很明顯,由于簡(jiǎn)化了SerDes,省去了CDR,DFE/CTLE/FFE等功能,CPO相比于OBO還是有顯著的功耗優(yōu)勢(shì)的,而OBO在可插拔模塊的基礎(chǔ)上也有一些功耗的降低,主要是省去了DFE,PCB走線更短,無(wú)須強(qiáng)均衡。而難度比較大的TSV相比于MCM在功耗上似乎也沒(méi)有太明顯的優(yōu)勢(shì),考慮到共封裝的難度,能做個(gè)2.5D的MCM也不錯(cuò)了。
表3. 25G速率時(shí)不同形態(tài)線卡功耗對(duì)比
f) OBO和CPO雖然都有相應(yīng)的產(chǎn)業(yè)聯(lián)盟,如COBO,主要由交換機(jī)廠商ARISTA,BROADCOM,CISCO等領(lǐng)銜,而CPO則由數(shù)據(jù)中心運(yùn)營(yíng)商/互聯(lián)網(wǎng)公司微軟和Facebook領(lǐng)導(dǎo),他們最近也陸續(xù)發(fā)布了一些OBO或CPO概念原型機(jī),如Intel單片容量達(dá)1.6T,單板容量12.8T。但是這種新技術(shù)也還是面臨一些挑戰(zhàn)的,至少散熱問(wèn)題很關(guān)鍵。那么多光引擎及大容量的交換芯片封裝在一個(gè)緊湊的面積下,僅風(fēng)扇散熱恐怕不行,至少得上水冷吧。
新技術(shù)可能不會(huì)馬上就能大規(guī)模商用,但是可能為期不遠(yuǎn)。在未來(lái)的5~8年的時(shí)間內(nèi),雖然OBO或CPO不會(huì)立馬取代現(xiàn)有的可插拔光模塊的地位,但三四年后,開(kāi)始搶奪市場(chǎng)的趨勢(shì)還是很可能會(huì)出現(xiàn)的。雖然10年內(nèi)不會(huì)完全被某一種形態(tài)的線卡所壟斷,會(huì)存在一個(gè)由可插拔向板上再到MCM或TSV這樣的共封裝的過(guò)渡過(guò)程,對(duì)于設(shè)備商來(lái)說(shuō),早做準(zhǔn)備還是有必要的,這種革命性的技術(shù)完全有可能較大程度上改變通信設(shè)備的形態(tài)和產(chǎn)業(yè)鏈。
也許10年后,可插拔光模塊市場(chǎng)消失了呢?即使不消失,光模塊芯片組高度集成化,線卡設(shè)計(jì)工作僅剩下布局和畫PCB板了,那時(shí)候還需要你做什么呢,你又能做什么呢?