前言
11月19日第十一屆網(wǎng)絡(luò)平臺(tái)部技術(shù)峰會(huì)在深圳圓滿落幕。本次峰會(huì)圍繞硬件研發(fā)、硬件加速、網(wǎng)絡(luò)產(chǎn)品、網(wǎng)絡(luò)運(yùn)營四大領(lǐng)域,深度全面地展示了網(wǎng)絡(luò)平臺(tái)部不斷精進(jìn)的研發(fā)能力及探索成果。下面讓我們共同回顧本次峰會(huì)中由硬件研發(fā)專家——孫敏博士呈現(xiàn)的《光模塊:從自采到自研》的精彩內(nèi)容。
光模塊及應(yīng)用
光模塊首次站在技術(shù)大會(huì)的舞臺(tái),回顧了光模塊產(chǎn)品從商用到自采,再到自研的發(fā)展歷程。著眼未來,我們從“芯”出發(fā),把握關(guān)鍵技術(shù)路徑,同時(shí)探索新型開發(fā)模式。
光模塊麻雀雖小,五臟俱全,可以說是一套完整的小系統(tǒng)。電信號(hào)輸入,經(jīng)過dsp等芯片解析,然后進(jìn)入驅(qū)動(dòng)芯片,再去帶動(dòng)光芯片進(jìn)行調(diào)制,調(diào)制出來的光再進(jìn)入到光無源系統(tǒng)進(jìn)行耦合,最后耦合光進(jìn)入光纖系統(tǒng)傳輸。
光模塊不是數(shù)據(jù)中心專屬的,而是電信網(wǎng)絡(luò),特別是長距離傳送網(wǎng)絡(luò)最早開始使用的。但是隨著數(shù)據(jù)中心的發(fā)展,包括設(shè)備的帶寬的提升,光模塊開始進(jìn)入到數(shù)據(jù)中心應(yīng)用中。由于數(shù)據(jù)中心的發(fā)展速度遠(yuǎn)超傳統(tǒng)電信行業(yè),所以數(shù)據(jù)中心對(duì)光模塊的需求增長也遠(yuǎn)超傳統(tǒng)電信行業(yè)。
從商用到自采
對(duì)騰訊而言,早期的40G網(wǎng)絡(luò)實(shí)際上是一個(gè)封閉的系統(tǒng),比如說我們買的實(shí)際上是傳統(tǒng)設(shè)備廠商的整個(gè)網(wǎng)絡(luò)系統(tǒng),包括軟件,交換設(shè)備和光模塊等。商用系統(tǒng)成本高,出了問題不便于運(yùn)維,這是商用轉(zhuǎn)自采的一個(gè)重要原因。
結(jié)合25G服務(wù)器的上線應(yīng)用,25G/100G模塊開啟自采之路,挑戰(zhàn)是必然的,第一個(gè)挑戰(zhàn)其實(shí)就是設(shè)備之間的適配,光模塊單體測試雖然沒有問題,但是在自采灰度階段,我們遇到了很多設(shè)備兼容性的問題,我們發(fā)現(xiàn)不同廠商的模塊在不同設(shè)備上每個(gè)端口的表現(xiàn)不一樣,在不同設(shè)備上的表現(xiàn)也不一樣,而且為了保證大家都可以傳得通,必須得做一個(gè)完善的適配方案,形成一套復(fù)雜的測試系統(tǒng),很多時(shí)候甚至要一對(duì)一針對(duì)端口參數(shù)進(jìn)行優(yōu)化。
但是如果能把自采模塊管理的很精細(xì),將會(huì)是一個(gè)非常有收益的事情。記得在15年到17年之間,我們現(xiàn)網(wǎng)出現(xiàn)大量的40G光模塊的故障替換,究其原因,其實(shí)是系統(tǒng)集成廠商的光模塊都是外購的,對(duì)光模塊了解較淺,并且對(duì)光模塊的質(zhì)量問題如何攔截也基本依靠模塊廠商。如果結(jié)合自己的實(shí)際應(yīng)用場景,把端到端的模塊技術(shù)方案進(jìn)行管理,端到端的流程進(jìn)行管控和優(yōu)化,同時(shí)把系統(tǒng)的質(zhì)量管理方案做到位的話,完全可以避免上面出現(xiàn)的這些問題。通過2到3年對(duì)自采光模塊的不斷優(yōu)化和管控,我們發(fā)現(xiàn)不只是成本逐年有收益,而且質(zhì)量問題得到系統(tǒng)改善,現(xiàn)網(wǎng)故障率不斷下降。
從自采到定制
自采光模塊的另一個(gè)優(yōu)勢是能夠滿足我們自己網(wǎng)絡(luò)的多樣化發(fā)展帶來的多樣化定制需求,比如業(yè)務(wù)部門提到10km分光監(jiān)控場景的需求,需要10km的模塊進(jìn)行互連,因?yàn)楝F(xiàn)成收發(fā)一體模塊價(jià)格高昂,在需求推動(dòng)下,我們借助現(xiàn)有的模塊平臺(tái)去做一些微小的改進(jìn),實(shí)現(xiàn)低成本方案。另一個(gè)例子是DCI提到了2km的分光的需求,整個(gè)項(xiàng)目很有收益,但是技術(shù)方案上很有挑戰(zhàn),需要結(jié)合我們的現(xiàn)網(wǎng)環(huán)境,對(duì)現(xiàn)有的模塊進(jìn)行的深度的設(shè)計(jì)優(yōu)化,包括規(guī)格、模塊光學(xué)部分及芯片層面的一系列升級(jí)優(yōu)化。
從定制到自研
隨著100G服務(wù)器的批量上線,200G網(wǎng)絡(luò)進(jìn)入量產(chǎn)應(yīng)用,自研光模塊產(chǎn)品的誕生也契合了整個(gè)網(wǎng)絡(luò)從100G升級(jí)迭代到200G。光模塊行業(yè)一個(gè)很大特點(diǎn),就是整個(gè)產(chǎn)業(yè)鏈類似于一個(gè)“陀螺式”或者“橄欖球形”,中間大,兩頭小,整個(gè)行業(yè)號(hào)稱可以做光模塊的公司不下于200家,但是處于產(chǎn)業(yè)鏈最上游的各類芯片廠家可能只有不超過10家,特別像DSP這樣技術(shù)門檻較高的芯片更是不超過5家,而最下游的應(yīng)用方或者終端用戶的數(shù)量也遠(yuǎn)少于光模塊廠商數(shù)量,呈現(xiàn)出來產(chǎn)業(yè)結(jié)構(gòu)混亂,同時(shí)也引申出來一些問題,需求不明確,不具體,芯片價(jià)值不清晰。自研光模塊的第一個(gè)目標(biāo)就是要打破這個(gè)生態(tài),即我們與芯片廠商直接討論規(guī)格需求和成本(用量)需求,從而去實(shí)現(xiàn)真正的端到端的成本的競爭力。模式上,我們稱之為多方JDM模式,就是我們直接向芯片廠商發(fā)出規(guī)格需求,以及一些定制化功能,芯片廠商根據(jù)我們的需求進(jìn)行優(yōu)化或者重新開發(fā),同時(shí)模塊廠商結(jié)合芯片的設(shè)計(jì),與騰訊聯(lián)合設(shè)計(jì)模塊方案,最后由模塊廠商負(fù)責(zé)生產(chǎn)制造。
進(jìn)入自研階段,我們要考慮的最重要的問題就是方案的設(shè)計(jì)和選擇如何實(shí)現(xiàn)最大價(jià)值。“光”跟“電”從傳輸屬性上有著本質(zhì)的差異,光有它自己的一些特殊屬性,比如不同溫度下的光功率特性,不同電流下的帶寬特性,還有不同條件下的波長特性。在光模塊開發(fā)過程中,往往會(huì)遇到,當(dāng)想去用一些非常有潛力的電芯片方案的時(shí)候,你會(huì)發(fā)現(xiàn)它不太懂光芯片特性,或者考慮不是那么周全,這種問題如果流入到現(xiàn)網(wǎng),就會(huì)發(fā)生類似100G網(wǎng)絡(luò)時(shí)代經(jīng)常遇到的“鏈路抖動(dòng)”。如果普通開發(fā)模式,為了滿足交付,難以繼續(xù)開發(fā),但在自研模式下,我們就可以結(jié)合系統(tǒng)規(guī)格持續(xù)去推動(dòng)方案的不斷優(yōu)化,把電芯片做到更加懂光,從而發(fā)揮出更大的技術(shù)優(yōu)勢。
光模塊大家常常理解為標(biāo)準(zhǔn)品,因?yàn)槎x好了外殼形態(tài),輸入輸出接口規(guī)格,但內(nèi)部的光學(xué)封裝是一個(gè)特殊的東西,封裝方式五花八門,每一個(gè)廠商的設(shè)計(jì)都不一樣,涉及到的制造設(shè)備也是定制化的,如果我們要快速設(shè)計(jì)及制造一個(gè)自研模塊,我們就要面臨平臺(tái)選擇的問題。自研光模塊模式下,充分利用已經(jīng)成熟的100G模塊的封裝平臺(tái),同時(shí)針對(duì)性的做一些升級(jí)改造,是滿足質(zhì)量穩(wěn)定性,開發(fā)效率以及低成本等訴求的最好解決方案。
對(duì)下一階段的探索
我們的網(wǎng)絡(luò)基本上是2到3年迭代一次,從交換芯片的路標(biāo)來看,全面112G網(wǎng)絡(luò)將在2023年來臨。近期大家已經(jīng)在討論下一代基于112Gbpsl的網(wǎng)絡(luò)開發(fā)的事情,包括網(wǎng)卡和交換設(shè)備。
在模塊層面,前面2年我們也陸陸續(xù)續(xù)做了一些技術(shù)摸底,從100G到400G&800G,模塊功耗肯定會(huì)持續(xù)提升,同時(shí),BER就是我們說的誤碼率,也會(huì)面臨指數(shù)級(jí)的劣化。這些需要加大在芯片層面的設(shè)計(jì)和優(yōu)化工作,甚至包括參與芯片的設(shè)計(jì)。光學(xué)封裝方面也會(huì)面臨一系列的挑戰(zhàn),需要探尋各種新的提高光學(xué)集成度的方案,在傳輸方案上,我們也需要持續(xù)挖掘以滿足騰訊的網(wǎng)絡(luò)場景需求。
信號(hào)傳輸距離是互聯(lián)硬件的一個(gè)基本屬性,也是我們每次探討未來技術(shù)方案和發(fā)展趨勢的時(shí)候,必須要討論的關(guān)鍵約束條件。隨著基礎(chǔ)速率的不斷提升,我們的數(shù)據(jù)中心機(jī)房或者IDC在物理距離上基本不太會(huì)有大變化。因此,在做連接兩臺(tái)設(shè)備之間的模塊或者技術(shù)方案的選擇的時(shí)候,需要隨著傳輸技術(shù)的迭代而發(fā)生迭代的?!熬嚯x”的演進(jìn)上有三個(gè)界面,從短距離接入側(cè)來看,是“光”進(jìn)“銅”退,從IDC機(jī)房內(nèi)部連接來看,是單模替代多模,從DCI連接來看,是相干技術(shù)的不斷下沉。以上這些方面,我們也陸續(xù)做了一些提前布局,包括在112Gbpsl網(wǎng)卡接入這一塊,我們正在布局基于112Gbpsl TAC技術(shù)以及相應(yīng)的芯片合作開發(fā)。IDC機(jī)房內(nèi)部的連接方面, MM SR模塊可能無法滿足我們數(shù)據(jù)中心機(jī)房 (Building Range)內(nèi)部的連接,特別是跨房間的連接,這里,我們也在探索單模替代多模的方案,特別是在單模全集成芯片方案上也做了一些聯(lián)合開發(fā)的嘗試。IMDD和coherent的選擇和替代,我們預(yù)計(jì)可能會(huì)在1.6T或者單波400G這一代到來,所以未來我們會(huì)在Coherent-lite這個(gè)領(lǐng)域,特別是oDSP算法上做一些工作。
從“芯”出發(fā)
400G+上我們還會(huì)探索一些新的模式,其實(shí)有一些我們已經(jīng)在布局,包括建立芯片實(shí)驗(yàn)室及芯片級(jí)系統(tǒng)驗(yàn)證平臺(tái),以及牽引一些行業(yè)的標(biāo)準(zhǔn)等。
光模塊跟傳統(tǒng)電氣器件/設(shè)備的一個(gè)關(guān)鍵的區(qū)別,就是它不僅要有“電”的特性,還要有“光”的特性,所以它必須同時(shí)面對(duì)微電子的摩爾定律和光電子的摩爾定律。隨著光進(jìn)銅退的趨勢,全球都在不斷整合核心的光電資源,以傳統(tǒng)電芯片領(lǐng)域的巨頭為首的廠商,他們也在往光電子這個(gè)領(lǐng)域不斷的去擴(kuò)張,為未來的光電融合趨勢做準(zhǔn)備。同樣,我們也需要做些什么,去迎接一個(gè)又一個(gè)挑戰(zhàn)。112Gbpsl可能是一個(gè)很長的過程,基于112G Serdes的400G+系統(tǒng),正是我們需要在當(dāng)下布局, 展望未來的最好契機(jī)!