本文轉(zhuǎn)載自微信公眾號“老石談芯”
人類文明的進(jìn)步,與“光”的使用密不可分。19 世紀(jì)晚期,英國物理學(xué)家丁達(dá)爾向人們揭示了光的全反射原理,這也解釋了光為何能在彎曲的水流或玻璃棒里向前傳播。自此,人們就開始了對光傳輸介質(zhì)的探尋。
上世紀(jì)中葉,高錕發(fā)表名為《光頻率介質(zhì)纖維表面波導(dǎo)》的論文。他創(chuàng)造性的提出,使用基于石英的玻璃纖維作為光傳輸介質(zhì),可以進(jìn)行長距離的信息傳輸。由此,光纖逐漸登上歷史舞臺。和電纜相比,光纖在性能、可靠性、安全性等很多方面都有極大的提升,這也使得光纖成為了現(xiàn)代文明主要的通信介質(zhì)之一,并引發(fā)了一系列通信行業(yè)的根本性變革。
在半導(dǎo)體領(lǐng)域,當(dāng)前芯片間的主要互聯(lián)方式還是基于電氣連接。隨著距離的增加,數(shù)據(jù)傳輸帶寬會急劇下降,而由此帶來的能耗則會大幅上升。下圖就展示了芯片內(nèi)部、芯片與電路板、電路板之間等不同維度下,數(shù)據(jù)傳輸帶來的帶寬損失與能耗增長??梢钥吹剑词乖诎寮壨ㄐ艜r采用光纜傳輸,相比芯片內(nèi)部的傳輸速度和能效仍然下降了 4 個數(shù)量級。
為了解決這個問題,業(yè)界已經(jīng)開始探尋能否在芯片互聯(lián)時使用光傳輸代替電傳輸,從而極大提升數(shù)據(jù)帶寬、減少傳輸能耗、并延長數(shù)據(jù)傳輸?shù)木嚯x。在這其中,硅光子芯片技術(shù)正在獲得越來越多的關(guān)注。
近日,一家名為 Ayar Labs 的初創(chuàng)公司展示了一款名為 TeraPHY 的光學(xué)收發(fā)器。這個光學(xué)收發(fā)器以芯粒(chiplet)的形式集成在英特爾 Stratix10 FPGA 上,可以達(dá)到 2Tbps 的數(shù)據(jù)帶寬,傳輸距離最高可達(dá) 2 公里,而傳輸功耗則不超過每比特 1pJ(10 的 -12 次方)。
動圖,左側(cè)是兩個光子芯粒,中間是 Stratix10
相比之下,目前 FPGA 使用的 PAM4 收發(fā)器速率最高為 58Gbps,NRZ 收發(fā)器最高速率為 30Gbps,而當(dāng)前電氣收發(fā)器的路線圖也只不過安排到了 112Gbps。也就是說,這種光學(xué)收發(fā)器至少可以取得近 20 倍的性能提升,傳輸距離和功耗更不可同日而語,而這也將 FPGA 收發(fā)器的性能帶到了一個全新的高度。
Ayar Labs 與光子芯片
Ayar Labs 成立于 2015 年,總部位于美國加州。它是 MIT 的孵化企業(yè),創(chuàng)始團(tuán)隊大都來自 MIT、UC Berkeley 等美國頂尖高校。Ayar Labs 先后獲得了英特爾資本、格羅方德(GlobalFoundries)以及洛克希德馬丁等公司的數(shù)千萬美元戰(zhàn)略投資。
Ayar Labs 專攻的主要領(lǐng)域就是芯片級的光子傳輸,前文提到的 TeraPHY 就是該公司目前的主打產(chǎn)品。TeraPHY 的研發(fā)主要得到了美國國防高級研究計劃局(DARPA)的項目支持。
在 2019 年的 HotChips 大會上,Ayar Labs 正式推出了 TeraPHY,并在前不久正式對這個光學(xué)收發(fā)器的性能進(jìn)行了在線演示。在接下來的文章中,我將詳細(xì)介紹 TeraPHY 的技術(shù)細(xì)節(jié),特別是它的光學(xué)數(shù)據(jù)傳輸方式,以及它是如何與 FPGA 進(jìn)行異構(gòu)集成的。
Ayar Labs 在 2019 年 HotChips 大會的講稿幻燈片,已上傳至知識星球“老石談芯 - 進(jìn)階版”,請在文末掃碼進(jìn)入星球查看。
TeraPHY:光電轉(zhuǎn)換的奧秘
光學(xué)收發(fā)器 TeraPHY 最重要的技術(shù)創(chuàng)新,在于它解決了光信號的“調(diào)制”和“解調(diào)”兩個主要問題。這其中具體的物理學(xué)細(xì)節(jié)在本文不再贅述,下一段中,我嘗試簡單介紹其中的主要原理,不感興趣的同學(xué)可以直接略過這部分。
簡言之,它利用了類似于定向耦合器的原理,當(dāng)兩個光傳輸介質(zhì)足夠靠近時,其中一個介質(zhì)里的能量就能耦合到另一個。此時如果在一個介質(zhì)上加入電場,就可以改變光在這個介質(zhì)中的傳播速度,從而控制光波的相位。通過這個過程,電信號的變化就轉(zhuǎn)變成了光信號的變化。之后當(dāng)兩個介質(zhì)里的光再次耦合時,由于光波的干涉原理,就會產(chǎn)生不同振幅。如果把波峰看成 1,波谷看成 0,那光波的不同振幅就可以解碼成由 0 和 1 組成的數(shù)字信號,也就完成了光到電的轉(zhuǎn)換。這個過程就是著名的馬赫 - 曾德爾干涉儀的工作原理。
Ayar Labs 發(fā)明了一種環(huán)形諧振器(microring resonator),來實現(xiàn)上述的過程。相比馬赫 - 曾德爾干涉儀,這種環(huán)形諧振器的尺寸要小 100 倍,能效高 50 倍,數(shù)據(jù)傳輸密度也要高 25-50 倍。通過使用這種裝置,可以實現(xiàn) 25Gbps 到 100Gbps 的傳輸帶寬。
此外,由于不同波長的光在同一介質(zhì)里傳輸時不會相互影響,可以采用多種不同的波長代表不同的比特位,這樣就實現(xiàn)了一定程度上的并行數(shù)據(jù)傳輸。
下圖展示了 TeraPHY 單個通道的收發(fā)過程,可以看到,這里采用了四種不同波長的光。在發(fā)送端,利用環(huán)形諧振器將不同比特位的數(shù)據(jù)分別調(diào)制到這四種光波上,并利用光纖進(jìn)行傳輸。在接收端,再利用環(huán)形諧振器進(jìn)行解調(diào),將不同波長的光信號轉(zhuǎn)化成相應(yīng)的電信號。
值得注意的是,為了提供穩(wěn)定的初始光源,Ayar Labs 還開發(fā)了一款名為 SuperNova 的激光源,它能夠提供最多 256 種波長的光波,等效 8.192Tbps 的數(shù)據(jù)帶寬。
SuperNova 激光源
在 HotChips19 大會上,Ayar Labs 公布了一個 TeraPHY 的測試芯片設(shè)計。在發(fā)送端,包含 5 個光學(xué)宏單元,每個宏單元支持 16 個通道,每通道 25Gbps 帶寬,共計 2Tbps。
發(fā)送端光學(xué)宏單元的芯片版圖和架構(gòu)圖
在接收端則包含 3 個宏單元,共計 1.2Tbps 帶寬。
接收端光學(xué)宏單元的芯片版圖和架構(gòu)圖
光學(xué)芯粒與 FPGA 的異構(gòu)集成
TeraPHY 剛面世時,它被同構(gòu)集成到一個 RISC-V CPU 芯片中,并代替了原有的 CPU IO 收發(fā)器。然而,這種同構(gòu)設(shè)計的靈活性十分有限,例如,如果需要把 TeraPHY 用于其他芯片系統(tǒng),則需要重新設(shè)計和生產(chǎn)整個芯片。
在芯粒(chiplet)設(shè)計大行其道的今天,將 TeraPHY 做成芯粒就成為了非常合理的選擇。在之前的文章中,曾詳細(xì)介紹過英特爾的 EMIB 技術(shù)。EMIB 最大的優(yōu)點在于它降低了系統(tǒng)的制造復(fù)雜度,并降低了不同硅片與芯粒間的傳輸延時。由于無需制造覆蓋整個芯片的硅中介層、以及遍布在硅中介層上的大量硅通孔,EMIB 只需使用較小的硅橋在硅片間進(jìn)行互聯(lián)就可以滿足硅片間的互聯(lián)需求。同樣的,由芯片 I/O 至封裝引腳的連接和普通封裝技術(shù)相比并未變化,因而無需再通過 TSV 或硅中介層進(jìn)行走線。對于模擬器件(如收發(fā)器)而言,由于不存在通用的中介層,因此對高速信號的干擾明顯降低。
英特爾的 Stratix10 FPGA 中就使用了 EMIB 技術(shù)集成了不同速率的收發(fā)器和高帶寬存儲器(HBM)。此外,EMIB 還能用來連接多個 FPGA 硅片,通過這種方法,英特爾制造出了目前世界上最大的 FPGA – Stratix10 GX 10M。
這樣,Ayar Labs 就將 TeraPHY 做成了芯粒的形式,它使用了格羅方德的 45 納米 RF SOI CMOS 工藝制造,在光學(xué)輸出端包含 10 個光學(xué)宏單元,最高傳輸速率可達(dá) 2.56Tbps。
在電氣連接端,使用了名為 AIB(Advanced Interface Bus)的物理層協(xié)議。AIB 是英特爾推出的一個異構(gòu)互聯(lián)的開放物理層協(xié)議,關(guān)于它的技術(shù)細(xì)節(jié)在本文不再詳述,它的技術(shù)白皮書已上傳至知識星球“老石談芯進(jìn)階版”,文末掃碼進(jìn)入星球查看并參與討論。
最后,TeraPHY 與 FPGA 硅片之間通過 EMIB 進(jìn)行互聯(lián),并完成芯片封裝,這也就是所謂的多芯片封裝:Multi-Chip Package(MCP)。
這是又一個使用 EMIB 進(jìn)行快速異構(gòu)集成的典型實例。通過使用這種方式,不用重新制造完整的芯片,只需要將現(xiàn)有的 FPGA 芯片與芯粒進(jìn)行互聯(lián)和封裝即可,極大提升了產(chǎn)品的靈活性,也大大降低了制造風(fēng)險與成本。
在 Ayar Labs 最新發(fā)布的在線演示中,他們使用這個集成了光學(xué)收發(fā)器的 FPGA 進(jìn)行了數(shù)據(jù)傳輸演示,并在 8 個光學(xué)鏈路下得到了 2Tbps 的數(shù)據(jù)吞吐量。Ayar Labs 預(yù)計將在未來達(dá)到超過 100Tbps 的吞吐量,同時每比特的傳輸功耗不超過 1pJ。
集成光學(xué)收發(fā)器的 Stratix10 FPGA 測試板卡,圖片來自 Ayar Labs
結(jié)語
制造玻璃的石英和制造芯片的半導(dǎo)體材料都源于沙子。正是這種取之不盡、用之不竭的材料,成為了推動人類文明進(jìn)步的重要基石。而“點石成金”的背后,則是無數(shù)研究者的不斷鉆研與創(chuàng)新。如今,光和電在 FPGA 里進(jìn)行融合,并進(jìn)一步擴(kuò)展了數(shù)據(jù)傳輸?shù)那熬?。老石相信,這樣的技術(shù)創(chuàng)新還會不斷涌現(xiàn),并繼續(xù)推動技術(shù)和文明向前進(jìn)步。
老石,微信公眾號“老石談芯”主理人,博士畢業(yè)于倫敦帝國理工大學(xué)電子工程系,現(xiàn)任某知名半導(dǎo)體公司高級FPGA研發(fā)工程師,深耕于FPGA的數(shù)據(jù)中心網(wǎng)絡(luò)加速、網(wǎng)絡(luò)功能虛擬化、高速有線網(wǎng)絡(luò)通信等領(lǐng)域的研發(fā)和創(chuàng)新工作。曾經(jīng)針對FPGA、近似計算、高性能與可重構(gòu)計算等技術(shù)在學(xué)術(shù)界頂級會議和期刊上發(fā)表過多篇研究論文。