ICC訊 硅基光電計(jì)算是建立在硅基光電子學(xué)基礎(chǔ)上的一種新型計(jì)算體系,如圖1所示。硅基光電子學(xué)是探討微納米量級(jí)光子、電子及光電子器件在不同材料體系中的工作原理,并使用與硅基集成電路工藝兼容的技術(shù)和方法,將它們異質(zhì)集成在同一硅襯底上形成一個(gè)完整的具有綜合功能的新型大規(guī)模光電集成芯片的一門科學(xué)。
圖1 硅基光電計(jì)算體系
早期硅基光電子概念的提出是為了解決傳統(tǒng)微電子芯片中核心單元之間的互連通信瓶頸問題。近十年來(lái),硅基光電子因其與CMOS技術(shù)兼容的集成工藝和光域通信互連方面的優(yōu)點(diǎn),不僅在通信領(lǐng)域?qū)崿F(xiàn)了產(chǎn)業(yè)化,快速占領(lǐng)市場(chǎng)份額,還催生了其他前沿應(yīng)用領(lǐng)域,如人工智能處理器中的光電計(jì)算,成為了具有多樣化應(yīng)用潛力的硬件平臺(tái)。基于硅基光電子技術(shù)的光電計(jì)算,利用光的優(yōu)異特性,如低延遲、低損耗、超寬頻帶、多維復(fù)用、波動(dòng)特性等,與微電子技術(shù)結(jié)合,在硅襯底上巧妙構(gòu)造軟硬件深度融合的光電計(jì)算體系,解決傳統(tǒng)微電子處理器在高速計(jì)算應(yīng)用上的算力、能耗和輸入輸出瓶頸問題,成為光電子學(xué)、微電子學(xué)、光子學(xué)、數(shù)學(xué)、算法、計(jì)算機(jī)系統(tǒng)等深度融合的新型交叉學(xué)科。
關(guān)鍵進(jìn)展
以現(xiàn)階段熱門的人工智能為例,其開發(fā)過程依賴專用的硬件,如圖像處理單元(GPU)和專用集成電路(ASIC),為樣本訓(xùn)練和模型參數(shù)調(diào)優(yōu)提供算力基礎(chǔ)。根據(jù)硅谷人工智能研究組織OpenAI統(tǒng)計(jì),在2012-2020年的8年間,深度人工神經(jīng)網(wǎng)絡(luò)的浮點(diǎn)計(jì)算量以指數(shù)速率快速增長(zhǎng),平均每3.4個(gè)月翻一倍,遠(yuǎn)超集成電路摩爾定律的增長(zhǎng)速率,同時(shí)也伴隨驚人的能耗問題,限制了人工智能的發(fā)展。因此,在后摩爾定律時(shí)代,發(fā)展新的人工智能計(jì)算硬件是當(dāng)務(wù)之急。人工神經(jīng)網(wǎng)絡(luò)計(jì)算中包含大量矩陣相關(guān)的基本運(yùn)算,如矩陣乘法、點(diǎn)乘內(nèi)積和乘加計(jì)算等。如圖2所示,在深度卷積神經(jīng)網(wǎng)絡(luò)的隱藏層中的卷積核與特征圖之間存在大量的矩陣卷積操作,在全連接層則通過矩陣乘法實(shí)現(xiàn)層間傳遞。當(dāng)矩陣規(guī)模較大時(shí),通過微電子處理器進(jìn)行大量的二進(jìn)制矩陣運(yùn)算,效率較低,延遲較高,難以實(shí)現(xiàn)高速實(shí)時(shí)的人工智能應(yīng)用。
圖2 人工神經(jīng)網(wǎng)絡(luò)運(yùn)算過程的矩陣乘法和卷積運(yùn)算
硅基光電計(jì)算,以片上光電融合為基礎(chǔ),利用電子的邏輯運(yùn)算優(yōu)勢(shì)和光子的光學(xué)變換、等效映射、相干探測(cè)、高速互連等方式,有望構(gòu)建大算力、低能耗的光電矩陣計(jì)算硬件體系,如圖3所示。學(xué)術(shù)界和產(chǎn)業(yè)界對(duì)光電計(jì)算的算力、能耗和可行性等指標(biāo)做了預(yù)測(cè)和評(píng)估:(1)任意矩陣可通過奇異值分解,分解成兩個(gè)酉矩陣和一個(gè)對(duì)角特征值矩陣相乘,其中酉矩陣和特征值矩陣可通過級(jí)聯(lián)的馬赫-曾德爾干涉(MZI)網(wǎng)絡(luò)實(shí)現(xiàn)。傳輸損耗<1dB/cm的大規(guī)模低損耗的MZI網(wǎng)絡(luò),是實(shí)現(xiàn)光電矩陣運(yùn)算的硬件基礎(chǔ),可利用硅基光電子技術(shù)制備。(2)利用高速電光調(diào)制的大規(guī)模MZI網(wǎng)絡(luò)實(shí)現(xiàn)矩陣運(yùn)算,在典型深度的多層MLP神經(jīng)網(wǎng)絡(luò)中,可以達(dá)到1018 MAC/s的等效矩陣乘法算力量級(jí),比使用ASIC微電子芯片進(jìn)行的同類運(yùn)算快5個(gè)數(shù)量級(jí)。(3)在自差相干探測(cè)的光電乘加器中,可實(shí)現(xiàn)接近標(biāo)準(zhǔn)量子極限的模擬乘加計(jì)算。在典型的神經(jīng)網(wǎng)絡(luò)神經(jīng)元規(guī)模下,光電乘加運(yùn)算的標(biāo)準(zhǔn)量子極限理論能耗在10-18 J/MAC量級(jí),而目前實(shí)際可行的光電乘加器件能耗約為10-15 J/MAC量級(jí),相比電子乘加器運(yùn)算的10-12J/MAC量級(jí),有3~4個(gè)數(shù)量級(jí)的能效提升。
圖3 硅基光電計(jì)算案例
除了人工神經(jīng)網(wǎng)絡(luò)矩陣運(yùn)算以外,硅基光電子技術(shù)在模擬計(jì)算、離散傅里葉變換、集成光量子邏輯門和神經(jīng)擬態(tài)計(jì)算等研究和應(yīng)用中也取得了如下的重要進(jìn)展:(1)在伊辛問題和圖最大割問題等非確定性多項(xiàng)式NP問題中,通過軟硬件深度融合可設(shè)計(jì)高能效和高性能的光電啟發(fā)式算法求解器。在硅基光電系統(tǒng)的快速循環(huán)迭代下,實(shí)現(xiàn)NP問題的模型能量快速演化收斂,得到復(fù)雜問題的可行解。(2)通過硅基光電子平臺(tái)的片上光學(xué)變換,構(gòu)建低延遲的光電離散傅里葉變換DFT器件和系統(tǒng),可克服無(wú)線局域網(wǎng)和蜂窩數(shù)據(jù)通信中多徑效應(yīng)和信道衰減等數(shù)據(jù)傳輸問題,實(shí)現(xiàn)OFDM系統(tǒng)的載波信道復(fù)用,是未來(lái)微波無(wú)線通信中降低數(shù)據(jù)通信延遲的可行技術(shù)方案。(3)在電控光量子處理器中,通過多維度調(diào)控的硅基光電子器件庫(kù),使得片上多量子態(tài)的量子信息操控和處理成為可能;利用硅基光電子芯片的高集成度,突破量子信息處理的實(shí)驗(yàn)規(guī)模,同時(shí)避免了光電元件的空間占用,有利于量子計(jì)算的大規(guī)??赏卣箲?yīng)用。(4)在基于硅基光電子技術(shù)的神經(jīng)擬態(tài)芯片中,片上光互連的優(yōu)勢(shì)可促使低損耗、低延遲的光電神經(jīng)元和神經(jīng)擬態(tài)系統(tǒng)的構(gòu)建。隨著光脈沖神經(jīng)元數(shù)量的增加,神經(jīng)元節(jié)點(diǎn)間的信息通信和復(fù)雜連接可組成大規(guī)模的光電神經(jīng)系統(tǒng),通過神經(jīng)系統(tǒng)的訓(xùn)練,進(jìn)而實(shí)現(xiàn)復(fù)雜的類腦人工智能。
總結(jié)與展望
硅基光電計(jì)算是未來(lái)提高處理器算力、減少能耗、降低數(shù)據(jù)處理和通信延遲的關(guān)鍵技術(shù),具有重要的戰(zhàn)略意義。然而,現(xiàn)階段高性能計(jì)算在研究過程中存在目標(biāo)不明確、發(fā)展路線規(guī)劃混亂等現(xiàn)象,為此,我們認(rèn)為下面三點(diǎn)需要在業(yè)界成為共識(shí):
1、光電計(jì)算的特點(diǎn)和意義。光子由于自身的特點(diǎn),難以便捷高效地實(shí)現(xiàn)相互作用、單元緩存和邏輯運(yùn)算,其器件集成度也難以達(dá)到電子集成電路的規(guī)模,因而,利用“光子計(jì)算”來(lái)取代“電子計(jì)算”是不切實(shí)際的?!肮杌怆娪?jì)算”是光電子學(xué)、微電子學(xué)、光子學(xué)、數(shù)學(xué)、算法、計(jì)算機(jī)系統(tǒng)等深度結(jié)合的新型交叉學(xué)科,通過軟件和硬件的深度聯(lián)合設(shè)計(jì),有望實(shí)現(xiàn)超高性能計(jì)算。
2、光電融合的發(fā)展趨勢(shì)。在硅基光電計(jì)算中,光子和電子相輔相成,缺一不可,光電融合是必然趨勢(shì)。通過與硅基集成電路工藝兼容的技術(shù)和方法,將光子、光電子和微電子器件集成在同一硅基芯片平臺(tái)上,形成優(yōu)勢(shì)互補(bǔ)的整體,才能突破現(xiàn)有“電子計(jì)算”的性能極限,擺脫“光子計(jì)算”的觀念誤區(qū),更好地推動(dòng)光電計(jì)算的實(shí)際應(yīng)用。
3、硅基光電計(jì)算系統(tǒng)。其架構(gòu)需要包含如圖4所示的基本單元,其中光電計(jì)算單元(Optoelectronic Computing Unit, OECU)是計(jì)算處理性能提升的關(guān)鍵,用以實(shí)現(xiàn)高速的矩陣運(yùn)算和模擬計(jì)算等。一些在光域上不便進(jìn)行的計(jì)算操作,如信號(hào)延遲、數(shù)據(jù)緩存和邏輯運(yùn)算等,仍需要引入算術(shù)邏輯單元(Arithmetic & Logic Unit, ALU),主控(Control Unit),寄存器(Register)、緩存(Memory)等,在電子處理單元中實(shí)現(xiàn)。而計(jì)算、控制和存儲(chǔ)單元之間的互連通信和硬件系統(tǒng)I/O等,則通過光互連來(lái)實(shí)現(xiàn)。
圖4 硅基光電計(jì)算初級(jí)系統(tǒng)
在這個(gè)全新的系統(tǒng)中,光子、電子及光電子技術(shù)在芯片上的優(yōu)勢(shì)互補(bǔ)和計(jì)算單元之間以及單元與外界的高速光電互連形成硅基光電計(jì)算的基礎(chǔ),這是最終獲得實(shí)用性超高性能計(jì)算的關(guān)鍵。