近年來,人工智能、虛擬/增強現(xiàn)實、物聯(lián)網(wǎng)等新興技術的涌現(xiàn)都離不開云計算的支持。云計算是數(shù)百萬臺分布在全球各地數(shù)據(jù)中心的服務器通過網(wǎng)絡連接在一起組成的大型分布式計算平臺。今天,數(shù)據(jù)中心不再是一座孤立的機房,而是一個建筑群。一個數(shù)據(jù)中心可以包含很多個分支數(shù)據(jù)中心,它們所處的位置不同,卻可以通過網(wǎng)絡互聯(lián)起來,共同完成相應的業(yè)務部署。
而實現(xiàn)這些數(shù)據(jù)中心間互通的紐帶就是——數(shù)據(jù)中心間互聯(lián)技術(注,下文簡稱DCI)
根據(jù)Cisco發(fā)布的云指數(shù)報告,過去五年,數(shù)據(jù)中心間的互聯(lián)帶寬保持了近33%的年增長率,互聯(lián)帶寬達到了~100Tb/s量級。
圖 1 Cisco發(fā)布的數(shù)據(jù)中心年流量增長趨勢
當把若干個數(shù)據(jù)中心用光纖連接起來,并且采用光通信技術承載他們之間相互的信息傳遞,這就組成了數(shù)據(jù)中心間互聯(lián)光網(wǎng)絡(注,后面簡稱DCI網(wǎng)絡)。
從不同角度分析,DCI網(wǎng)絡有一些明顯特征:
1、網(wǎng)絡拓撲以點到點和簡單組網(wǎng)為主,復雜度較低。
2、城域數(shù)據(jù)中心間互聯(lián)距離較短,單位傳輸成本的降低對數(shù)據(jù)中心很有吸引力。
3、更加關心網(wǎng)絡時延,小的設備時延可以減輕數(shù)據(jù)中心選址的困難。
4、互聯(lián)業(yè)務種類相對單一,以100G的以太網(wǎng)為主,電層設備復雜度較低。
5、結合流量的快速增長,模塊化的設備以及靈活可擴張的組網(wǎng)方式更受歡迎。
6、特殊的硬件要求,例如容納在服務器機柜中,滿足前后出風、高壓直流供電方式等。
為了更好的建設和維護數(shù)據(jù)中心間互聯(lián)網(wǎng)絡,適配快速增加的數(shù)據(jù)中心間流量,DCI技術應運而生。
從黑盒封閉到開放解耦
在過去的網(wǎng)絡運營體系中,系統(tǒng)廠商提供整套解決方案,包括設備安裝、系統(tǒng)調試、運維支持等,系統(tǒng)整體類似于封閉的黑盒,不同廠家的硬件、軟件均不具備兼容互通的可能。
其次,成本問題。受益于相干光傳輸技術的不斷演進,單波速率從100Gb/s增長到了800Gb/s,由于電層設備的主要成本來自于光學器件,因此單波速率提高有利于降低單位成本。不過,過去10年,很少有一家系統(tǒng)廠家持續(xù)保持產(chǎn)品上的領先優(yōu)勢。這意味著,如果繼續(xù)采用封閉系統(tǒng)構建網(wǎng)絡,將無法第一時間享受到技術發(fā)展的紅利。
圖 3 電層單波速率和單纖容量的演化圖
另外,封閉系統(tǒng)中的私有網(wǎng)管軟件無法與用戶已有資源管理、權限管理、建設流程和日常維護系統(tǒng)打通,難以提升端到端的自動化水平,從而縮短業(yè)務開通時間。
DCI技術的第一個突破點就是打開封閉的系統(tǒng),讓用戶可以按需定制自己的網(wǎng)絡,規(guī)避獨家綁定,確保供應安全。
阿里云基礎設施光網(wǎng)絡團隊,研究提出開放解耦DCI技術的概念,并和行業(yè)合作伙伴一起推進了DCI技術生態(tài)的形成和壯大,突破了傳統(tǒng)封閉式的系統(tǒng)理念。
DCI網(wǎng)絡可以看成由底層硬件設備和上層管控軟件共同組成,其中設備分為光層設備和電層設備,兩者的角色類比于城市的交通設施,光層設備類似基礎道路,電層設備則是路上的交通工具。同電層技術的快速演化相比,光層設備屬于基礎設施中的基礎設施,技術演進相對較慢,往往都會超期服役。所以,解耦的第一刀就切在這里,把公路和交通工具分割開,把光層和電層解耦。光層設備和電層設備來自不同廠家,同時在一套光層設備組成的“公路”上,可以支持來自不同電層設備廠家的“交通工具”。
圖 4 日常生活中的道路上可以自由的行駛來自不同廠家的不同類型的交通工具,開放解耦DCI網(wǎng)絡也擁有類似的能力
同時,需要設備提供統(tǒng)一接口能力。軟件定義網(wǎng)絡(Software defined networks)的發(fā)展,Netconf協(xié)議得到了大多數(shù)設備廠家的共識。阿里巴巴也在早期加入了OpenConfig組織,參與光網(wǎng)絡相關的數(shù)據(jù)模型定義?;贜etconf協(xié)議和OpenConfig模型,可以采用第三方云軟件平臺直接對接廠家設備實現(xiàn)管控,這種完全解耦的系統(tǒng)減少了管控路徑上的環(huán)節(jié),對響應新增網(wǎng)絡級功能需求有更好的主動性和自由度。
圖 5 開放解耦的DCI網(wǎng)絡
靈活架構支持網(wǎng)絡可擴張
封閉系統(tǒng)打開后,下一步就可選擇更合適的硬件來構建可靈活擴張的DCI網(wǎng)絡。
在較長一段時間內(nèi),光層設備的合分波單元僅支持固定通道間隔,實際上,隨著單波速率不斷提升,電層設備需要的頻譜寬度也不斷增加。為了兼容不斷發(fā)展的單波速率,固定間隔的合分波單元要升級到基于波長選擇開關(Wavelength Selective Switch,WSS)的靈活合分波單元。
圖 6 靈活合分波單元與靈活柵格頻譜,為了支持更多的上下路端口,需要將兩個WSS進行合并
在規(guī)模大的DCI網(wǎng)絡中,業(yè)務分布更復雜,需要考慮基于ROADM(Reconfigurable Optical Add Drop Multiplexer)的Mesh網(wǎng)絡架構。在數(shù)據(jù)中心較為分散的城市,往往會采用星型架構。如果主站不具備光層穿通能力,那么衛(wèi)星站之間的流量需要在主站進行光-電-光轉換,不僅增加額外成本,還會增加站點間的傳輸時延。當主站是ROADM時,衛(wèi)星站之間的業(yè)務可以在主站穿通直達對端,并且穿通的波長和路由都可通過網(wǎng)管軟件進行配置,大大減少DCI網(wǎng)絡的人工運維成本,提升業(yè)務開通效率。
圖 7 IP網(wǎng)絡與能夠支持ROADM的DCI網(wǎng)絡之間的協(xié)同
點到點場景下,光層在第一天就已經(jīng)建設完畢,光電解耦是合理的。在Mesh DCI網(wǎng)絡中,考慮到后續(xù)站點的增加和網(wǎng)絡規(guī)模的擴大,光層需要進一步解耦。我們推薦將ROADM按照方向進行解耦,同時確保光復用段(Optical Multiplex Section,OMS)內(nèi)的設備都來自于同一個廠家。這樣的方式即可將DCI網(wǎng)絡中的光層部分有效切割,同時又避免陷入過多的設備之間協(xié)議的約定細節(jié)中。網(wǎng)絡建設的第一天只有站點A和B之間的連接,設備來自于供應商M。第二天增加了一個新的站點C,那么站點C與站點B之間的連接,站點C與站點A之間的連接分別由供應商T1和T2承建。為了應對不同廠商設備連接頭不同導致的無法互通的問題,我們設計了一款支持靈活插卡的萬能連纖盒,由全連接背板以及方向適配插卡組成。每個方向的適配板卡可以匹配廠家的接頭規(guī)格,并將廠家的線序“翻譯”成通用線序。這樣,任意兩個方向之間通過萬能連纖盒實現(xiàn)了全連接??梢哉f,萬能連纖盒以四兩撥千斤的方式實現(xiàn)了光層異構,為DCI網(wǎng)絡規(guī)模的擴大打開了自由之門。
圖 8 基于萬能連纖盒的異構ROADM和光層解耦方案示意
管控自動化提升網(wǎng)絡效率
同IP數(shù)字通信系統(tǒng)相比,光網(wǎng)絡中依然保留了大量的模擬屬性,例如光功率如何調整,放大器的增益、斜率如何配置等。為了應對這樣的挑戰(zhàn),需要能實現(xiàn)可供第三方使用的開放光網(wǎng)絡設計工具。通過抽象出多層級模型,描述不同廠家設備的行為和功能,廠家的差異性體現(xiàn)則在模型的關鍵規(guī)格參數(shù)中。結合實際組網(wǎng)拓撲數(shù)據(jù)、業(yè)務資源數(shù)據(jù)等信息,規(guī)劃器求解端到端最優(yōu)化問題,可以計算獲得所有設備上的目標配置值以及此時的性能余量。
在已有網(wǎng)絡中新增業(yè)務或者做配置優(yōu)化時,需要像一個攀巖高手一樣,小心的選擇從當前配置到目標配置的調節(jié)路徑。受限于光放大器非線性、光纖Kerr非線性以及受激拉曼散射效應的影響,不僅當前調節(jié)的業(yè)務通道需要關注,相鄰的通道以及附近相關OMS上的通道同樣需要監(jiān)測。在配置器中引入了實時狀態(tài)檢查單元,實時采集的設備性能數(shù)據(jù)經(jīng)過定制的檢查邏輯,判斷當前調節(jié)路徑是否存在風險,不斷更新。如此反復,最終安全的實現(xiàn)預設的調節(jié)目標。
圖 9 可供第三方使用的開放光網(wǎng)絡設計工具和自動化配置流程
發(fā)展和挑戰(zhàn)
不斷涌現(xiàn)的互聯(lián)網(wǎng)服務以及快速演進的云計算,推動了DCI網(wǎng)絡在過去的十年里蓬勃發(fā)展。開放解耦的系統(tǒng),簡單且靈活的架構體系以及軟件自動化是DCI的主要創(chuàng)新點。在可預見的未來里,5G網(wǎng)絡,物聯(lián)網(wǎng)(IoT),增強現(xiàn)實技術(AR)和虛擬現(xiàn)實(VR),以及邊緣云計算將繼續(xù)推動DCI網(wǎng)絡快速增長。一個開放的DCI生態(tài)將會更有利于新技術的發(fā)展和引入、推動技術創(chuàng)新和業(yè)界繁榮,更好滿足客戶和業(yè)務的需求,并最終推動云計算邁向新的階段!