在本周的開放計(jì)算項(xiàng)目(OCP)峰會上,一個反復(fù)出現(xiàn)的話題是數(shù)據(jù)中心內(nèi)部東西向流量的大幅增加。為了應(yīng)對這種情況,超大規(guī)模數(shù)據(jù)中心運(yùn)營商正在規(guī)劃從100 GbE向400 GbE的演進(jìn)。為了在短期內(nèi)處理東西向流量問題,Facebook創(chuàng)建了名為Fabric Aggregator的分布式網(wǎng)絡(luò)系統(tǒng)。
Fabric Aggregator是一個立足于已有的Facebook的Wedge 100交換機(jī)簡單構(gòu)建塊和開放式交換系統(tǒng)(FBOSS)軟件組成的分布式網(wǎng)絡(luò)系統(tǒng),以適應(yīng)社交媒體巨頭的快速增長。這種分布式的網(wǎng)絡(luò)系統(tǒng)能夠讓數(shù)據(jù)中心運(yùn)營商適應(yīng)更大的區(qū)域和不同的流量模式,同時提供適應(yīng)未來增長的靈活性。
Facebook軟件工程總監(jiān)Omar Baldonado表示,Facebook的對外流量與其內(nèi)部的東西向流量相比顯得相形見絀,該社交巨頭的流量,不管是東西向還是南北向都由網(wǎng)絡(luò)聚合層處理,但是流量增長正在對端口密度和每個節(jié)點(diǎn)的容量方面造成壓力。
Facebook的技術(shù)產(chǎn)品經(jīng)理Sree Sankar表示,Facebook的東西向流量大幅增加,至少需要三倍的容量,即使已經(jīng)使用了最大的交換機(jī)仍然無法解決東西向流量的問題,迫切需要一個能夠提供能源效率并具有靈活設(shè)計(jì)的系統(tǒng)。
為了跟上流量的增長,Facebook將Fabric Aggregator設(shè)計(jì)成通用網(wǎng)絡(luò)機(jī)箱的替代品。它將多個Wedge 100S交換機(jī)疊加在一起,這與Facebook已經(jīng)使用的交換機(jī)相同。然后運(yùn)行Facebook開放式交換系統(tǒng)(FBOSS)。該公司開發(fā)了四種背板布線模式來模擬經(jīng)典背板,所有背板選件的規(guī)格已提交給OCP。
Fabric Aggregator在沒有集中控制器的情況下,在所有子交換機(jī)之間運(yùn)行邊界網(wǎng)關(guān)協(xié)議(BGP)。每個子交換機(jī)獨(dú)立運(yùn)行、發(fā)送和接收流量時不對節(jié)點(diǎn)中的其他子交換機(jī)有任何交互或依賴,通過這種方式,Facebook可以根據(jù)需求的變化快速擴(kuò)張容量,更換構(gòu)建模塊和電纜組件。
ree Sankar說:“Fabric Aggregator主要的設(shè)計(jì)標(biāo)準(zhǔn)是靈活性,在過去九個月中,Facebook已經(jīng)在數(shù)據(jù)中心部署了這一分布式網(wǎng)絡(luò)系統(tǒng),它重新定義了Facebook處理網(wǎng)絡(luò)容量的方式。”
Facebook工程師在博客文章中詳細(xì)描述了Fabric Aggregator。他們將所有背板選件的規(guī)格提交給OCP,繼續(xù)他們的共享傳統(tǒng)。Facebook對OCP的網(wǎng)絡(luò)貢獻(xiàn)包括其Wedge交換機(jī)和Edge Fabric流量控制系統(tǒng)。
七年前,Facebook率先創(chuàng)建了開放計(jì)算項(xiàng)目,重點(diǎn)放在開放數(shù)據(jù)中心組件(如機(jī)架和服務(wù)器)上。OCP CEO Rocky Bullock表示,OCP目前擁有超過4000名工程師參與其各種項(xiàng)目和超過370個規(guī)格和設(shè)計(jì)包,并吸引了約3000名與會者參加。