Iccsz訊 在近日召開的“GNTC全球網(wǎng)絡(luò)技術(shù)大會”上,阿里技術(shù)保障部高級網(wǎng)絡(luò)專家曹捷表示,阿里網(wǎng)絡(luò)從最開始千兆、萬兆,到現(xiàn)在25G,以及到明年的100G,花了近五年的時(shí)間,這個(gè)過程當(dāng)中經(jīng)歷了很多次的技術(shù)迭代和很多次的試錯,最終阿里決定要把網(wǎng)絡(luò)做到最簡單,簡單到一個(gè)網(wǎng)絡(luò)里面只有一個(gè)路由協(xié)議,而且這個(gè)BCP路由協(xié)議沒有任何擴(kuò)展的協(xié)議組。網(wǎng)絡(luò)在接入交換機(jī)就在最后的端口上,提供給服務(wù)器接入。
據(jù)曹捷介紹,在2013年和2014年,阿里第一次做網(wǎng)絡(luò)架構(gòu)的標(biāo)準(zhǔn)化, 13年底實(shí)現(xiàn)了整個(gè)阿里數(shù)據(jù)中心的標(biāo)準(zhǔn)化建設(shè),不管北京、上海、深圳,還是在云南、成都,機(jī)房里數(shù)據(jù)中心的網(wǎng)絡(luò)hope圖完全一樣,設(shè)備型號完全一樣,設(shè)備配置也完全一樣。之后,阿里做超大規(guī)模的網(wǎng)絡(luò)部署,解決了服務(wù)器分散,運(yùn)維團(tuán)隊(duì)忙不過來的問題。
2016年,為適應(yīng)阿里云的迅猛發(fā)展,阿里網(wǎng)絡(luò)再次進(jìn)行改造,第一次嘗試自己做網(wǎng)管,雖然成功的實(shí)現(xiàn)了網(wǎng)絡(luò)的正常運(yùn)轉(zhuǎn),但由于業(yè)務(wù)與網(wǎng)絡(luò)間過于耦合導(dǎo)致業(yè)務(wù)線對產(chǎn)品進(jìn)行調(diào)整就需要網(wǎng)絡(luò)部門配合對網(wǎng)絡(luò)進(jìn)行修改。為此,阿里開始將網(wǎng)絡(luò)與業(yè)務(wù)進(jìn)行分離,從而實(shí)現(xiàn)網(wǎng)絡(luò)與業(yè)務(wù)的解耦。
曹捷認(rèn)為,通過一次次迭代,讓阿里網(wǎng)絡(luò)的架構(gòu)設(shè)計(jì)原則,變?yōu)樵胶唵卧胶?。簡單才能穩(wěn)定可靠,穩(wěn)定可靠才可以活下來。
此外,曹捷認(rèn)為,對于整個(gè)數(shù)據(jù)中心網(wǎng)絡(luò)流量監(jiān)控也至關(guān)重要,要做流量可視化。流量可視化解決三個(gè)問題:第一個(gè)問題解決看不見問題,比如延時(shí)、轉(zhuǎn)發(fā)路徑等;第二個(gè)問題解決找不到問題,通過隨包的檢測和拓?fù)涞木S護(hù),快速定位問題所在的位置;第三個(gè)是摸不準(zhǔn)問題,通過可視化看網(wǎng)絡(luò)真實(shí)的轉(zhuǎn)發(fā)數(shù)據(jù),把數(shù)據(jù)整合起來做分析,會找到整個(gè)網(wǎng)絡(luò)設(shè)計(jì)架構(gòu)的盲點(diǎn),解決收斂比、規(guī)模等設(shè)計(jì)難點(diǎn)。
曹捷表示,可視化將會在未來3-5年之內(nèi)是阿里全力投入的數(shù)據(jù)中心網(wǎng)絡(luò)技術(shù),其會幫助阿里在沒有辦法實(shí)現(xiàn)完全自研支持最大可能的掌握數(shù)據(jù)交配。