Iccsz訊 在近日召開的“GNTC全球網(wǎng)絡技術(shù)大會”上,阿里技術(shù)保障部高級網(wǎng)絡專家曹捷表示,阿里網(wǎng)絡從最開始千兆、萬兆,到現(xiàn)在25G,以及到明年的100G,花了近五年的時間,這個過程當中經(jīng)歷了很多次的技術(shù)迭代和很多次的試錯,最終阿里決定要把網(wǎng)絡做到最簡單,簡單到一個網(wǎng)絡里面只有一個路由協(xié)議,而且這個BCP路由協(xié)議沒有任何擴展的協(xié)議組。網(wǎng)絡在接入交換機就在最后的端口上,提供給服務器接入。
據(jù)曹捷介紹,在2013年和2014年,阿里第一次做網(wǎng)絡架構(gòu)的標準化, 13年底實現(xiàn)了整個阿里數(shù)據(jù)中心的標準化建設,不管北京、上海、深圳,還是在云南、成都,機房里數(shù)據(jù)中心的網(wǎng)絡hope圖完全一樣,設備型號完全一樣,設備配置也完全一樣。之后,阿里做超大規(guī)模的網(wǎng)絡部署,解決了服務器分散,運維團隊忙不過來的問題。
2016年,為適應阿里云的迅猛發(fā)展,阿里網(wǎng)絡再次進行改造,第一次嘗試自己做網(wǎng)管,雖然成功的實現(xiàn)了網(wǎng)絡的正常運轉(zhuǎn),但由于業(yè)務與網(wǎng)絡間過于耦合導致業(yè)務線對產(chǎn)品進行調(diào)整就需要網(wǎng)絡部門配合對網(wǎng)絡進行修改。為此,阿里開始將網(wǎng)絡與業(yè)務進行分離,從而實現(xiàn)網(wǎng)絡與業(yè)務的解耦。
曹捷認為,通過一次次迭代,讓阿里網(wǎng)絡的架構(gòu)設計原則,變?yōu)樵胶唵卧胶?。簡單才能穩(wěn)定可靠,穩(wěn)定可靠才可以活下來。
此外,曹捷認為,對于整個數(shù)據(jù)中心網(wǎng)絡流量監(jiān)控也至關(guān)重要,要做流量可視化。流量可視化解決三個問題:第一個問題解決看不見問題,比如延時、轉(zhuǎn)發(fā)路徑等;第二個問題解決找不到問題,通過隨包的檢測和拓撲的維護,快速定位問題所在的位置;第三個是摸不準問題,通過可視化看網(wǎng)絡真實的轉(zhuǎn)發(fā)數(shù)據(jù),把數(shù)據(jù)整合起來做分析,會找到整個網(wǎng)絡設計架構(gòu)的盲點,解決收斂比、規(guī)模等設計難點。
曹捷表示,可視化將會在未來3-5年之內(nèi)是阿里全力投入的數(shù)據(jù)中心網(wǎng)絡技術(shù),其會幫助阿里在沒有辦法實現(xiàn)完全自研支持最大可能的掌握數(shù)據(jù)交配。