ICC訊(編譯:Nina)根據(jù)Dell'Oro Group最新的《人工智能工作負(fù)載的人工智能網(wǎng)絡(luò)》(AI Networks for AI Workloads)報(bào)告,預(yù)計(jì)在人工智能后端網(wǎng)絡(luò)中部署的交換機(jī)支出將使數(shù)據(jù)中心交換機(jī)市場(chǎng)擴(kuò)大50%。
目前的數(shù)據(jù)中心交換機(jī)市場(chǎng)支出主要用于連接通用服務(wù)器的前端網(wǎng)絡(luò)。人工智能工作負(fù)載將需要建立新的后端基礎(chǔ)設(shè)施。隨著各大企業(yè)爭(zhēng)奪人工智能后端網(wǎng)絡(luò)的市場(chǎng)主導(dǎo)權(quán),InfiniBand和以太網(wǎng)之間的競(jìng)爭(zhēng)正在加劇。雖然InfiniBand預(yù)計(jì)將保持領(lǐng)先地位,但預(yù)計(jì)以太網(wǎng)將取得顯著進(jìn)展,例如到2027年其份額(指收入)將上升20個(gè)百分點(diǎn)。
Dell'Oro集團(tuán)副總裁Sameh Boujelbene表示:“生成式人工智能應(yīng)用開創(chuàng)了人工智能時(shí)代的新時(shí)代,因?yàn)樗鼈儽仨毺幚淼膮?shù)數(shù)量眾多。目前,一些大型人工智能應(yīng)用處理數(shù)萬(wàn)億個(gè)參數(shù),這個(gè)數(shù)字每年增長(zhǎng)十倍。這種快速增長(zhǎng)需要部署數(shù)千甚至數(shù)十萬(wàn)個(gè)加速節(jié)點(diǎn)。在大型集群中連接這些加速節(jié)點(diǎn)需要一個(gè)數(shù)據(jù)中心規(guī)模的結(jié)構(gòu),稱為人工智能后端網(wǎng)絡(luò),它不同于主要用于連接通用服務(wù)器的傳統(tǒng)前端網(wǎng)絡(luò)?!?
“這種困境提出了一個(gè)關(guān)鍵問題:什么是最合適的結(jié)構(gòu),可以擴(kuò)展到數(shù)十萬(wàn)個(gè)甚至數(shù)百萬(wàn)個(gè)加速節(jié)點(diǎn),同時(shí)確保最低的作業(yè)完成時(shí)間(Job Completion Time,JCT)?有人可能會(huì)說(shuō),以太網(wǎng)比InfiniBand快了一代。然而,網(wǎng)絡(luò)速度并不是唯一的因素。擁塞控制和自適應(yīng)路由機(jī)制也很重要。我們分析了主要云服務(wù)提供商(如谷歌、亞馬遜、微軟、Meta、阿里巴巴、騰訊、字節(jié)跳動(dòng)、百度等)構(gòu)建的人工智能后端網(wǎng)絡(luò),以及推動(dòng)他們選擇后端結(jié)構(gòu)的各種考慮因素,從而得出我們的預(yù)測(cè),”Boujelbene繼續(xù)說(shuō)道。
《人工智能工作負(fù)載的人工智能網(wǎng)絡(luò)》報(bào)告的其他亮點(diǎn):
1. 人工智能網(wǎng)絡(luò)將加速向更高速度的過渡。例如,預(yù)計(jì)到2025年,在最新推出800Gbps產(chǎn)品的兩年內(nèi),800Gbps將占人工智能后端網(wǎng)絡(luò)的大部分端口。
2. 雖然大部分市場(chǎng)需求將來(lái)自一級(jí)(Tier 1)云服務(wù)提供商,但預(yù)計(jì)2/3級(jí)(Tier 2/3)和大型企業(yè)的需求將非常巨大,未來(lái)五年將接近100億美元。后者傾向于以太網(wǎng)。