RDMA時代到了

訊石光通訊網(wǎng) 發(fā)布時間:2019/10/14 17:05:57 編者:iccsz

摘要：Mellanox公司作為RDMA技術和設備的主要提供商，RDMA技術正在成為以數(shù)據(jù)為中心的計算模型的關鍵，如何快速、安全的傳輸和處理數(shù)據(jù)，直接關系到數(shù)據(jù)中心性能的好壞。

ICCSZ訊 2019年8月, 網(wǎng)絡界的兩大盛會，ACM Sigcomm2019和APNet’19在北京相繼召開，來自世界各地的網(wǎng)絡界精英齊聚北京，共同分享他們在網(wǎng)絡研究中的成果和面臨的挑戰(zhàn)。兩個大會都從如何解決傳統(tǒng)TCP協(xié)議面臨的問題入手，提出了各種不同層面的解決方案，從4G/5G無線網(wǎng)絡，到邊緣數(shù)據(jù)中心網(wǎng)絡，到核心數(shù)據(jù)中心，再到跨數(shù)據(jù)中心的網(wǎng)絡等。

在數(shù)據(jù)中心網(wǎng)絡的報告中，RDMA的大規(guī)模應用和網(wǎng)絡擁塞控制成為了兩個大會上的熱門話題，多篇論文談到了這個問題和他們的解決方案。其中的兩片論文《HPCC: High Precision Congestion Control》和《Gentle Flow Control: Avoiding Deadlock In Lossless Networks》收到了格外的關注。

《HPCC: High Precision Congestion Control》是由哈佛大學、阿里巴巴公司和劍橋大學聯(lián)合發(fā)表，該論文介紹了由于RDMA技術的性能優(yōu)勢，基于RDMA技術的網(wǎng)絡已經(jīng)在數(shù)據(jù)中心中得到大規(guī)模部署，但是隨著部署規(guī)模的越來越大，傳統(tǒng)的擁塞控制CC(Congestion Control)機制暴露出了其局限性，如收斂速度、穩(wěn)定性、配置復雜等。為了解決這個問題，本論文中介紹了HPCC(High Precision Congestion Control)技術，利用交換機網(wǎng)絡遙測技術(INT)來獲得精確的鏈路負載信息，并通知到發(fā)送端，由發(fā)送端根據(jù)鏈路負載進行流量調整;同時通過將Per-ACK的Reaction做成Per-RTT的Reaction，來確保高性能的傳輸下不會出現(xiàn)Over-React。從而實現(xiàn)了高速且高精度的擁塞控制- High Precision Congestion Control。這個實現(xiàn)對于RDMA技術的大規(guī)模應用起到了很重要的作用，為廣大的RDMA用戶提供了新的思路和方向。隨著數(shù)據(jù)中心的規(guī)模增大，RDMA技術成為了保障數(shù)據(jù)中心性能的重要手段，傳統(tǒng)的TCP網(wǎng)絡中的很多技術已經(jīng)不能適應高速RDMA網(wǎng)絡的需求，新技術的涌現(xiàn)推動力RDMA技術在大規(guī)模數(shù)據(jù)中心中應用的成熟。

清華大學代表在介紹其論文《Gentle Flow Control: Avoiding Deadlock In Lossless Networks》時強調，無論是計算還是存儲，分布式系統(tǒng)已經(jīng)成為了提升性能的必經(jīng)之路，很多基于分布式系統(tǒng)的應用都需要無損網(wǎng)絡的支持。傳統(tǒng)的無損網(wǎng)絡實現(xiàn)方案(如PFC等)有時會帶來網(wǎng)絡的死鎖，目前面向解決網(wǎng)絡死鎖的方案增加了網(wǎng)絡配置的復雜度，同時也影響到了網(wǎng)絡的性能。針對這個問題，清華大學提出了溫和流量控制(GFC)的方式來控制端口速率，使所有端口都能保持數(shù)據(jù)包的流動，即使存在循環(huán)緩存區(qū)的依賴關系，也可以避免網(wǎng)絡的死鎖。清華大學還用實驗和仿真驗證了GFC的實現(xiàn)和對網(wǎng)絡帶寬的影響(小于0.5%)。這篇文章提供了另一種實現(xiàn)大規(guī)模RDMA應用的思路，值得數(shù)據(jù)中心用戶去借鑒。

Mellanox公司作為RDMA技術和設備的主要提供商，RDMA技術正在成為以數(shù)據(jù)為中心的計算模型的關鍵，如何快速、安全的傳輸和處理數(shù)據(jù)，直接關系到數(shù)據(jù)中心性能的好壞。在Sigcomm和APNet這兩個大會中，關于對RDMA、無損網(wǎng)絡、擁塞控制等的探索和研究，為RDMA技術的大規(guī)模應用起到了積極的推動作用，證明了RDMA大規(guī)模應用的可行性。Mellanox的網(wǎng)絡計算(In-Network Computing)技術，除了RDMA以外，更是添加了SHARP(Scalable Hierarchical Aggregation and Reduction Protocol, 在交換機中做通信計算) 技術, SHIELD(Self Healing Technology，網(wǎng)絡自愈) 技術, AR(Adaptive Routing，動態(tài)路由) 等新的技術來面對傳統(tǒng)以CPU為核心的數(shù)據(jù)中心面臨的通信和計算的瓶頸問題，通過新的網(wǎng)絡計算技術，將網(wǎng)絡變成了IPU(I/O Process Unit)，將計算工作分散到了數(shù)據(jù)中心的各個單元，計算將會發(fā)生在最合適的地方，而不是必須要發(fā)送到CPU再做計算，實現(xiàn)了真正的以數(shù)據(jù)為中心。 In-CPU Computing，In-Network Computing和In-Storage Computing的有效整合，將會是構建未來高性能數(shù)據(jù)中心的關鍵。網(wǎng)絡作為CPU到CPU, CPU到存儲以及存儲到存儲之間通信的必經(jīng)之路，已經(jīng)成為了數(shù)據(jù)中心性能的最大挑戰(zhàn)。新的挑戰(zhàn)需要新的技術來解決，增加蠟燭的數(shù)量不能發(fā)明電力;增加CPU的數(shù)量、網(wǎng)絡的帶寬和降低網(wǎng)絡的延遲不再能解決目前數(shù)據(jù)中心的挑戰(zhàn)，我們需要新的創(chuàng)意、新的技術來構建下一代的數(shù)據(jù)中心。

Mellanox 公司的英文全稱是 Mellanox Technologies(中文名：邁絡思)，是一家在全球范圍內為服務器和存儲提供端到端InfiniBand和以太網(wǎng)智能互連解決方案及服務的領軍企業(yè)。Mellanox互連解決方案憑借其低延遲、高帶寬、網(wǎng)絡計算等優(yōu)勢，可在應用之間快速地傳遞數(shù)據(jù)，提升系統(tǒng)性能和提高數(shù)據(jù)安全性，極大地提升了數(shù)據(jù)中心效率。Mellanox的端到端高速互連產(chǎn)品包括：網(wǎng)卡、交換機、線纜、光模塊、軟件和芯片等，用以加速應用的性能、優(yōu)化業(yè)務的投資回報率，覆蓋云服務、超大規(guī)模數(shù)據(jù)中心、高性能計算、人工智能、企業(yè)級數(shù)據(jù)中心、網(wǎng)絡安全、存儲以及金融服務等各個行業(yè)。更多信息請關注：www.mellanox.com。

內容來自：Mellanox
本文地址：http://getprofitprime.com//Site/CN/News/2019/10/14/20191014090810668286.htm 轉載請保留文章出處
關鍵字: 數(shù)據(jù)中心
文章標題:RDMA時代到了

【加入收藏夾】【推薦給好友】

免責聲明：凡本網(wǎng)注明“訊石光通訊咨詢網(wǎng)”的所有作品，版權均屬于光通訊咨詢網(wǎng)，未經(jīng)本網(wǎng)授權不得轉載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權使用作品的，應在授權范圍內使用，反上述聲明者，本網(wǎng)將追究其相關法律責任。
※我們誠邀媒體同行合作！聯(lián)系方式：訊石光通訊咨詢網(wǎng)新聞中心　電話：0755-82960080-168 Right

RDMA時代到了

相關新聞