服務器

英特爾數據中心“全家福”助燃上海交通大學“π2.0”超算系統

廣告
廣告

前不久,英特爾推出了一系列以數據為中心的產品組合,包括第二代英特爾至強可擴展處理器、英特爾傲騰數據中心內存和存儲解決方案、軟件以及平臺技術等,以幫助用戶從數據中挖掘更多價值。

筆者得知,上海交通大學“π2.0”超算系統成為中國高校中最早選用第二代英特爾至強可擴展處理器的最大規模高性能計算集群,并且在計算和存儲性能上得到了顯著的提升。那么具體是怎么實現的呢?一起來聽上海交通大學網絡信息中心計算部主任林新華博士,為我們詳細講述高性能計算架構創新改造背后的故事。

瓶頸產生

上海交通大學是我國歷史最悠久、享譽海內外的知名高等學府之一,是教育部直屬并與上海市共建的全國重點大學。經過120多年的不懈努力,上海交通大學已經成為一所“綜合性、研究型、國際化”的國內一流、國際知名大學。

上海交通大學一直致力于超算的建設和投入,一期“π”超算系統于2013年6月進入全球TOP500超算排行榜。雖然是一個部署在大學的超算平臺,但是在當時的上海乃至于整個華東地區,“π”超算都是一個先進的存在。時至今日,此系統一直為全校師生服務,支持重要科研項目,覆蓋包括生命科學技術學院、物理與天文學院、化學與化工學院等多個學院。

而如今,距離π的部署已經過去了5年多的時間,按照IT基礎設施的更新頻率,π已經算是“超期服役”,更何況,聲名遐邇的π超算受到了全校師生的喜愛,隨著使用人數的增加、軟件的深度優化和硬件架構的升級,目前的硬件系統已經無法滿足當前用戶的需求,整體平臺迫切需要進行升級改造。

據林新華博士介紹,上海交通大學與英特爾保持了長期良好的合作關系,2013年“π1.0”高性能計算系統采用英特爾至強E5處理器;2017年合作建立英特爾并行計算中心,采用英特爾架構以及AI技術推廣代碼現代化。2018年再次考慮使用英特爾Cascade Lake處理器進行二期建設,那時Cascade Lake還沒有發布,我們就已經跟英特爾展開了深度的測試和研究。

對癥下藥

在經過全方位的評估之后,上海交通大學“π2.0”超算系統最終采用英特爾全新一代的Cascade Lake金牌處理器,被輔以業界先進的計算網絡Intel Omni Path存儲系統,滿足計算和存儲過程中全線速、無阻塞的通信需求,既可承載臨時計算或生產測試環境下的計算任務,還能應對海量小文件并發的需求。

在溝通中筆者得知,上海交通大學“π2.0”超算系統雙精度浮點數理論性能2.1PFlops,擁有658臺雙路節點和1316顆第二代英特爾至強金牌6248處理器。AI與傳統HPC應用的融合,充分利用第二代英特爾至強可擴展處理器的新特性:英特爾深度學習加速、AVX512指令集、支持英特爾傲騰數據中心級持久內存。

為什么說是英特爾“全家福”全面助燃超算系統升級呢?那是因為除了采用最新的處理器之外,還有網絡和存儲的全面加成。

在高速網絡互連方面,采用了英特爾Omni-Path架構100Gbps,MPI應用平滑升級,不需修改代碼,單交換機芯片支持48端口,單交換機最大支持1152端口,成本更低、擴展性更高。

在存儲方面,上海交通大學又成為首家采用全閃存NVMeLustre存儲系統的高校,搭載英特爾固態盤DC P4610+雙OPA卡+Lustre新特性+分布式存儲技術,實現了開源架構、軟硬一體、全閃存、分布式存儲的完美結合。

據林新華博士介紹,采用英特爾整體解決方案之后,計算及存儲性能顯著提升:在計算性能方面,升級至第二代英特爾至強可擴展處理器后,實際應用(VLPL-S)性能方面,單節點提升達4.5倍,四節點提升達4.7倍;在存儲性能方面,基于英特爾固態盤DC P4610和雙OPA卡,單臺存儲服務器(OSS)IO性能可達15GB/S,相比原有系統提升達5倍。

收益背后

如此強悍的性能,得益于全新一代Cascade Lake處理器的全面升級與優化。事實上,這款被稱為“第二代至強可擴展處理器”的平臺除了具備強大的計算能力之外,在存儲與AI應用層面都進行了不少的優化。

從產品規格來說,全新一代Cascade Lake處理器在旗艦級產品上進一步升級,從原有的鉑金至強8100系列升級到了鉑金9200系列,可以支持最高56個物理核心112個線程,還能夠支持48條PCIe通道、6通道DDR4內存等等諸多特性。最重要的是,Cascade Lake處理器采用了新擴展指令集AVX512_VNNI用于加速深度計算和AI相關負載,官方數據顯示VNNI在AI應用的推理性能上相比上一代產品可獲得數倍提升。

存儲是英特爾部署的另一大產品線,伴隨著全新一代Cascade Lake處理器的發布,英特爾在存儲上也正式宣布了傲騰數據中心級持久內存(OptaneDC persistent memory)。從名字就能夠看出,這款被稱為“內存”的產品具備了內存的形態,但是它的本質上是基于英特爾3DXPoint技術的固態盤,因此在性能上它介乎于內存和傳統SSD之間,但是相比傳統SSD也能夠帶來數倍的性能提升。

不僅如此,全新推出的網絡優化型英特爾至強可擴展處理器,專為網絡應用而設計。基于與通信服務提供商合作,該系列產品旨在提供更大的用戶容量,減少網絡功能虛擬化(NFV)基礎設施的瓶頸。今天,英特爾至強可擴展處理器能夠支持高性能、高效率、可擴展的敏捷型5G就緒網絡。

寫在最后,從超算應用到AI推理,第二代英特爾至強可擴展處理器的提升讓整個IT基礎設施領域受益匪淺,通過多樣化的、多種形態的產品組合,為用戶提供了滿足不同應用場景的選擇,讓用戶充分體會到全新平臺、英特爾“全家福”系列產品在計算、存儲、互聯、管理等領域的全棧優勢。英特爾強大且經過優化的以數據為中心的解決方案可以更加高效地支持從云到端的多種高成長性工作負載,為推動企業轉型和業務創新、加速數字經濟落地提供強勁動力。

我還沒有學會寫個人說明!

披荊斬棘:論百萬級服務器反入侵場景的混沌工程實踐

上一篇

案例診斷:“交易耗時8S”緝兇記

下一篇

你也可能喜歡

英特爾數據中心“全家福”助燃上海交通大學“π2.0”超算系統

長按儲存圖像,分享給朋友

ITPUB 每周精要將以郵件的形式發放至您的郵箱


微信掃一掃

微信掃一掃
排球主场论坛