| 數碼 | 企業(yè) | 汽車(chē) | 家電 | 新零售

助力大規模AI部署 英特爾推出Gaudi2深度學(xué)習加速器

英特爾 鋒林企業(yè)2023-07-12 10:08:52

2023年7月11日,英特爾AI產(chǎn)品戰略暨Gaudi2新品發(fā)布會(huì )在京舉行。會(huì )上,英特爾正式于中國市場(chǎng)推出第二代Gaudi深度學(xué)習加速器——Habana® Gaudi®2。作為英特爾從云到端產(chǎn)品組合的重要組成,Gaudi2致力于以領(lǐng)先的性?xún)r(jià)比優(yōu)勢,加速AI訓練及推理,為中國用戶(hù)提供更高的深度學(xué)習性能和效率,從而成為大規模部署AI的更優(yōu)解。

 

  英特爾于中國市場(chǎng)推出Gaudi2深度學(xué)習加速器

  英特爾執行副總裁兼數據中心與人工智能事業(yè)部總經(jīng)理Sandra Rivera指出,“英特爾致力于通過(guò)為客戶(hù)提供廣泛的硬件選擇,并支持開(kāi)放的軟件環(huán)境,加速人工智能技術(shù)的發(fā)展。憑借包括至強可擴展處理器和Gaudi2深度學(xué)習加速器在內的產(chǎn)品組合,英特爾正在降低人工智能的準入門(mén)檻,并強化客戶(hù)在云端通過(guò)網(wǎng)絡(luò )和智能邊緣部署這一關(guān)鍵業(yè)務(wù)技術(shù)的能力,從而幫助構建中國人工智能的未來(lái)。”

  為深度學(xué)習而生的全新Gaudi2訓練加速器

  該Gaudi2深度學(xué)習加速器暨Gaudi2夾層卡HL-225B,以第一代Gaudi高性能架構為基礎,以多方位性能與能效比提升,加速高性能大語(yǔ)言模型運行。該加速器具備:

  · 24個(gè)可編程Tensor處理器核心(TPCs)

  · 21個(gè)Gbps(RoCEv2)以太網(wǎng)接口

  · 96GB HBM2E內存容量

  · 2.4TB/秒的總內存帶寬

  · 48MB片上SRAM

  · 集成多媒體處理引擎

 

  Habana® Gaudi®2深度學(xué)習加速器

  Gaudi2加速器的出色性能在6月公布的MLCommons® MLPerf®基準測試中得到了充分認證,其在GPT-3模型、計算機視覺(jué)模型ResNet-50(使用8個(gè)加速器)、Unet3D(使用8個(gè)加速器),以及自然語(yǔ)言處理模型BERT(使用8個(gè)和64個(gè)加速器)上均取得了優(yōu)異的訓練結果。與市場(chǎng)上其他面向大規模生成式AI和大語(yǔ)言模型的產(chǎn)品相比,Gaudi2擁有卓越的性能與領(lǐng)先的性?xún)r(jià)比優(yōu)勢,能夠幫助用戶(hù)提升運營(yíng)效率的同時(shí),降低運營(yíng)成本。

  此外,Gaudi2可為大規模的多模態(tài)和語(yǔ)言模型提供出色的推理性能。在最近的Hugging Face評估中,其在大規模推理方面的表現,包括在運行Stable Diffusion(另一個(gè)用于從文本生成圖像的最先進(jìn)生成式AI模型之一)、70億以及1760億參數BLOOMz模型時(shí),在行業(yè)內保持領(lǐng)先。

  滿(mǎn)足大語(yǔ)言和多模態(tài)模型的需求

  Gaudi2深度學(xué)習加速器的架構旨在高效擴展,以滿(mǎn)足大規模語(yǔ)言模型及生成式AI模型的需求。其每張芯片集成了21個(gè)專(zhuān)用于內部互聯(lián)的100Gbps(RoCEv2 RDMA)以太網(wǎng)接口,從而實(shí)現低延遲服務(wù)器內擴展。

  在Stable Diffusion訓練上,Gaudi2展示了從1張卡至64張卡近線(xiàn)性99%的擴展性。此外,MLCommons剛剛公布的MLPerf訓練3.0結果,亦驗證了Gaudi2處理器在1750億參數的GPT-3模型上,從256個(gè)加速器到384個(gè)加速器可實(shí)現令人印象深刻的接近線(xiàn)性的95%擴展效果。

  具備成熟的軟件支持,Gaudi2產(chǎn)品在中國市場(chǎng)正式上市

  伴隨日益增長(cháng)的生成式AI及大語(yǔ)言模型需求,英特爾亦致力于打造領(lǐng)先、成熟的軟件支持,充分釋放Gaudi2深度學(xué)習加速器性能。

  為支持客戶(hù)輕松構建模型,或將當前基于GPU的模型業(yè)務(wù)和系統遷移到基于全新Gaudi2服務(wù)器,并幫助保護軟件開(kāi)發(fā)投入,SynapseAI®軟件套件針對Gaudi平臺深度學(xué)習業(yè)務(wù)進(jìn)行了優(yōu)化,旨在與廣泛的軟件生態(tài)系統一起,幫助簡(jiǎn)化模型的開(kāi)發(fā)和遷移。SynapseAI集成了對TensorFlow和PyTorch框架的支持,并提供眾多流行的計算機視覺(jué)和自然語(yǔ)言參考模型,能夠滿(mǎn)足深度學(xué)習開(kāi)發(fā)者的多樣化需求。

  目前,英特爾正與浪潮信息合作,打造并發(fā)售基于Gaudi2深度學(xué)習加速器的浪潮信息AI服務(wù)器NF5698G7。該服務(wù)器集成了8顆Gaudi2加速卡HL-225B,還包含雙路第四代英特爾至強可擴展處理器。

 

  基于Gaudi2加速器的浪潮NF5698G7服務(wù)器

 攜手中國產(chǎn)業(yè)生態(tài),共啟人工智能新篇

  多年來(lái),借助強大的AI軟硬件基礎,英特爾一直致力于為AI領(lǐng)域的各類(lèi)工作負載提供業(yè)界領(lǐng)先的卓越性能,并通過(guò)開(kāi)放的生態(tài)、豐富多樣的產(chǎn)品選擇不斷降低AI部署的門(mén)檻,并為中國的AI發(fā)展提供堅定支持。

  本次發(fā)布會(huì )上,美團、百度與浪潮信息等生態(tài)伙伴分別分享了其基于英特爾軟硬件產(chǎn)品組合的多樣化智能業(yè)務(wù)進(jìn)展。百度智能云服務(wù)器高級經(jīng)理何永占表示,集成英特爾®AMX加速引擎的第四代英特爾®至強®可擴展處理器為ERNIE-Tiny模型帶來(lái)了多倍的性能優(yōu)化,百度將持續構建領(lǐng)先的AI全棧能力和全面的開(kāi)放生態(tài),并期待與英特爾在未來(lái)的AI領(lǐng)域展開(kāi)更為廣泛、深入的合作。浪潮信息高級產(chǎn)品經(jīng)理王磊強調,NF5698G7是專(zhuān)為面向生成式AI市場(chǎng)創(chuàng )新開(kāi)發(fā)的新一代AI服務(wù)器,支持8顆OAM高速互聯(lián)的Gaudi2加速器,具備高性能、高擴展、高能效和開(kāi)放生態(tài)等優(yōu)點(diǎn),將為AI客戶(hù)提供強大的大模型訓練和推理能力。未來(lái),浪潮信息將繼續攜手英特爾,為行業(yè)打造創(chuàng )新、領(lǐng)先的產(chǎn)品方案。

  此外,多家本土生態(tài)伙伴亦表明了與英特爾在當下及未來(lái)產(chǎn)品合作上的堅定立場(chǎng)與長(cháng)遠展望。新華三集團計算存儲產(chǎn)品線(xiàn)副總裁劉宏程指出,新華三智慧計算秉持內生智能的技術(shù)理念,基于硬件使能、前瞻技術(shù)、綠色低碳等全方位能力,助力AI產(chǎn)業(yè)的高速發(fā)展?;谟⑻貭朑audi2 AI加速器,新華三正與英特爾緊密合作,開(kāi)發(fā)適合大模型訓練和推理的高性能AI服務(wù)器,推動(dòng)智能算力的普惠創(chuàng )新。與此同時(shí),超聚變數字技術(shù)有限公司算力基礎設施領(lǐng)域總裁唐啟明表示,非常榮幸見(jiàn)證英特爾Gaudi2的發(fā)布。作為英特爾的長(cháng)期戰略合作伙伴,超聚變將一如既往地攜手英特爾,共同推出基于Gaudi2的全新產(chǎn)品與解決方案,助力企業(yè)的AI場(chǎng)景成熟商用和規模落地。

  未來(lái),英特爾將持續引領(lǐng)產(chǎn)品技術(shù)發(fā)展,進(jìn)一步加速大規模深度學(xué)習部署,助力中國本地AI市場(chǎng)發(fā)展。

免責聲明:本文轉自其它媒體,不代表本站觀(guān)點(diǎn),相關(guān)圖文如有侵權,請聯(lián)系刪除!

鋒林快報

換一批