顯卡無(wú)疑已經(jīng)是當(dāng)下IT圈子最熱門(mén)的話題,但對(duì)于NVIDIA而言,關(guān)于圖形、視覺(jué)乃至大規(guī)模并行運(yùn)算的征程,已經(jīng)開(kāi)啟了新的起點(diǎn)。NVIDIA在不久前舉行的GTC大會(huì)上連發(fā)三款基于Arm IP打造的處理器,包括全球首款專為T(mén)B級(jí)加速計(jì)算而設(shè)計(jì)的CPU NVIDIA Grace、全新BlueField-3 DPU,以及業(yè)界首款1000TOPS算力的自動(dòng)駕駛汽車SoC等。
“三類芯片,逐年飛躍,一個(gè)架構(gòu)。”NVIDIA數(shù)據(jù)中心路線圖中包括CPU、GPU和DPU這三類芯片,集齊“未來(lái)計(jì)算的三大支柱”,這也標(biāo)志著NVIDIA異構(gòu)計(jì)算布局趨于完善,成為全棧計(jì)算平臺(tái)。
專用AI計(jì)算CPU:NVIDIA GRACE
NVIDIA發(fā)布的首款中央處理器Grace成為本次GTC的焦點(diǎn),其面向超大型AI模型的和高性能計(jì)算。基于Grace的系統(tǒng)與NVIDIA GPU緊密結(jié)合,性能將比目前最先進(jìn)的NVIDIA DGX系統(tǒng)(在x86 CPU上運(yùn)行)高出10倍。
GRACE的重大創(chuàng)新包括:內(nèi)置下一代Arm Neoverse內(nèi)核,單CPU在SPECrate2017_int_base基準(zhǔn)測(cè)試超300分;采用第四代NVIDIA NVLink,從CPU到GPU連接速度超過(guò)900GB/s,達(dá)到相當(dāng)于目前服務(wù)器14倍的帶寬,從CPU到CPU的速度超過(guò)600GB/s;擁有最高的內(nèi)存帶寬,采用的新內(nèi)存LPDDR5x技術(shù),帶寬是LPDDR4的兩倍,能提供更多算力。
數(shù)據(jù)中心處理器DPU:NVIDIA BlueField-3
為了獲得更好的數(shù)據(jù)中心軟件定義網(wǎng)絡(luò)、存儲(chǔ)、網(wǎng)絡(luò)安全加速,NVIDIA還推出了首款為AI加速度BlueField-3 DPU。DPU針對(duì)多用戶、云原生環(huán)境優(yōu)化,提供數(shù)據(jù)中心軟件定義和硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全、管理內(nèi)容。
NVIDIA BlueField-3 DPU包含220億個(gè)晶體管,采用16個(gè)Arm A78 CPU核心、18M IOPs彈性塊存儲(chǔ),加密速度是上一代的4倍,并完全向下兼容BlueField-2。該產(chǎn)品預(yù)計(jì)將于2022年第一季度發(fā)布樣品。
BlueField-3 DPU的重大創(chuàng)新包括:是首款支持第五代PCIe總線并提供數(shù)據(jù)中心時(shí)間同步加速的DPU;BlueField-3能夠卸載相當(dāng)于300個(gè)CPU核的工作負(fù)載,以400Gbps的速率對(duì)網(wǎng)絡(luò)流量進(jìn)行保護(hù)、卸載和加速;通過(guò)全新發(fā)布的NVIDIA DOCA(集數(shù)據(jù)中心于芯片的架構(gòu))軟件開(kāi)發(fā)包為開(kāi)發(fā)者提供一個(gè)完整、開(kāi)放的軟件平臺(tái),開(kāi)發(fā)在BlueField DPU上開(kāi)發(fā)軟件定義和硬件加速的網(wǎng)絡(luò)、存儲(chǔ)、安全和管理等應(yīng)用。
GPU賦能推動(dòng)ARM生態(tài)
NVIDIA Ampere架構(gòu)GPUA100于2020 GTC發(fā)布,今年大會(huì)則主要發(fā)布基于新架構(gòu)GPU的產(chǎn)品,并致力于借助GPU賦能推動(dòng)ARM生態(tài)。
NVIDIA升級(jí)并打造了“便攜式AI數(shù)據(jù)中心”——NVIDIA DGX Station,以及NVIDIA專為密集型AI研發(fā)打造的AI數(shù)據(jù)中心產(chǎn)品——NVIDIA DGX SuperPOD。NVIDIA DGX Station 320G連接4個(gè)NVIDIA A100 GPU并達(dá)8TB/s的帶寬,性價(jià)比獲得很大提升;NVIDIA DGX SuperPOD目前是世界上首臺(tái)原生超級(jí)計(jì)算機(jī),使用全新80GB NVIDIA A100,將其HBM2e 內(nèi)存提升至90TB,實(shí)現(xiàn)2.2EB/s的總帶寬。
NVIDIA發(fā)布了用于訓(xùn)練Transformers的超大語(yǔ)言模型的NVIDIA Megatron Triton推理服務(wù)器。Transformers已幫助開(kāi)發(fā)者在自然語(yǔ)言處理領(lǐng)域取得了突破性進(jìn)展,能夠生成文檔摘要、將電子郵件中的短語(yǔ)補(bǔ)充完整、甚至讓AI根據(jù)用戶的期望自己編寫(xiě)代碼。通過(guò)分布式計(jì)算,原本雙CPU服務(wù)器1分鐘只能響應(yīng)1項(xiàng)查詢,使用Megatron Triton的DGX能在1秒內(nèi)實(shí)現(xiàn)16項(xiàng)查詢。
NVIDIA還發(fā)布了新一代AI自動(dòng)駕駛汽車處理器DRIVE Atlan,算力將達(dá)到1000TOPS,約是上一代Orin處理器的4倍,超過(guò)了大多數(shù)L5無(wú)人駕駛出租車的總計(jì)算能力。采用下一代GPU的體系結(jié)構(gòu)、新型Arm CPU內(nèi)核、新深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)加速器,內(nèi)置為先進(jìn)的網(wǎng)絡(luò)、存儲(chǔ)和安全服務(wù)的BlueField DPU,網(wǎng)絡(luò)速度可達(dá)400Gbps。
此外,NVIDIA還與亞馬遜云科學(xué)(AWS)、Marvell、聯(lián)發(fā)科、富士通等加強(qiáng)了合作,推動(dòng)云服務(wù)、科學(xué)及AI應(yīng)用開(kāi)發(fā)、打造GPU驅(qū)動(dòng)的新型PC,共同致力于擴(kuò)展Arm生態(tài)系統(tǒng)。
目標(biāo)構(gòu)建AI帝國(guó)
NVIDIA基于GPU、CPU、DPU“三項(xiàng)之力”的硬件基礎(chǔ),還在持續(xù)打造介于硬件和軟件之間的底層技術(shù)、計(jì)算機(jī)工具乃至實(shí)用的應(yīng)用框架。
針對(duì)專業(yè)領(lǐng)域的云原生平臺(tái)NVIDIA Omniverse平臺(tái)能夠在虛擬世界中匯聚全球各地的工程師、科學(xué)家,在多個(gè)GPU的共同協(xié)助下實(shí)現(xiàn)高物理精度,并充分運(yùn)用RTX實(shí)時(shí)光線追蹤、DLSS技術(shù),利用NVIDIA MDL模擬材料、NVIDIA PhysX模擬物理,NVIDIA AI完成人工智能推算的線上平臺(tái)。擁有了更強(qiáng)的普適性,已適用于建筑、娛樂(lè)、游戲、廣告等行業(yè)。
先進(jìn)的對(duì)話式AI平臺(tái)NVIDIA Jarvis可達(dá)到90%的識(shí)別精度,并支持5種語(yǔ)言:英語(yǔ)、日語(yǔ)、西班牙語(yǔ)、德語(yǔ)、法語(yǔ)和俄語(yǔ),未來(lái)將會(huì)有更多語(yǔ)言加入其中,這使得國(guó)際會(huì)議將會(huì)變得更輕松;可糾正目光接觸的會(huì)議軟件NVIDIA Maxine會(huì)自動(dòng)糾正視頻會(huì)議中與會(huì)人的注視位置;NVIDIA自動(dòng)駕駛汽車計(jì)算系統(tǒng)級(jí)芯片NVIDIA DRIVE Orin將與2022年投產(chǎn),可處理集群、信息娛樂(lè)、乘客交互AI及非常重要的信息視圖或感知世界模型,將實(shí)際感知構(gòu)建成一個(gè)3D環(huán)繞模型。
NVIDIA已經(jīng)創(chuàng)建了Tensor Core GPU、NVLINK、DGX、cuDNN、RAPIDS、NCCL、GPU Dirext、DOCA等眾多技術(shù),所有的這些底層技術(shù),統(tǒng)稱為NVIDIA AI。NVIDIA AI已集成到所有業(yè)內(nèi)流行的工具和工作流程中,并且可在搭載NVIDIA GPU的任何系統(tǒng)上運(yùn)行,包括PC、筆記本電腦、工作站、超級(jí)計(jì)算機(jī)、云平臺(tái)等?,F(xiàn)在缺少的是5G技術(shù)的連接,日常所使用的消費(fèi)級(jí)5G技術(shù)只是錦上添花,而未來(lái)專用5G技術(shù)將為AI技術(shù)帶來(lái)革命性的變化。
注:作者為賽迪顧問(wèn)集成電路產(chǎn)業(yè)研究中心高級(jí)分析師
- QQ:61149512