您的位置：首頁 > 新聞 > 高新技術(shù) > 新聞詳情

英偉達(dá)下一代Pascal GPU架構(gòu) 應(yīng)用計算速度快十倍

時間：2015-04-20 15:28:51

來源：未知
作者：liyunfei
編輯：liyunfei

2015年4月15日 — 中國北京 — 相較于當(dāng)前的 Maxwell 處理器，NVIDIA 預(yù)計于明年推出的 Pascal 架構(gòu) GPU 將使深度學(xué)習(xí)應(yīng)用中的計算速度加快十倍。

NVIDIA 聯(lián)合創(chuàng)始人、總裁兼首席執(zhí)行官黃仁勛先生在于硅谷舉辦的 GPU 科技大會開幕主題演講活動上，對四千名與會嘉賓揭露 Pascal 架構(gòu)的細(xì)節(jié)與處理器的最新發(fā)展藍(lán)圖。

他對聽眾們說：「得益于過去三年我們在研發(fā)工作上取得的成果，我們將從這個價值數(shù)十億美元的改良產(chǎn)品中獲益」。

深度學(xué)習(xí)指的是計算機(jī)使用神經(jīng)網(wǎng)絡(luò)自主學(xué)習(xí)的過程，這個趨勢的興起讓 NVIDIA 又進(jìn)一步改進(jìn)了原本在去年 GTC 即公布的 Pascal 架構(gòu)設(shè)計內(nèi)容。

Pascal 架構(gòu) GPU 的三大設(shè)計特色將大幅加快訓(xùn)練速度，精準(zhǔn)地訓(xùn)練更豐富的深度神經(jīng)網(wǎng)絡(luò)，猶如人類大腦皮層的資料結(jié)構(gòu)將成為深度學(xué)習(xí)研究的基礎(chǔ)。

再加上 32GB 的顯存（是NVIDIA 新發(fā)布的旗艦級產(chǎn)品 GeForce GTX TITAN X 的 2.7 倍），Pascal 架構(gòu)可進(jìn)行混合精度的計算任務(wù)。它將配備 3D 堆疊顯存，提升深度學(xué)習(xí)應(yīng)用程序的速度性能多達(dá)5倍；另搭配 NVIDIA 的高速互連技術(shù) NVLink 來連接兩個以上的 GPU，可將深度學(xué)習(xí)的速度提升達(dá)十倍。

在關(guān)鍵深度學(xué)習(xí)的任務(wù)方面，Pascal 架構(gòu)的性能表現(xiàn)優(yōu)于 Maxwell 架構(gòu)

混合精度計算 – 達(dá)到更精準(zhǔn)的結(jié)果

混合精度計算讓采用 Pascal 架構(gòu)的 GPU 能夠在 16 位浮點(diǎn)精度下?lián)碛袃杀队?32 位浮點(diǎn)精度下的速率的計算速度。

更出色的浮點(diǎn)計算性能特別提高了深度學(xué)習(xí)兩大關(guān)鍵活動：分類和卷積的性能，同時又達(dá)到所需的精準(zhǔn)度。

3D 堆疊顯存 – 更快的傳輸速度和優(yōu)秀的省電表現(xiàn)

顯存帶寬限制了數(shù)據(jù)向 GPU 傳輸?shù)乃俣?。采?3D 堆疊顯存將可提高比 Maxwell 架構(gòu)高出三倍的帶寬和近三倍的容量，讓開發(fā)人員能建立更大的神經(jīng)網(wǎng)絡(luò)，大大提升深度學(xué)習(xí)訓(xùn)練中帶寬密集型部分的速度。

Pascal 采用顯存芯片逐個堆疊的技術(shù)，位置接近 GPU 而不是處理器板更往下的地方。如此就能把輸出在顯存與 GPU 間往返的距離從幾英寸減縮到幾毫米，大幅加快傳輸速度和擁有更好的省電表現(xiàn)。

NVLink – 更快的數(shù)據(jù)移動速度

Pascal 架構(gòu)加入 NVLink 技術(shù)將使得 GPU 與 CPU 之間數(shù)據(jù)傳輸?shù)乃俣?，較現(xiàn)有的 PCI-Express 標(biāo)準(zhǔn)加快5到12倍，對于深度學(xué)習(xí)這些需要更高 GPU 間傳遞速度的應(yīng)用程序來說是一大福音。

NVLink 可將系統(tǒng)里的 GPU 數(shù)量增加一倍，以共同用于深度學(xué)習(xí)計算任務(wù)上；還能以新的方式連接 CPU 與 GPU，在服務(wù)器設(shè)計方面提供較 PCI-E 更出色的靈活性和省電表現(xiàn)。