您的位置: 首頁 > 新聞 > 高新技術(shù) > 新聞詳情

英偉達(dá)下一代Pascal GPU架構(gòu) 應(yīng)用計算速度快十倍

時間:2015-04-20 15:28:51
  • 來源:未知
  • 作者:liyunfei
  • 編輯:liyunfei

2015年4月15日 — 中國北京 — 相較于當(dāng)前的 Maxwell 處理器,NVIDIA 預(yù)計于明年推出的 Pascal 架構(gòu) GPU 將使深度學(xué)習(xí)應(yīng)用中的計算速度加快十倍。

NVIDIA 聯(lián)合創(chuàng)始人、總裁兼首席執(zhí)行官黃仁勛先生在于硅谷舉辦的 GPU 科技大會開幕主題演講活動上,對四千名與會嘉賓揭露 Pascal 架構(gòu)的細(xì)節(jié)與處理器的最新發(fā)展藍(lán)圖。

他對聽眾們說:「得益于過去三年我們在研發(fā)工作上取得的成果,我們將從這個價值數(shù)十億美元的改良產(chǎn)品中獲益」。

深度學(xué)習(xí)指的是計算機(jī)使用神經(jīng)網(wǎng)絡(luò)自主學(xué)習(xí)的過程,這個趨勢的興起讓 NVIDIA 又進(jìn)一步改進(jìn)了原本在去年 GTC 即公布的 Pascal 架構(gòu)設(shè)計內(nèi)容。

Pascal 架構(gòu) GPU 的三大設(shè)計特色將大幅加快訓(xùn)練速度,精準(zhǔn)地訓(xùn)練更豐富的深度神經(jīng)網(wǎng)絡(luò),猶如人類大腦皮層的資料結(jié)構(gòu)將成為深度學(xué)習(xí)研究的基礎(chǔ)。

再加上 32GB 的顯存(是NVIDIA 新發(fā)布的旗艦級產(chǎn)品 GeForce GTX TITAN X 的 2.7 倍),Pascal 架構(gòu)可進(jìn)行混合精度的計算任務(wù)。它將配備 3D 堆疊顯存,提升深度學(xué)習(xí)應(yīng)用程序的速度性能多達(dá)5倍;另搭配 NVIDIA 的高速互連技術(shù) NVLink 來連接兩個以上的 GPU,可將深度學(xué)習(xí)的速度提升達(dá)十倍。

在關(guān)鍵深度學(xué)習(xí)的任務(wù)方面,Pascal 架構(gòu)的性能表現(xiàn)優(yōu)于 Maxwell 架構(gòu)

混合精度計算 – 達(dá)到更精準(zhǔn)的結(jié)果

混合精度計算讓采用 Pascal 架構(gòu)的 GPU 能夠在 16 位浮點(diǎn)精度下?lián)碛袃杀队?32 位浮點(diǎn)精度下的速率的計算速度。

更出色的浮點(diǎn)計算性能特別提高了深度學(xué)習(xí)兩大關(guān)鍵活動:分類和卷積的性能,同時又達(dá)到所需的精準(zhǔn)度。

3D 堆疊顯存 – 更快的傳輸速度和優(yōu)秀的省電表現(xiàn)

顯存帶寬限制了數(shù)據(jù)向 GPU 傳輸?shù)乃俣?。采?3D 堆疊顯存將可提高比 Maxwell 架構(gòu)高出三倍的帶寬和近三倍的容量,讓開發(fā)人員能建立更大的神經(jīng)網(wǎng)絡(luò),大大提升深度學(xué)習(xí)訓(xùn)練中帶寬密集型部分的速度。

Pascal 采用顯存芯片逐個堆疊的技術(shù),位置接近 GPU 而不是處理器板更往下的地方。如此就能把輸出在顯存與 GPU 間往返的距離從幾英寸減縮到幾毫米,大幅加快傳輸速度和擁有更好的省電表現(xiàn)。

NVLink – 更快的數(shù)據(jù)移動速度

Pascal 架構(gòu)加入 NVLink 技術(shù)將使得 GPU 與 CPU 之間數(shù)據(jù)傳輸?shù)乃俣?,較現(xiàn)有的 PCI-Express 標(biāo)準(zhǔn)加快5到12倍,對于深度學(xué)習(xí)這些需要更高 GPU 間傳遞速度的應(yīng)用程序來說是一大福音。

NVLink 可將系統(tǒng)里的 GPU 數(shù)量增加一倍,以共同用于深度學(xué)習(xí)計算任務(wù)上;還能以新的方式連接 CPU 與 GPU,在服務(wù)器設(shè)計方面提供較 PCI-E 更出色的靈活性和省電表現(xiàn)。

0

玩家點(diǎn)評 0人參與,0條評論)

收藏
違法和不良信息舉報
分享:

熱門評論

全部評論

他們都在說 再看看
3DM自運(yùn)營游戲推薦 更多+