您的位置: 首頁 > 新聞 > 高新技術(shù) > 新聞詳情

鋪平未來之路:AMD顯卡架構(gòu)轉(zhuǎn)換深度解密

時(shí)間:2010-12-16 13:31:09
  • 來源:驅(qū)動(dòng)之家
  • 作者:batyeah
  • 編輯:ChunTian

2007年,ATI發(fā)布了R600架構(gòu)的Radeon HD 2000系列,也是自己在PC領(lǐng)域首次引入統(tǒng)一著色架構(gòu),而且又一次使用了VLIW5。盡管這是DX10產(chǎn)品,但仍能很好地處理DX9頂點(diǎn)著色。GPGPU通用計(jì)算普及之前,這種架構(gòu)適應(yīng)得很好。

接下來進(jìn)入2008年。顯卡廠商在規(guī)劃產(chǎn)品的時(shí)候一般都要考慮到兩年之后乃至更久的情況,所以Cayman Radeon HD 6900系列的設(shè)計(jì)那時(shí)候就已經(jīng)著手了。當(dāng)時(shí)GPGPU通用計(jì)算才剛剛起步,NVIDIA開始追逐的那個(gè)市場最多價(jià)值幾百萬美元,DX10游戲也還沒有成型,但是AMD預(yù)測認(rèn)為,通用計(jì)算將在兩年后(也就是現(xiàn)在)變得非常重要,DX9也會基本讓路給DX10/11,所以就必須提前重新評估VLIW5設(shè)計(jì)的優(yōu)劣。

果不其然,GPGPU通用計(jì)算已經(jīng)開始大行其道,Windows 7、DX10/11也正在將DX9擠下歷史舞臺。根據(jù)AMD的內(nèi)部數(shù)據(jù),VLIW5架構(gòu)的五個(gè)處理槽中平均只能用到3.4個(gè),也就是在游戲里會有一個(gè)半白白浪費(fèi)了。顯然,DX9下非常理想的VLIW5設(shè)計(jì)已經(jīng)過時(shí),它太寬了,必須縮短流處理器單元(SPU),重新設(shè)計(jì)里邊的流處理器(SP)布局。

AMD的顯卡核心架構(gòu)非常依賴指令級并行運(yùn)算(ILP),也就是將指令放在單獨(dú)一個(gè)線程內(nèi),和其他可以并行的線程沒有任何關(guān)聯(lián)。VLIW5下最理想的情況就是五個(gè)指令能夠在每個(gè)時(shí)鐘周期里、每個(gè)SPU上一起調(diào)度執(zhí)行,但這種概率非常低。按說平均使用3.4個(gè)已經(jīng)不錯(cuò)了,但換算下來還是不足80%,結(jié)果就是從工作負(fù)載種提取ILP非常困難,導(dǎo)致最好、最壞應(yīng)用環(huán)境相差太多。

與之形成鮮明對比的是線程級并行計(jì)算(TLP),那些沒有任何關(guān)聯(lián)的線程也可以同時(shí)執(zhí)行。這正是NVIDIA在高端核心上所依賴的設(shè)計(jì)理念,GF100/GF110都是借助TLP達(dá)到高效率的標(biāo)量架構(gòu)。

最終,AMD意識到VLIW5架構(gòu)已經(jīng)不適合繼續(xù)發(fā)展,必須面向未來準(zhǔn)備一種新的高效率架構(gòu),不但要提高平均使用率(大于3.4個(gè)),還需要適應(yīng)并行計(jì)算負(fù)載,結(jié)果就是轉(zhuǎn)向VLIW4。

VLIW4相比于VLIW5最特殊的地方就是去掉了體積最大、可同時(shí)處理普通整數(shù)/浮點(diǎn)操作和超越操作的第五個(gè)SP t單元,或者說特殊功能單元(SFU)。這就意味著,每個(gè)SPU可以一次性處理的普通整數(shù)/浮點(diǎn)操作數(shù)從五個(gè)減少到四個(gè),同時(shí)還可以將三個(gè)SP合并起來處理一個(gè)超越操作。

友情提示:支持鍵盤左右鍵"←""→"翻頁
0

玩家點(diǎn)評 0人參與,0條評論)

收藏
違法和不良信息舉報(bào)
分享:

熱門評論

全部評論

他們都在說 再看看
3DM自運(yùn)營游戲推薦 更多+