央視網|中國網絡電視臺|網站地圖
客服設為首頁
登錄

中國網絡電視臺 > 新聞臺 > 新聞中心 >

頂級顯卡HD7970:ALU團簇改為CU結構

發佈時間:2012年04月25日 03:21 | 進入復興論壇 | 來源:泡泡網 | 手機看視頻


評分
意見反饋 意見反饋 頂 踩 收藏 收藏
channelId 1 1 1
壟!-- /8962/web_cntv/dicengye_huazhonghua01 -->

更多 今日話題

壟!-- /8962/web_cntv/dicengye_huazhonghua02 -->

更多 24小時排行榜

壟!-- /8962/web_cntv/dicengye_huazhonghua03 -->

  對照以往的産品,最新發佈的頂級顯卡HD7970 在Tahiti構架上最大的改進是來自ALU集群部分。與傳統AMD構架的VLIW結構ALU團簇不同,頂級顯卡HD7970的Tahiti構架的ALU集群撤消了來自超長字節指令的限定,所有ALU全部以SIMD的形式來完成吞吐,不再需要打包和解包的過程。

  在頂級顯卡HD7970的Tahiti構架中,ALU團簇的名稱從VLIW SIMD變成了Compute Unit。這一名稱的改變不僅標誌著功能及用途的變遷,更暗示了內部結構的方向性變化。

  據筆者了解,頂級顯卡HD7970 Tahiti擁有32個CU單元,CU內部包含4組SIMD CORE,每組SIMD CORE由16個標準Vector ALU構成,所以頂級顯卡HD7970 Tahiti的一個CU單元擁有64個Vector ALU,32個CU單元合計擁有2048個Vector ALU。

頂級顯卡HD7970 Tahiti構架CU結構細節


  除了負責浮點吞吐的SIMD CORE之外,頂級顯卡HD7970 Tahiti構架的每個CU單元還擁有在一個Scalar Unit,Scalar單元中包含Int ALU單元,可以用來處理整數指令以及特殊函數。另外,對線程效率至關重要的原子操作(Atomic)也在該單元中執行。

  運算單元之外,頂級顯卡HD7970 Tahiti構架的每個CU還綁定了由Branch和Scheduler構成的二級線程控制機制,以及一個完整的Texture Arroy,Texture Arroy的作用與傳統AMD構架中的TMU基本相同,包含了完整的Texture Fetch Load/Store Unit以及Texture Filter Unit。

Intel Larrabee構架


  由此不難看出,頂級顯卡HD7970 Tahiti構架CU單元的結構在邏輯層面上已經與Fermi構架的SM單元和Larrabee的Vector Unit存在極大的相似性。三者均由浮點吞吐部分(頂級顯卡HD7970 Tahiti的Vector ALU團簇,Fermi的SP單元集群,Larrabee的Vector集群),整數、特殊函數及原子操作部分(頂級顯卡HD7970 Tahiti的Scalar Unit,Fermi的SFU,Larrabee的Scalar pipeline)以及二級線程控制機制(三方的Scheduler等)。除此之外,頂級顯卡HD7970所擁有的CU還與Fermi的SM一樣擁有完整的Texture Arroy,甚至每一個運算單元(頂級顯卡HD7970 Tahiti的Vector ALU,NVIDIA的SP單元)都擁有完全相同的4K寄存器。

頂級顯卡HD7970 CU進行wavefront吞吐示意


  頂級顯卡HD7970內的一個CU就是一個獨立的處理單元,能夠面對一個標準的指令集群或者説線程塊,也就是AMD的wavefront。頂級顯卡HD7970 Tahiti的CU能夠在一個週期內處理一個64線程的wavefront,這與Fermi一個週期處理一個32線程的warp是相同的。

頂級顯卡HD7970 Tahiti支持WinZip最新版帶來的Open CL加速


  頂級顯卡HD7970採用的更新之後的CU單元在計算能力和效率方面有了長足的進步,不僅令頂級顯卡HD7970的Compute Shader處理能力大幅提升,進而提升了GPU在DirectX 11環境下的圖形性能,而且讓頂級顯卡HD7970在通用計算領域也獲得了更加廣闊的前景和更多樣化的發展可能。

熱詞:

  • 頂級顯卡
  • CU
  • ALU團
  • Tahiti
  • TMU
  • Shader
  • SIMD
  • 線程
  • Vector
  • Texture
  • 搜索更多頂級顯卡 CU 的新聞