三上亚洲一区二区,亚洲国产成人高清精品,三级资源在线,久久九九久精品国产免费直播

NVIDIA的Ampere SM詳細說明以及RTX 3080限于10GB內存的原因

VR/AR
2020
09/06
19:15
新浪VR
分享
評論

來源:新浪VR

在Reddit問答中,NVIDIA回答了游戲玩家和新聞界最棘手的問題,包括SM結構,內存緩沖區,RTX IO等。第一個問題是相對于RTX 3080基本上沒有變化的內存緩沖區到它的前身。

NVIDIA的賈斯汀·沃克(Justin Walker)在回答該問題時解釋說,根據該公司的分析,10GB足以以4K超高速度運行所有現有和即將推出的游戲,而不會遇到任何內存瓶頸。此外,他還透露,所有最新的AAA游戲,例如《古墓麗影》,《地鐵出埃及記》,《奧德賽》,《無主之地3》,在RTX 3080(4K)上只有4-6GB的內存使用情況下都能很好地運行。最后,沃克承認,擁有更多的內存總是更好,但是將其增加到10GB以上將使3080不必要地變得更高。

[Justin Walker] 我們一直在分析最新游戲的內存需求,并定期與游戲開發者進行審查,以了解他們對當前和即將推出的游戲的內存需求。3080的目標是以最高可能的價格最大化所有設置,以高達4k的分辨率提供出色的性能。

為此,您需要一個功能強大的GPU,具有高速內存和足夠的內存以滿足游戲需求。舉幾個例子-如果您看《古墓麗影》,《刺客信條:奧德賽》,《地鐵出埃及記》,《德軍總部》,《戰爭機器5》,《無主之地3》和《荒野大鏢客2》,它們在3080上以4k的最大設置運行(包括任何適用的高價) res texture packs)和RTX On(如果游戲支持),您將獲得60-100fps的范圍,并使用4GB至6GB的任何內存。

額外的內存總是很不錯,但是會增加顯卡的價格,因此我們需要找到合適的平衡點。

安培流多處理器(SM)

每個SM有兩個數據路徑或流水線。四個分區中的每個分區都由兩個ALU集群組成:一組16個FP32內核以及一組32個FP32和INT16。作為這種新分區的結果,每個Ampere SM分區可以每個時鐘執行32條FP32指令,或者每個周期執行16條FP32和16條INT32指令。實際上,您要用整數性能來換取兩倍的浮點功能。幸運的是,由于大多數圖形工作負載都是FP32,因此應該可以發揮NVIDIA的優勢。

總體而言,所有四個SM分區組合在一起可以每個時鐘執行128個FP32操作或每個時鐘執行64個FP32和64個INT32操作。

感謝Andreas Schilling的樣機

與Turing SM相比,Ampere 30系列SM的主要設計目標之一是實現FP32操作的兩倍吞吐量。為了實現此目標,Ampere SM包括針對FP32和INT32操作的新數據路徑設計。每個分區中的一個數據路徑由16個FP32 CUDA內核組成,每個時鐘能夠執行16個FP32操作。另一個數據路徑包括16個FP32 CUDA內核和16個INT32內核。作為這種新設計的結果,每個Ampere SM分區每個時鐘能夠執行32個FP32操作,或者每個時鐘能夠執行16個FP32和16 INT32操作。所有四個SM分區組合在一起,每個時鐘可執行128 FP32操作,是Turing SM FP32速率的兩倍,或者每個時鐘執行64 FP32和64 INT32操作。

要使數學吞吐量增加一倍,就需要將支持它的數據路徑增加一倍,這就是為什么Ampere SM還將SM的共享內存和L1緩存性能提高一倍的原因。(每個Ampere SM為128字節/時鐘,而在Turing中為64字節/時鐘)。GeForce RTX 3080的總L1帶寬為219 GB /秒,而GeForce RTX 2080 Super則為116 GB /秒。

GPC是主要的高級硬件模塊,所有關鍵圖形處理單元都位于GPC內部。每個GPC都有一個專用的光柵引擎,現在還包括兩個ROP分區(每個分區包含八個ROP單元),這是NVIDIA Ampere Architecture GA10x GPU的新功能。有關NVIDIA Ampere架構的更多詳細信息,請參見NVIDIA的Ampere架構白皮書,該白皮書將在未來幾天內發布。

NVIDIA的Tony Tamasi

為了允許使用兩個數據路徑和2倍的FP32性能,L1緩存帶寬(和相關的共享內存)也必須加倍:每個Ampere SM 128字節/時鐘,而Turing中64字節/時鐘。RTX 3080的L1總帶寬為219 GB /秒,而RTX 2080 Super的總L1帶寬為116 GB /秒。

柵格后端也被拋光。現在,每個GPC都有一個帶有兩個ROP分區的柵格引擎,每個分區打包八個ROP。這意味著您有16個ROP,而不是每個32位內存控制器8個。這導致RTX 3080的總ROP計數為160,而3090的總ROP計數為192。

THE END
廣告、內容合作請點擊這里 尋求合作
VR
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

高通公司今天宣布了其第二代Snapdragon 8cx SoC,旨在與低功耗(15W)PC市場中的現代x86 CPU競爭。到目前為止,基于ARM的設備未能在PC領域建立立足之地,這在很大程度上是由于性能低下,而性能低下本身就...
VR
AMD的Ryzen 7 3800X在亞馬遜上已經跌至339美元,接近3700X的289美元售價。3800X的最初發行價為399美元,目前大多數零售商將其售價在364美元至388美元之間。
VR
Crysis Remastered將于兩周后上市,Epic Games Store在其官方頁面上詳細說明了必要的系統要求,具體如下:
VR
NV公布了一段《毀滅戰士:永恒》的實機演示,該演示通過RTX 3080顯卡運行,分辨率為4K,特效全開。
VR
按照微軟的說法,未來Windows上市要摒棄動態磁貼的,不過現在有知名設計師給他們上了一課。
VR

相關推薦

1
3
主站蜘蛛池模板: 香港 | 贵定县| 上高县| 政和县| 扶绥县| 四会市| 广丰县| 南皮县| 呼玛县| 新巴尔虎左旗| 杭锦旗| 南城县| 玛纳斯县| 东兴市| 平阳县| 成都市| 乾安县| 高尔夫| 南投市| 祁阳县| 鄂托克旗| 萨嘎县| 永济市| 潜江市| 革吉县| 渭南市| 喀喇| 杨浦区| 延津县| 祥云县| 临猗县| 凤城市| 车致| 海门市| 阜阳市| 奉贤区| 玛纳斯县| 遵义县| 平阳县| 靖州| 内黄县|