Re: [情報] 4090太強 12900K/5800X3D都成瓶頸

作者: oopFoo (3d)   2022-10-13 17:41:45
※ 引述《oppoR20 (發情豹紋)》之銘言:
: 已經不只一家評測指出這個問題了
: https://bit.ly/3MnaQNi
: TechSpot:5800X3D
: 1080p/1440p下會有CPU瓶頸
: https://i.imgur.com/ZPHXSHw.png
: Techpowerup/Techspot兩家測試都很明顯 4k之外都被cpu瓶頸了
: 尤其TPU用更弱的5800X讓4090效能無法發揮完全
: https://bit.ly/3yU7Anl
: PCMAG:預設功耗下會讓12900K成為瓶頸
: https://bit.ly/3rNegPU
: PcWorld:快到4K以下幾乎都會造成瓶頸
https://www.chiphell.com/thread-2450201-1-1.html
https://i.imgur.com/xE4FJkD.png
其實不是CPU跟不上,是4090裡面的Front End(FE)跟不上。
了解為什麼老黃不願意改進FE,現在臭打AI更重要,而且Mesh Shader如果普及會減輕FE的壓力。
但能把缺點講成優點,老黃的宣傳部門實在厲害。
作者: meicon5566 (妹妹文專家妹控56)   2022-10-13 17:44:00
結果又是老黃的鍋
作者: meicon5566 (妹妹文專家妹控56)   2022-10-13 17:44:00
結果又是老黃的鍋
作者: sigma9988 (留痕)   2022-10-13 17:51:00
坐等50卡
作者: sigma9988 (留痕)   2022-10-13 17:51:00
坐等50卡
作者: ISAF   2022-10-13 17:53:00
風向又變了 大人
作者: ikarifaye (殺人放火的正義使者)   2022-10-13 17:53:00
什麼鍋 這是刀法
作者: ISAF   2022-10-13 17:53:00
風向又變了 大人
作者: ikarifaye (殺人放火的正義使者)   2022-10-13 17:53:00
什麼鍋 這是刀法
作者: joe199277 (~卡摩君~)   2022-10-13 17:55:00
老黃的刀法...真的好強....
作者: joe199277 (~卡摩君~)   2022-10-13 17:55:00
老黃的刀法...真的好強....
作者: Riya520 (GO!!!!!!)   2022-10-13 17:56:00
皮衣刀客正盯著你
作者: Riya520 (GO!!!!!!)   2022-10-13 17:56:00
皮衣刀客正盯著你
作者: dylantu ( ′・ω・‵)   2022-10-13 18:11:00
老黃沒有缺點 消費者才有
作者: dylantu ( ′・ω・‵)   2022-10-13 18:11:00
老黃沒有缺點 消費者才有
作者: LastAttack (與我無關~~)   2022-10-13 18:14:00
神前刀工,規格冗餘是為了4090ti留後路,架構冗餘是為了50系列留後路
作者: GermanGerm (菌哥)   2022-10-13 18:17:00
有人可以幫硬體麻瓜解釋一下FE是什麼以及為什麼造成瓶頸嗎QAQ
作者: LastAttack (與我無關~~)   2022-10-13 18:14:00
神前刀工,規格冗餘是為了4090ti留後路,架構冗餘是為了50系列留後路
作者: GermanGerm (菌哥)   2022-10-13 18:17:00
有人可以幫硬體麻瓜解釋一下FE是什麼以及為什麼造成瓶頸嗎QAQ
作者: tactics2100 (Ose)   2022-10-13 18:30:00
應該改成 主機卡插顯示板了 貴成這樣不操個十年說不過去
作者: tactics2100 (Ose)   2022-10-13 18:30:00
應該改成 主機卡插顯示板了 貴成這樣不操個十年說不過去
作者: oopFoo (3d)   2022-10-13 18:31:00
fe是前端。現代的gpu雖然vertex/pixel shader是共用的,但前面還有一個專門處理三角形的前端,這個triangles/s就是
作者: tactics2100 (Ose)   2022-10-13 18:32:00
既然強成這樣 那就不要焊死 做成像cpu一樣可以換晶片
作者: tactics2100 (Ose)   2022-10-13 18:32:00
既然強成這樣 那就不要焊死 做成像cpu一樣可以換晶片
作者: oopFoo (3d)   2022-10-13 18:34:00
處理能力。看不見的三角形就在這拋棄,點(vertex)也在這算
作者: oopFoo (3d)   2022-10-13 18:34:00
處理能力。看不見的三角形就在這拋棄,點(vertex)也在這算
作者: tactics2100 (Ose)   2022-10-13 18:34:00
就算效能會降一些 應該還是卡cpu瓶頸
作者: tactics2100 (Ose)   2022-10-13 18:34:00
就算效能會降一些 應該還是卡cpu瓶頸
作者: friedpig (烤焦棉花糖)   2022-10-13 18:36:00
Ada本來傳言就是 ampere 台GG版 靠GG製程規模拉大很多
作者: friedpig (烤焦棉花糖)   2022-10-13 18:36:00
Ada本來傳言就是 ampere 台GG版 靠GG製程規模拉大很多
作者: oopFoo (3d)   2022-10-13 18:36:00
Mesh Shader可以一次處理一堆三角形,可以降低fe的壓力,
作者: oopFoo (3d)   2022-10-13 18:36:00
Mesh Shader可以一次處理一堆三角形,可以降低fe的壓力,
作者: friedpig (烤焦棉花糖)   2022-10-13 18:37:00
傳統性能部分看起來改變不大 暴力+大而已 其他進步都在
作者: friedpig (烤焦棉花糖)   2022-10-13 18:37:00
傳統性能部分看起來改變不大 暴力+大而已 其他進步都在
作者: oopFoo (3d)   2022-10-13 18:37:00
但現在用Mesh Shader的遊戲還很少。
作者: oopFoo (3d)   2022-10-13 18:37:00
但現在用Mesh Shader的遊戲還很少。
作者: MoneyBlue (愛死娘子咪啦!!)   2022-10-13 18:51:00
看來是遊戲程式設計跟不上老黃
作者: MoneyBlue (愛死娘子咪啦!!)   2022-10-13 18:51:00
看來是遊戲程式設計跟不上老黃
作者: a000000000 (九個零喔)   2022-10-13 18:55:00
幹尼老黃
作者: aegis43210 (宇宙)   2022-10-13 18:58:00
主要的改善在即時光追,GPC的主要變動是L2變大
作者: a000000000 (九個零喔)   2022-10-13 18:55:00
幹尼老黃
作者: aegis43210 (宇宙)   2022-10-13 18:58:00
主要的改善在即時光追,GPC的主要變動是L2變大
作者: friedpig (烤焦棉花糖)   2022-10-13 18:59:00
看下一代狀況吧 下一代還有MCM 整體應該會改更大不過這代用GG已經不錯了 可以戰蠻久又不熱
作者: friedpig (烤焦棉花糖)   2022-10-13 18:59:00
看下一代狀況吧 下一代還有MCM 整體應該會改更大不過這代用GG已經不錯了 可以戰蠻久又不熱
作者: aegis43210 (宇宙)   2022-10-13 19:02:00
所以效能爆增幾乎都是GG的貢獻
作者: aegis43210 (宇宙)   2022-10-13 19:02:00
所以效能爆增幾乎都是GG的貢獻
作者: hong414 (allen0983)   2022-10-13 19:02:00
遊戲廠的問題 不關我們老黃的事 配合nv是他們的責任
作者: hong414 (allen0983)   2022-10-13 19:02:00
遊戲廠的問題 不關我們老黃的事 配合nv是他們的責任
作者: nmkl (超級地球)   2022-10-13 19:04:00
看來等蘇媽的了
作者: nmkl (超級地球)   2022-10-13 19:04:00
看來等蘇媽的了
作者: as6633208 (okokokiknow)   2022-10-13 19:12:00
沒邏輯,各大測試結果很明顯就是cpu瓶頸的特徵。按你說數據會「塞」在gpu前端,不就代表gpu根本還沒完成圖像運算就請求下一個運算數據?這樣的話是不是只要跑個一兩小時,前端就會卡一卡車的數據,然後就開始變慢了?你確定?前端問題應該是gpu瓶頸吧?你當那些測試的連gpu瓶頸跟cpu瓶頸都分不出來嗎?找個中國論壇不知到什麼咖的鄉民的廢文,就想推翻cpu瓶頸測試結果,我也是笑,資料嚴謹度比維基百科還廢
作者: as6633208 (okokokiknow)   2022-10-13 19:12:00
沒邏輯,各大測試結果很明顯就是cpu瓶頸的特徵。按你說數據會「塞」在gpu前端,不就代表gpu根本還沒完成圖像運算就請求下一個運算數據?這樣的話是不是只要跑個一兩小時,前端就會卡一卡車的數據,然後就開始變慢了?你確定?前端問題應該是gpu瓶頸吧?你當那些測試的連gpu瓶頸跟cpu瓶頸都分不出來嗎?找個中國論壇不知到什麼咖的鄉民的廢文,就想推翻cpu瓶頸測試結果,我也是笑,資料嚴謹度比維基百科還廢
作者: oopFoo (3d)   2022-10-13 19:42:00
我開始寫3d程式是比老黃的tnt還早。從triangle setup開始T&L,geometry/hull stages,compute, mesh shader,幾乎通通都經歷過。從cpu做culling,變成coarse culling,現在再變成mesh shader來culling。Mesh Shader 其實跟ps2的vpu與ps3的spu很像。硬體,軟體的變化,算是都跟上了。你要說我比那些只會測試的人不懂?
作者: oopFoo (3d)   2022-10-13 19:42:00
我開始寫3d程式是比老黃的tnt還早。從triangle setup開始T&L,geometry/hull stages,compute, mesh shader,幾乎通通都經歷過。從cpu做culling,變成coarse culling,現在再變成mesh shader來culling。Mesh Shader 其實跟ps2的vpu與ps3的spu很像。硬體,軟體的變化,算是都跟上了。你要說我比那些只會測試的人不懂?
作者: keyman2 (edge)   2022-10-13 19:47:00
看不懂但是好厲害的樣子
作者: keyman2 (edge)   2022-10-13 19:47:00
看不懂但是好厲害的樣子
作者: oopFoo (3d)   2022-10-13 19:50:00
ada的triangles/s的rate都出來了,瓶頸在那已經很清楚了
作者: oopFoo (3d)   2022-10-13 19:50:00
ada的triangles/s的rate都出來了,瓶頸在那已經很清楚了
作者: jimmyyang207 (書瑋吉米)   2022-10-13 19:52:00
那懂哥可以幫我們科普一下為何有些測試看起來跟CPU的性能有直接關係呢?感恩
作者: jimmyyang207 (書瑋吉米)   2022-10-13 19:52:00
那懂哥可以幫我們科普一下為何有些測試看起來跟CPU的性能有直接關係呢?感恩
作者: ddrbox (練網球)   2022-10-13 19:53:00
若是DL/ML用途,是不是FE的壓力就沒這麼大?
作者: ddrbox (練網球)   2022-10-13 19:53:00
若是DL/ML用途,是不是FE的壓力就沒這麼大?
作者: boren (boren)   2022-10-13 19:56:00
我也不明白,所以是只要畫面的三角形太多GPU就跑不滿?
作者: boren (boren)   2022-10-13 19:56:00
我也不明白,所以是只要畫面的三角形太多GPU就跑不滿?
作者: a85139138 (Carlos)   2022-10-13 20:01:00
原來有行家啊也想請教一下前端的triangles/s造成的瓶頸,CPU是怎麼cover的
作者: a85139138 (Carlos)   2022-10-13 20:01:00
原來有行家啊也想請教一下前端的triangles/s造成的瓶頸,CPU是怎麼cover的
作者: a45351 (小便)   2022-10-13 20:05:00
所以是cpu在強也沒用嗎
作者: a45351 (小便)   2022-10-13 20:05:00
所以是cpu在強也沒用嗎
作者: oopFoo (3d)   2022-10-13 20:06:00
dl/ml用不到這個fe。對,太多三角形就shaders在等。現在的triangles很多都是gpu自己在產生的,cpu只是下指令
作者: oopFoo (3d)   2022-10-13 20:06:00
dl/ml用不到這個fe。對,太多三角形就shaders在等。現在的triangles很多都是gpu自己在產生的,cpu只是下指令
作者: aimlin ( )   2022-10-13 20:08:00
硬體不是nv的問題 是消費者的問題
作者: aimlin ( )   2022-10-13 20:08:00
硬體不是nv的問題 是消費者的問題
作者: oopFoo (3d)   2022-10-13 20:08:00
而已,很多傳統cpu在處理,能轉到gpu處理的都轉過去。cpu在這能幫助的很有限,基本上現在3d繪圖程式的優化都是如何讓gpu能全速前進,cpu盡量不要去打擾。
作者: Nonegrame (程式寫得好,好人做到老)   2022-10-13 20:10:00
可以開始等5090了
作者: Nonegrame (程式寫得好,好人做到老)   2022-10-13 20:10:00
可以開始等5090了
作者: twinkleAshed (香草奶昔先生)   2022-10-13 20:13:00
Ada是不是架構沒有跟上整個硬體規模才會卡住?如果簡而言之的話?
作者: ileva3324 (yutuop)   2022-10-13 20:14:00
等50+1
作者: twinkleAshed (香草奶昔先生)   2022-10-13 20:13:00
Ada是不是架構沒有跟上整個硬體規模才會卡住?如果簡而言之的話?
作者: ileva3324 (yutuop)   2022-10-13 20:14:00
等50+1
作者: LiNcUtT (典)   2022-10-13 20:19:00
故意留一手啦,不然50系要出啥XD反正牛肉端一半就打死競品了,沒必要一次全上完吧
作者: LiNcUtT (典)   2022-10-13 20:19:00
故意留一手啦,不然50系要出啥XD反正牛肉端一半就打死競品了,沒必要一次全上完吧
作者: landy0910 (lolicom)   2022-10-13 20:22:00
看不懂(ry
作者: Supasizeit (更大更快更有力)   2022-10-13 20:23:00
不然你要買AMD
作者: ddrbox (練網球)   2022-10-13 20:23:00
了解,換言之,4090的目標客群是專業市場,遊戲只是附加的
作者: ddrbox (練網球)   2022-10-13 20:23:00
了解,換言之,4090的目標客群是專業市場,遊戲只是附加的
作者: Bencrie   2022-10-13 20:27:00
理想狀況就是送很少的資料能畫很複雜的圖
作者: Bencrie   2022-10-13 20:27:00
理想狀況就是送很少的資料能畫很複雜的圖
作者: BraviaX95j   2022-10-13 20:28:00
我就問front End是什麼?
作者: BraviaX95j   2022-10-13 20:28:00
我就問front End是什麼?
作者: huhu12301231 (勝痕)   2022-10-13 20:32:00
既然你懂這麼多幹嘛要貼對岸文 寫一篇提升一下板上水準呀
作者: huhu12301231 (勝痕)   2022-10-13 20:32:00
既然你懂這麼多幹嘛要貼對岸文 寫一篇提升一下板上水準呀
作者: vig077   2022-10-13 20:38:00
昨天還在吹==
作者: vig077   2022-10-13 20:38:00
昨天還在吹==
作者: smallreader (小讀者)   2022-10-13 20:38:00
推專業解釋 幹你老黃
作者: smallreader (小讀者)   2022-10-13 20:38:00
推專業解釋 幹你老黃
作者: commandoEX (卡曼都)   2022-10-13 20:40:00
或許也可以說是4090的目標已經不是fhd這些解析度不是嗎?
作者: commandoEX (卡曼都)   2022-10-13 20:40:00
或許也可以說是4090的目標已經不是fhd這些解析度不是嗎?
作者: intela03252 (intela03252)   2022-10-13 20:41:00
大概就是要你積極啟用dlss那些東西吧3080ti dlss開起來也不太容易感覺出畫質減損了2077不開dlss真的很難衝高幀數
作者: intela03252 (intela03252)   2022-10-13 20:41:00
大概就是要你積極啟用dlss那些東西吧3080ti dlss開起來也不太容易感覺出畫質減損了2077不開dlss真的很難衝高幀數
作者: poi96300 (天阿poi)   2022-10-13 20:53:00
13代解禁後 效能提升 GPU使用率提高時 我看你怎麼解釋
作者: poi96300 (天阿poi)   2022-10-13 20:53:00
13代解禁後 效能提升 GPU使用率提高時 我看你怎麼解釋
作者: ronald279 (ronald279)   2022-10-13 21:02:00
看不懂QQ
作者: oopFoo (3d)   2022-10-13 21:20:00
其實就是取捨,AI/RT比較重要,Mesh/Task Shader普及後,FE的瓶頸也就解除了。某方面也是戰未來。
作者: ronald279 (ronald279)   2022-10-13 21:02:00
看不懂QQ
作者: oopFoo (3d)   2022-10-13 21:20:00
其實就是取捨,AI/RT比較重要,Mesh/Task Shader普及後,FE的瓶頸也就解除了。某方面也是戰未來。
作者: TaiwanBeijin (台灣北京)   2022-10-13 21:26:00
原po或許是架構上專家 但卻不是商業成本的專家 講的東西經常只看架構而忽略製造成本
作者: TaiwanBeijin (台灣北京)   2022-10-13 21:26:00
原po或許是架構上專家 但卻不是商業成本的專家 講的東西經常只看架構而忽略製造成本
作者: leviva (華麗幻影)   2022-10-13 21:31:00
如果13900K / 7950X / 7800X3D 1080p / 2k 都拉不開跟3090 Ti的差距,證明cpu瓶頸完全是偽概念 ( 而且買4090的,99.99% 開4K畫質,完全不受影響)
作者: leviva (華麗幻影)   2022-10-13 21:31:00
如果13900K / 7950X / 7800X3D 1080p / 2k 都拉不開跟3090 Ti的差距,證明cpu瓶頸完全是偽概念 ( 而且買4090的,99.99% 開4K畫質,完全不受影響)
作者: KoiKaze (戀風)   2022-10-13 21:56:00
優文
作者: KoiKaze (戀風)   2022-10-13 21:56:00
優文
作者: sx4152 (呵呵)   2022-10-13 21:58:00
合理阿 怎麼可能現在這麼強的cpu會是瓶頸
作者: sx4152 (呵呵)   2022-10-13 21:58:00
合理阿 怎麼可能現在這麼強的cpu會是瓶頸
作者: google60411 (MouMou)   2022-10-13 21:59:00
太難懂了 拔草測風向
作者: google60411 (MouMou)   2022-10-13 21:59:00
太難懂了 拔草測風向
作者: ctes940008 (蛤!我只是小兵!?)   2022-10-13 22:07:00
不明覺厲
作者: ctes940008 (蛤!我只是小兵!?)   2022-10-13 22:07:00
不明覺厲
作者: LiNcUtT (典)   2022-10-13 22:23:00
13代解禁後就知道了,剩一個禮拜
作者: LiNcUtT (典)   2022-10-13 22:23:00
13代解禁後就知道了,剩一個禮拜
作者: NodeWay (不由分說)   2022-10-13 22:40:00
看13900k有沒有提升就知道了終於等到13900+4090了
作者: NodeWay (不由分說)   2022-10-13 22:40:00
看13900k有沒有提升就知道了終於等到13900+4090了
作者: rickie1141   2022-10-13 22:53:00
拔草測風向
作者: rickie1141   2022-10-13 22:53:00
拔草測風向
作者: bbest (CFP-game theory)   2022-10-13 23:26:00
levi大講到重點,等13代解禁就知道這篇是神預測還是喇叭文了
作者: bbest (CFP-game theory)   2022-10-13 23:26:00
levi大講到重點,等13代解禁就知道這篇是神預測還是喇叭文了
作者: mrme945   2022-10-13 23:30:00
已經有人拿7950X測過了,一樣瓶頸呀
作者: mrme945   2022-10-13 23:30:00
已經有人拿7950X測過了,一樣瓶頸呀
作者: gbcg9725 (謝謝你9725)   2022-10-14 00:10:00
等等黨又可以等50了
作者: gbcg9725 (謝謝你9725)   2022-10-14 00:10:00
等等黨又可以等50了
作者: ddfg (douges)   2022-10-14 00:12:00
因為現在cpu都在劑牙膏
作者: ddfg (douges)   2022-10-14 00:12:00
因為現在cpu都在劑牙膏
作者: kuninaka   2022-10-14 00:12:00
這篇的解釋合理啊,FE無能讓後端的shader在等
作者: kuninaka   2022-10-14 00:12:00
這篇的解釋合理啊,FE無能讓後端的shader在等
作者: RaiGend0519 (Named RaiGend)   2022-10-14 00:13:00
大神出沒
作者: RaiGend0519 (Named RaiGend)   2022-10-14 00:13:00
大神出沒
作者: kuninaka   2022-10-14 00:13:00
以前CPU負責送三角形 現在是GPU自己送
作者: kuninaka   2022-10-14 00:13:00
以前CPU負責送三角形 現在是GPU自己送
作者: ddfg (douges)   2022-10-14 00:14:00
講得好像13代很神一樣,製程沒變化還不是12代再捏上去
作者: ddfg (douges)   2022-10-14 00:14:00
講得好像13代很神一樣,製程沒變化還不是12代再捏上去
作者: kuninaka   2022-10-14 00:15:00
遊戲設計跟不上老黃XDD
作者: kuninaka   2022-10-14 00:15:00
遊戲設計跟不上老黃XDD
作者: minipopy0314 (Galaxy)   2022-10-14 00:16:00
我都在等100系了 老黃你快改阿
作者: minipopy0314 (Galaxy)   2022-10-14 00:16:00
我都在等100系了 老黃你快改阿
作者: www123442 (Hibao.)   2022-10-14 00:49:00
CPU佔用才20~30%講CPU瓶頸 不然是要做到單核10GHz嗎?
作者: www123442 (Hibao.)   2022-10-14 00:49:00
CPU佔用才20~30%講CPU瓶頸 不然是要做到單核10GHz嗎?
作者: tactics2100 (Ose)   2022-10-14 00:53:00
那是因為很多遊戲不支援全核運作(常見的就1~4核)遊戲會卡但是遊戲以外的軟體不卡
作者: tactics2100 (Ose)   2022-10-14 00:53:00
那是因為很多遊戲不支援全核運作(常見的就1~4核)遊戲會卡但是遊戲以外的軟體不卡
作者: ltytw (ltytw)   2022-10-14 01:35:00
不可質疑你的老黃 你NV價值不足? 難道你要買AMD?
作者: ltytw (ltytw)   2022-10-14 01:35:00
不可質疑你的老黃 你NV價值不足? 難道你要買AMD?
作者: lee988325 (十一仇)   2022-10-14 01:54:00
cpu有可能是單核瓶頸 可是評測的沒秀 只能猜測
作者: lee988325 (十一仇)   2022-10-14 01:54:00
cpu有可能是單核瓶頸 可是評測的沒秀 只能猜測
作者: wantsu (wantsu)   2022-10-14 01:55:00
你可以買i皇的顯卡,弱到CPU絕不可能是瓶頸
作者: wantsu (wantsu)   2022-10-14 01:55:00
你可以買i皇的顯卡,弱到CPU絕不可能是瓶頸
作者: fywei (應無所住而生其心)   2022-10-14 01:56:00
敢嘴老黃 你 ...
作者: fywei (應無所住而生其心)   2022-10-14 01:56:00
敢嘴老黃 你 ...
作者: a27417332 (等號卡比)   2022-10-14 02:02:00
有點好奇為什麼每週期的三角形處理率變低可以推到瓶頸是在前端的結論?有其他數據證明嗎?
作者: a27417332 (等號卡比)   2022-10-14 02:02:00
有點好奇為什麼每週期的三角形處理率變低可以推到瓶頸是在前端的結論?有其他數據證明嗎?
作者: CORYCHAN (CORY)   2022-10-14 03:12:00
O大好資深
作者: CORYCHAN (CORY)   2022-10-14 03:12:00
O大好資深
作者: a85139138 (Carlos)   2022-10-14 03:23:00
你還是沒有解答為何5800X和X3D會有差距,就是因為看到這個差距加上FHD提升非常有限,我們才覺得可能跟CPU有關,如果真的是FE原因那有辦法解釋這個結果嗎
作者: a85139138 (Carlos)   2022-10-14 03:23:00
你還是沒有解答為何5800X和X3D會有差距,就是因為看到這個差距加上FHD提升非常有限,我們才覺得可能跟CPU有關,如果真的是FE原因那有辦法解釋這個結果嗎
作者: ipspro (U斷腳修不好!)   2022-10-14 05:16:00
等13900k解禁不就知道是不是瓶頸了
作者: ipspro (U斷腳修不好!)   2022-10-14 05:16:00
等13900k解禁不就知道是不是瓶頸了
作者: tint (璇月)   2022-10-14 05:37:00
發表會公佈的GPC結構圖 就可以看出SM結構沒什麼改變這次ADA的結構沒有大改 主要是頻率拉高、加大L2、增加SM規模這篇推算出前端的效率 看起來合理 前端效率沒跟上規模的增加另外 N卡對於CPU效能較依存的現象 這是從Kepler就開始的因為從Kepler架構開始 NV將Scheduling過程一部分轉移給CPU來處理 所以Fermi之後的架構 NV的GPU對CPU的依賴會相對高些但NV這樣做的好處是可以大幅降低CUDA執行緒上的延遲架構簡化亦能進一步提昇GPU的能耗比
作者: tint (璇月)   2022-10-14 05:37:00
發表會公佈的GPC結構圖 就可以看出SM結構沒什麼改變這次ADA的結構沒有大改 主要是頻率拉高、加大L2、增加SM規模這篇推算出前端的效率 看起來合理 前端效率沒跟上規模的增加另外 N卡對於CPU效能較依存的現象 這是從Kepler就開始的因為從Kepler架構開始 NV將Scheduling過程一部分轉移給CPU來處理 所以Fermi之後的架構 NV的GPU對CPU的依賴會相對高些但NV這樣做的好處是可以大幅降低CUDA執行緒上的延遲架構簡化亦能進一步提昇GPU的能耗比
作者: savagy (天使不打烊)   2022-10-14 05:56:00
終於等到t大開釋,雖然還是看不懂
作者: savagy (天使不打烊)   2022-10-14 05:56:00
終於等到t大開釋,雖然還是看不懂
作者: tint (璇月)   2022-10-14 06:14:00
當年GTX600系列發售後 就有一些關於新GPU對CPU依賴性的測試http://vga.zol.com.cn/290/2906445.html 當時對岸的測試文#1OubQ0fR (PC_Shopping) 板上有人po過的解析文章https://i.imgur.com/Kq7zjHs.pngKepler架構後Scheduling過程的一部分由驅動交由CPU處理所以原標題依賴CPU和本篇前端處理效率跟不上 覺得都是合理的GPU的發展方向 每隔幾年都會有一些變革 現在也許又到變革期
作者: tint (璇月)   2022-10-14 06:14:00
當年GTX600系列發售後 就有一些關於新GPU對CPU依賴性的測試http://vga.zol.com.cn/290/2906445.html 當時對岸的測試文#1OubQ0fR (PC_Shopping) 板上有人po過的解析文章https://i.imgur.com/Kq7zjHs.pngKepler架構後Scheduling過程的一部分由驅動交由CPU處理所以原標題依賴CPU和本篇前端處理效率跟不上 覺得都是合理的GPU的發展方向 每隔幾年都會有一些變革 現在也許又到變革期
作者: aegis43210 (宇宙)   2022-10-14 06:26:00
5800x3d表現比較好是因為L3大,指令命中率更高,使GPU前端壓力變小
作者: aegis43210 (宇宙)   2022-10-14 06:26:00
5800x3d表現比較好是因為L3大,指令命中率更高,使GPU前端壓力變小
作者: tint (璇月)   2022-10-14 06:30:00
早年3D加速晶片->硬體T&L進入GPU時期->統一著色器架構時期繪圖晶片從早年狂堆多邊形生成效能轉為重點擺在著色器效能到現在強化單/半精度效能 強化AI效能和加入光追功能
作者: tint (璇月)   2022-10-14 06:30:00
早年3D加速晶片->硬體T&L進入GPU時期->統一著色器架構時期繪圖晶片從早年狂堆多邊形生成效能轉為重點擺在著色器效能到現在強化單/半精度效能 強化AI效能和加入光追功能
作者: oopFoo (3d)   2022-10-14 06:46:00
那個解析文章,亂扯一通,完全不懂drawcall的瓶頸是什麼。vulkan/dx12很複雜,效能沒有提昇很多,因為每個遊戲都需要一堆PSO(Pipeline State Object)。每個pso都需要編譯,編譯沒辦法即時,micro stuttering比以前更厲害,Steam為了解決這個問題,cache pso起來,所以steam cache吃一堆。
作者: oopFoo (3d)   2022-10-14 06:46:00
那個解析文章,亂扯一通,完全不懂drawcall的瓶頸是什麼。vulkan/dx12很複雜,效能沒有提昇很多,因為每個遊戲都需要一堆PSO(Pipeline State Object)。每個pso都需要編譯,編譯沒辦法即時,micro stuttering比以前更厲害,Steam為了解決這個問題,cache pso起來,所以steam cache吃一堆。
作者: kuninaka   2022-10-14 06:52:00
上面PO電蝦那篇文章被中國人吐槽,亂扯一通XDD"這篇文章屬於牛頭不對馬嘴的典型例子,作者甚至不知道自己在說什麼,居然把任務調度和sm內的指令調度混為一談。"https://i.imgur.com/SuG1ncR.jpg
作者: kuninaka   2022-10-14 06:52:00
上面PO電蝦那篇文章被中國人吐槽,亂扯一通XDD"這篇文章屬於牛頭不對馬嘴的典型例子,作者甚至不知道自己在說什麼,居然把任務調度和sm內的指令調度混為一談。"https://i.imgur.com/SuG1ncR.jpg
作者: oopFoo (3d)   2022-10-14 06:55:00
硬體廠商故意混淆,也是造成大家誤解的一大原因。
作者: oopFoo (3d)   2022-10-14 06:55:00
硬體廠商故意混淆,也是造成大家誤解的一大原因。
作者: kuninaka   2022-10-14 06:55:00
低解析度4090跟3090差不多啊就卡在前面,後面爆幹強也沒用高負載才有用武之地其實也是好處?低負載買這麼強的卡炫富其實沒必要
作者: kuninaka   2022-10-14 06:55:00
低解析度4090跟3090差不多啊就卡在前面,後面爆幹強也沒用高負載才有用武之地其實也是好處?低負載買這麼強的卡炫富其實沒必要
作者: tint (璇月)   2022-10-14 09:10:00
https://tinyurl.com/4nb6yr28 後藤弘茂專欄講解Kepler架構https://i.imgur.com/hpGLask.jpgFermi架構中Scheduling過程是有一部份移交給CPU處理的當年的NV技術文件也有提到 所以那篇解析文的立論是對的只是後面它提的DX12這可能就他自己的觀點那個中國人吐槽可能也沒去看過NV當年Kepler的技術文件上面第三行沒打完整 應是Fermi架構後的Kepler架構SM中的平行處理調度當然還是硬體層 外移的是Pre-Scheduling
作者: tint (璇月)   2022-10-14 09:10:00
https://tinyurl.com/4nb6yr28 後藤弘茂專欄講解Kepler架構https://i.imgur.com/hpGLask.jpgFermi架構中Scheduling過程是有一部份移交給CPU處理的當年的NV技術文件也有提到 所以那篇解析文的立論是對的只是後面它提的DX12這可能就他自己的觀點那個中國人吐槽可能也沒去看過NV當年Kepler的技術文件上面第三行沒打完整 應是Fermi架構後的Kepler架構SM中的平行處理調度當然還是硬體層 外移的是Pre-Scheduling
作者: oopFoo (3d)   2022-10-14 14:19:00
kepler只是把job board移出來而已。gpu其實很早就有cpu在裡面,Nvidia早在2016年就換RISC-V,比其他人都早。但JobBoard跟Scoring這些東東本來交給主機的CPU是比較適合的。CPU管大的,gpu管sm的thread,各有適合的。但這影響的不是效率,是成本。
作者: oopFoo (3d)   2022-10-14 14:19:00
kepler只是把job board移出來而已。gpu其實很早就有cpu在裡面,Nvidia早在2016年就換RISC-V,比其他人都早。但JobBoard跟Scoring這些東東本來交給主機的CPU是比較適合的。CPU管大的,gpu管sm的thread,各有適合的。但這影響的不是效率,是成本。
作者: kaltu (ka)   2022-10-14 15:00:00
所以是GPU上內建的CPU瓶頸了,不是主板上那顆
作者: kaltu (ka)   2022-10-14 15:00:00
所以是GPU上內建的CPU瓶頸了,不是主板上那顆
作者: oopFoo (3d)   2022-10-14 15:13:00
瓶頸的是geometry engine,也不是內建的cpu。那個就是專門處理三角形該怎麼對應到frame buffer上。以前是歸類於前端(FE),但現在中段也會用的到。
作者: oopFoo (3d)   2022-10-14 15:13:00
瓶頸的是geometry engine,也不是內建的cpu。那個就是專門處理三角形該怎麼對應到frame buffer上。以前是歸類於前端(FE),但現在中段也會用的到。
作者: ltytw (ltytw)   2022-10-14 15:32:00
推t大
作者: ltytw (ltytw)   2022-10-14 15:32:00
推t大
作者: CharleneTsai (給他200塊去吃麥當勞啦)   2022-10-14 18:57:00
結論 等50看看
作者: CharleneTsai (給他200塊去吃麥當勞啦)   2022-10-14 18:57:00
結論 等50看看
作者: a85139138 (Carlos)   2022-10-14 19:42:00
感謝o大t 大解釋,雖然沒看很懂先存起來再說
作者: a85139138 (Carlos)   2022-10-14 19:42:00
感謝o大t 大解釋,雖然沒看很懂先存起來再說
作者: boren (boren)   2022-10-14 20:54:00
我還好奇的是,為什麼4K能比1080P使用率更高?1080P的三角型比較多?應該不是吧?
作者: boren (boren)   2022-10-14 20:54:00
我還好奇的是,為什麼4K能比1080P使用率更高?1080P的三角型比較多?應該不是吧?
作者: tint (璇月)   2022-10-14 21:50:00
衡量GPU效能一項指標是填充率 一般主要會指像素和紋理填充率當解析度愈高 GPU要渲染的像素也愈多 每秒能繪製格數就下降所以boren是指哪方面的使用率?
作者: tint (璇月)   2022-10-14 21:50:00
衡量GPU效能一項指標是填充率 一般主要會指像素和紋理填充率當解析度愈高 GPU要渲染的像素也愈多 每秒能繪製格數就下降所以boren是指哪方面的使用率?
作者: boren (boren)   2022-10-14 22:07:00
就是工作管理員能看到的GPU使用率,但你這麼一說我懂了,解析度高的時候GPU就加重別的工作了,這時front end就不需要拼命畫三角形了
作者: boren (boren)   2022-10-14 22:07:00
就是工作管理員能看到的GPU使用率,但你這麼一說我懂了,解析度高的時候GPU就加重別的工作了,這時front end就不需要拼命畫三角形了
作者: LastAttack (與我無關~~)   2022-10-15 00:11:00
CPU瓶頸論者幹嘛一直喊13900k==也就多兩簇小核、時脈拉一成
作者: LastAttack (與我無關~~)   2022-10-15 00:11:00
CPU瓶頸論者幹嘛一直喊13900k==也就多兩簇小核、時脈拉一成

Links booklink

Contact Us: admin [ a t ] ucptt.com