補充:
國外也有些文章在討論,大致上有些脈絡了
https://i.imgur.com/rklGqze.jpg
Nvdia先前使用Float 64 Shaders,可執行一個 Float 64或一個 Float 32
Ampere架構的Float 64 Shaders, 可執行一個 Float 64或"兩"個 Float 32
Tweakers.net也有分析這個架構:
https://tinyurl.com/yy5o8pop
https://i.imgur.com/Kj0UTEC.jpg
從圖片來看就很清楚,FP32被劃成兩份,所以說類似超線程的說法其實也蠻正確的
先說不是來打臉或看衰的,只是剛好看到不同見解的說法,分享參考。
逛了一下對岸nga,有些文章提到:
1.這個cuda數量是等效數量,實際物理上只有一半,只是現在安培架構吞吐指令數翻倍了
,並不是所有的指令都能合並吞吐,所以這麽寫其實是不合適的。
2.這次列出3090有一萬個,3080有8000+個
其實是不是有點類似於超線程的意思?
每個物理core有兩個fp32計算單元
所以算力大約提升兩倍?
實際上die里真正的物理核心只有/2這麽多?
是的,所以70的CUDA/2的話,傳統性能可能還是打不過80ti,加上RTX才能達到老黃ppt
寫的性能。
以上,
分享一下不同的看法,
我也不是對這塊專業領域的,如果最後有錯請勿見怪。