Re: [心得] A11 vs S845優劣分析

作者: kkcity59 (kkcityk)   2018-09-16 06:13:46
※ 引述《ja9740807 (finallydream)》之銘言:
: 基本上 這兩個處理器 並不存在絕對的好與壞
: 至於效能過剩這說法 我是覺得挺可笑的
: 先說走向 以走向來說
: https://imgur.com/2rnuC03
: 對於S845來說 遵循著公版A75架構
: https://imgur.com/7utChXw
: 是一個三發射端的架構
: 而相較於A11 是個六發射端
: 光前面發射端的數據量就有著好幾倍的提升
: 核心面積也大了不少
: 等同於 A11在CPU輾壓S845這點是肯定的
其實依照您這張圖
https://imgur.com/7utChXw
有網友說的"發射端"是issue Queues
其實這很怪....因為S845很明確存在七個
https://imgur.com/8NhL72Y
圖上面也是
這是小弟為何一直對發射端搞得很迷糊的原因
經過您的解釋
就是特別指出decode之後
進去int跟load/store單元的部分才算
https://imgur.com/WeouOC3
這就完全沒去看看FPU跟Branch捷徑的部分
https://imgur.com/DnNdT9W
其實圖看起來decode不很像是會變成瓶頸
arm的risc指令會分解成兩個micro op
對應兩個整數/兩個load/store單元來說其實挺合理的
直接加寬它似乎沒有明顯好處
A11我真的查不太到他的資料
但是如果它有比較多的int跟load/store單元
會把這邊加寬是合理的,效能也確實可以提升
但我就是沒資料,也不確定您的"六個"指的是什麼?
唯一找到有點相關的是A7的資料
https://imgur.com/b620GS7
可是這個6個依照這張圖看起來
去對應成S845的設計就應該是7而非3了
: https://imgur.com/igpcNNG
: 單核心效能隨便都是4000起跳
: https://imgur.com/Pvsl0mz
: 至於S845 單核效能在2000上下
我對Geekbench仍然是持保留態度
我覺得她受快取大小影響太大
它的成績我就是覺得怪
: 接近兩倍也證明了流水線長度和發射端造成的效能差異
^^^^^^^^^^^^^^^^^^^^^^^^^^^
: 疊大核心 優點就是效能可以撐得上去
: (說實話 會有人說Geekbench捏造跑分還挺好笑的)
: 但難道沒有缺點嗎? 疊大核心這條路是正確的嗎?
: https://imgur.com/I9aCDh9
: 由於發射端和流水線大幅上升
^^^^^^^^^^^^^^^
流水線越深效能會被拉得比較低
但時脈可以拉得比較高,權衡下沒有越深就一定比較好
流水線設計深度在Pentium4到達頂峰後,應該就是一路下降
現在又開始因為製程提升開始拉回去
我不知道A11跟S845誰的流水線比較深
但是依照最高時脈來看很我猜可能是S845比較深
: 功耗也相對會大幅提升
: 對電池造成的壓力並不小
: 這也是蘋果為何會需要降頻iphone的原因
: 如果不降頻 對電池壓力太大 很容易會出現自動關機的情況
: 再來就是發熱也會相對應的提升
: 所以最好的解決方法 就是疊小核心了嗎?
: 我認為這答案可以對也可以不對
這答案太難了....需要很多強大的工程師反覆設計測試
其實我用用戶心態直接看結果會於快很多
: 以崩壞3為例子
: https://imgur.com/qPApQAl
: https://imgur.com/CHugJrw
: https://imgur.com/g26diSj
: 照理來說 S845在GPU上佔優勢
: 就算撇開常講的安卓優化
: 照理來說 擁有12核GPU的A10X
: 也應該贏A11的 怎麼回事呢?
: 因為崩壞3是屬於吃CPU的遊戲
: 遊戲理想的情況下 是將所有高度化並列的浮點
^^^^^^^^^^^^^^^^
: 全交由GPU來做運算
^^^^^^^^^^^^^^^^^
好怪....既然高度並列化就交給Neon去做了吧
一般看法是這樣啦。當然這也有一些討論。
就是既然我們有GPGPU為何還需要SIMD?這裡可以看看
https://stackoverflow.com/questions/25630209/why-use-simd-if-we-have-gpgpu
可是你會設計成SIMD本來就是要餵給Neon,自然就不會丟給GPU來做
如果你要去餵給GPGPU,那一開始就根本不用在意高度並列化這件事情了
: 但是事實總不可能這麼美好
: 這也是CPU為何需要保留整數和浮點的原因
GPU做到FP16/FP32(Adreno我記得一律是FP32)
但是Neon可以做到FP64/FP128甚至現在可能制訂的更高了
: 也就代表 遊戲會因為遊戲引擎的關係
: 還有整體特效的使用量 來影響到核心的壓力大小
: 於是 理當單核效能最強的A11自然輾壓其他核心
: 就算GPU不強 還是可以靠單核撐上來
: 對於傳說對決這種遊戲
: 基本上你讓他吃個A11的單核
其實A11我讀過的資料真的非常少,Apple保密到家
他到底是怎麼回事我其實不曉得都是猜測或結果論
: 就算不用S660多線呈優化 照樣能輾壓S845
: 原因就在這 反過來說 高通家的核心 就需要多核平均負載
: CPU弱就真的沒用嗎?
: 首先 以使用者體驗來說 我認為不疊CPU才是最優秀的
: 使用者最害怕的就是大功耗所帶來的耗電和摸起來燙
: https://imgur.com/7U1AeGv
: 以S835來說 第一個感覺就是涼快 舒適
: 因為他的大核心 就算是燒mix 2
: 最多也才1.7W
: https://imgur.com/ORur00e
: 反過來說 當時的A10處理器
: 耗電居然高達3.2W
: 單核差了兩倍 自然摸起來的溫度和耗電
: 總是不是那麼舒適些
: 疊大核又覺得熱 小核效能又不行
: 到底怎搞才行?
: 這當然是要請出Vulkan
: 他就是拯救這兩難情況的救星
: https://imgur.com/C1pB8Pj
: 這是OpenGL上的情況
: 可以看到 單核負載98%
: 其他核心都在休眠甚至只有少部分線程
: https://imgur.com/3MvsV8W
: Vulkan就是這麼神奇 全核心平均負載的處理工作
: https://imgur.com/3algA4O
: 而A73效能是A53的2.5倍 但耗電量卻是6倍
: 這更凸顯了小核心的能耗性價比
: 可以這麼說 A73甚至A11這種大核心
: (我認為真正理想的狀況 應該是丟滿8顆A55在配上Vulkan 就像S625一樣舒適)
: 都是因為多核優化不好 所以才會出現的東西
: 當然 多核優化並不是這麼簡單的任務
: 所以 如果玩的遊戲還是比較吃核心效能的
: 建議還是選擇A11吧
: 難道S845完全不佔優勢嗎?
: https://imgur.com/ZPM7qsL
: 以3Dmark來說 高通S845的GPU是輾壓著A11的
: https://imgur.com/6u3u62q
: 功耗和面積也是 這點不得不佩服高通
: 對於有Vulkan和吃重GPU的遊戲
: S845就有個明顯的優勢
: 例如王者榮耀 以及用虛幻4寫出來的刺激戰場
: 都是S845有利的優勢
: 所以遊戲A11優化輾壓 並不存在
: 我並不認為遊戲差 是安卓優化差
: 而是本身硬件的能力並沒有跟上
: 如果以S845來說 看起來很像i3+1080
: A11配置相對是i7+1060
: 平均的多 那為何高通不一舉疊上單核呢?
: 功耗爆炸的情況 在A11上的Iphone X
: 已經不太行了 更何況是還要應付安卓的後台機制
: 直接暴力的上去肯定是不行的
: 於是高通跟著ARM 慢慢加流水線和發射端
: 讓體驗不至於瞬間回到S810火龍
: 也能穩定的跟上效能 A76就是個明顯的例子
: 所以簡單分析來說
: A系列處理器 走的是效能的極致
: S系列處理器 走的是耗電和效能的平衡
: 從S820過後 高通開始更注重溫度的體驗
: 這也跟目前的NVIDIA走向是相同的
: 在減少功耗的情況下增加效能
: 再來就是常常有人說IOS萬年3G穩定夠用
: 這句話 以日常使用的角度來說是沒問題的
: https://imgur.com/WvkKyHe
: 以刺激戰場來說 這種物件多的遊戲
: 對於RAM的壓力就很大了
: 無論是速度亦或是大小
: 在電腦端也是如此
: https://imgur.com/B6OBoPn
: 內存不夠塞物件的解決法
: 講好聽點叫做優化
: 難聽點叫做降低材質
: 我個人認為 蘋果和安卓 並不存在著什麼遊戲優化輾壓
: 而是要看他們各自的長處 來決定誰在什麼情況下表現更好
: 優化佔的只是少數 更多還是本身的能力造成的影響
: 至於Exynos和麒麟我就不提了
: 全方位輸給這兩款處理器 也沒什麼可比性
: 至於調度方面 我還是比較看好高通DynamIQ的
: https://imgur.com/389nHKK
: 蘋果採用的big.LITTLE在調度層面 我覺得還是有點差距
: 處理器的調度問題 影響挺嚴重的
: 這問題下次再談
感謝您費心找了這麼多實測
既然是實測應該是最能反映實際應用狀況
對使用者來說也才是最直接的體驗

Links booklink

Contact Us: admin [ a t ] ucptt.com