作者:
ejsizmmy (pigChu)
2025-01-22 12:59:03既然你是AMD內建 GPU搭配Linux系統,不如先看看這篇吧
https://wiki.archlinuxcn.org/zh-tw/AMDGPU
啟動參數
編輯
需要通過附加內核參數 amdgpu.ppfeaturemask=0xffffffff 來解鎖在 sysfs 中對其的訪問
限制。
並非所有比特位都有定義,隨著時間的推移可能會添加新功能。設置所有 32 位可能會(在
將來的更新中)啟用不穩定的功能,這些功能可能會導致屏幕閃爍或無法從掛起中恢復等問
題。
結合默認的 ppfeaturemask 設置 PP_OVERDRIVE_MASK 位 0x4000 應該就足夠了。 要為系
統計算一個合理的參數,可以執行:
$ printf 'amdgpu.ppfeaturemask=0x%x\n' "$(($(cat /sys/module/amdgpu/parameters/p
pfeaturemask) | 0x4000))"
另外我查到這邊一樣提到這種設定方式
https://superuser.com/questions/1583194/how-to-make-amdgpu-ppfeaturemask-work-wi
th-kernel-5-4-0-of-ubuntu-20-04
(縮) https://reurl.cc/eG7N37
你提到的參數的相關討論則在這裡:
https://www.reddit.com/r/linux4noobs/comments/1ahb8pf/what_exactly_does_amdgpupp
featuremask0xfffd3fff_do/
(縮)https://reurl.cc/Q5Gvb0
0xfffd3fff means that everything is enabled except for PP_OVERDRIVE_MASK, PP_GFX
OFF_MASK, and PP_STUTTER_MODE
意思是這邊的功能都給他打開除了這三個東東不開
至於功能跟實際參數詳細定義跟解釋如下:
https://git.kernel.org/pub/scm/linux/kernel/git/torvalds/linux.git/tree/drivers/
gpu/drm/amd/include/amd_shared.h#n178
(縮)https://reurl.cc/vp4ZWa
Bonus,額外的調整:
可以為最大 P-state 7 設置 GPU 核心頻率, 以 Polaris GPU 為例可以執行下面的命令設
置為 1209MHz 頻率和 900mV 電壓:
# echo "s 7 1209 900" > /sys/class/drm/card0/device/pp_od_clk_voltage
同樣的操作可以應用於 VRAM,例如 Polaris 5xx 系列卡上的最大 P-state 2:
# echo "m 2 1850 850" > /sys/class/drm/card0/device/pp_od_clk_voltage
警告: 仔細檢查輸入的值,因為錯誤可能會導致硬體損壞!
執行下面的命令讓修改生效:
# echo "c" > /sys/class/drm/card0/device/pp_od_clk_voltage
要檢查超頻是否成功,可以讀取 3D 負載下的時鐘和電壓:
# watch -n 0.5 cat /sys/kernel/debug/dri/0/amdgpu_pm_info
可以使用下面的命令重置為默認設置:
# echo "r" > /sys/class/drm/card0/device/pp_od_clk_voltage
※ 引述《lc85301 (pomelocandy)》之銘言
: 寫在前頭:標題有點聳動,其實是沒那麼誇張的
: 這篇也許不適用大部分的 Windows User
: 主要是針對 Linux 為主的 User,以下列出我的系統配置供參
: CPU+GPU: AMD 7950X
: MB: Gigabyte X670 GAMING X AX V2
: BIOS: 有升到 Version: F32f
: OS: Archlinux Xorg + MateDesktop
: ====
: 前情提要: #1c31Ldfs (PC_Shopping)
: 大約在去年 4 月初發菜單,應該是 4 月中下單拿到機器
: 初用沒什麼大問題,7950X 跟本來的 2400G 比起來也快很多
: 但過去一年有個最頭痛的點,是這顆的 GPU 不穩定
: 會發病的時間有幾個
: 1. 是在玩 Minecraft 的時候
: 2. 是我用 vscode 跑 hugo 寫 blog 的時候
: 會遇到畫面變成這個樣子:
: https://imgur.com/a9sZUBH
: 在 dmesg 內會出現如下的訊息:
: https://imgur.com/H90iXvm
: 通常只要出現這個狀況,只有重新開機才能回復正常
※ 引述《lc85301 (pomelocandy)》之銘言
: 寫在前頭:標題有點聳動,其實是沒那麼誇張的
: 這篇也許不適用大部分的 Windows User
: 主要是針對 Linux 為主的 User,以下列出我的系統配置供參
: CPU+GPU: AMD 7950X
: MB: Gigabyte X670 GAMING X AX V2
: BIOS: 有升到 Version: F32f
: OS: Archlinux Xorg + MateDesktop
: ====
: 前情提要: #1c31Ldfs (PC_Shopping)
: 大約在去年 4 月初發菜單,應該是 4 月中下單拿到機器
: 初用沒什麼大問題,7950X 跟本來的 2400G 比起來也快很多
: 但過去一年有個最頭痛的點,是這顆的 GPU 不穩定
: 會發病的時間有幾個
: 1. 是在玩 Minecraft 的時候
: 2. 是我用 vscode 跑 hugo 寫 blog 的時候
: 會遇到畫面變成這個樣子:
: https://imgur.com/a9sZUBH
: 在 dmesg 內會出現如下的訊息:
: https://imgur.com/H90iXvm
: 通常只要出現這個狀況,只有重新開機才能回復正常
: 另外有找了 Linux 上的燒機軟體,但沒抓到什麼問題
: 整體就是詭異,vscode + hugo 是會有什麼問題?
: 但我寫一篇 blog 的時間,就足以讓它當個 3-4 次
: 當然我今年工作太忙 blog 沒什麼產出,Minecraft 也不是真玩而是測一些設計
: 所以覺得沒差就將就用
: ====
: 病情加劇:
: 轉機大概是發生在去年 10 月左右,因為 factorio space age 出了
: 但我 legacy 都還沒過,就把它拉出來玩
: minecraft 3D 不行那 2D 的遊戲總可以吧,也是真的可以玩
: 但那時開始注意到,桌面上方狀態列,AMDGPU 的溫度有異常
: 不是如下圖 sensors 顯示的 600 多度,就是低到可以當冷氣的個位數溫度
: https://imgur.com/aePz11k
: 然後跟朋友連線 factorio 的時候,本來不會有的 GPU reset 開始變頻繁了
: 如上面的畫面花掉變少了,但 X 會當掉讓圖形介面重開始登入,這個頻率開始上升
: 甚至 factorio 連線 10 秒左右就當掉
: ====
: 維修:
: 過完年之後,把電腦裝箱送去原店面檢修,描述症狀,上電進 BIOS 之後
: 溫度寫著 17 ℃ ,店員也覺得不太正常
: 但因為在一年內,直接換了一顆新的 7950X,當天就能拿回家
: ====