[問題] CentOS fortran平行計算問題

作者: ryan0903 (ryan)   2022-03-23 22:27:19
https://www.slothparadise.com/running-mpi-common-mpi-troubleshooting-problems/
https://i.imgur.com/pKWdhds.jpg
也遇到這個網站貼一個問題
已經照他的建議操作
但是還是有一樣的error
我懷疑是library沒辦法在各個nodes 共用
想請問有人有類似經驗 很需要幫忙 謝謝
可以再私訊詳述問題 麻煩了
作者: ryan0903 (ryan)   2022-03-23 22:31:00
總共有6個nodes 但是只能利用其中一個 也就是指令只能是#PBS -l nodes=1:ppn=40 最多
作者: relaughter (好好笑)   2022-03-23 23:02:00
每個節點彼此都要能免密碼登入,這點確定了嗎?
作者: ryan0903 (ryan)   2022-03-24 00:13:00
有的 感謝提醒 還有什麼要注意的嗎
作者: giraffe4527 (鹿)   2022-03-24 00:22:00
每個節點防火牆、selinux都關掉,可以輸出PBS的log可以試試看在每個節點跑mpirun確認是不是submit問題再來把.ssh/known_hosts節點清掉排除hosts key問題
作者: CardLin (卡林)   2022-03-25 01:28:00
沒有 InfiniBand 多節點也只是無用的技術。跨節點建議 /home 及 /opt 用 NFS 分享,ssh key放/home另外建議用 PIC 編譯所有的程式碼。
作者: pillbox1989 (如履薄冰)   2022-03-25 18:59:00
一般建立mpi時,會用nis在每個節點建立相同的使用者代號。若要用ssh方式,要使用ssh_keygen做出金鑰對放到各節點
作者: giraffe4527 (鹿)   2022-03-26 10:46:00
其實nis+nfs共享home就不用每個節點丟key了放到head node自己的auth key就每個節點通用不然很多台每個使用者每台都要做一次真的累但就是平行時比較吃網路

Links booklink

Contact Us: admin [ a t ] ucptt.com