[問題] JOB會停在server上不動也沒任何錯誤訊息

作者: peter308 (pete)   2016-04-27 21:27:49
各位好
我用Mpif90 編譯產生一個執行檔a.out
然後這個a.out再跑一段時間之後就停頓在那邊
也沒有錯誤訊息,就只是閒置那邊
我目前因為無法從任何訊息文件得知job是在哪個地方出問題
我自己猜測是I/O 不同步 或其他原因
有人知道要怎麼去檢測這個job閒置的原因為何?
我有想過
1. 在mpif90 那邊加一些除錯的選項 -debug 之類
2. 用stat 之類的指令去偵測a.out正在等待哪個子程序的回應或檔案的讀取,..等
能否請版友給我一些方向讓我可以順利解決此問題?
萬分感謝~~~~
作者: pillbox1989 (如履薄冰)   2016-04-28 02:35:00
在程式裡面加些print看看是不是卡在某一段吧
作者: Bencrie   2016-04-28 12:11:00
gdb attach 後中斷它然後 bt
作者: sasoric (sasori.c)   2016-04-29 14:07:00
直覺是你的程式被blocking message passing函式卡住如同樓上所提 用debugger或加printf去查

Links booklink

Contact Us: admin [ a t ] ucptt.com