想跟各位前輩請教一下有關 Cluster的後台管理是否有推薦的
以前用過學術單位的是用 Scopion , 可以替你丟 Job 或是在
所有CPU 全佔滿時把Job轉到其他 Node , 全滿時會替你規劃
Job排隊
但該系統好像是該單位花錢安的 , 想問有沒有免錢的可以用來
管理Cluster用 , 如果可以簡單做到前面那樣的話不錯 , 如果
有能夠自動在你的 Job 需要跨 Node時替你叫mpi的話更好
最近想開始自己玩相關的,但一直不太知道這種後台要查什麼?
我之後是希望可以整個 set 到 Job 執行完可以替我把Job的一
些初步報告藉由像是 ssmtp 的方式從殭屍mail寄給我一些參數
書面報告 , 如果沒有的話我應該會想辦法自己弄出來 , 但想先
問各位先進有沒有聽過相關的
感謝