[請益] 公司主機集中做機器學習分散式運算

作者: hooboa1122 (伯樂)   2019-10-04 12:27:23
我們公司工程師都配備一台10萬元 2080顯卡
要做深度學習deep learning計算之用
因為人數越來越多 為了把運算資源更有效利用
我們想要評估
把這些主機放到機房集中 專做pytorch運算
每個工程師只配一台mac mini與機房主機連線用
請問一下
1.這樣的想法是否可行呢?
2.是否有合適的國內廠商可建議?
3.這樣的費用會花到多少呢?
4.如果採用Cloud GPU
依大家的經驗 會比較便宜嗎?
https://cloud.google.com/gpu/?hl=zh-tw
作者: goodga ( )   2019-10-04 15:14:00
錢的問題,最後會覺得一人一台最便宜...
作者: blackhippo (PH6.0 微.酸民)   2019-10-04 15:19:00
去年做VDI+GPU lab借張卡..光是卡+license問業務差不多可以買20台主機..
作者: chang0206 (Eric Chang)   2019-10-04 16:29:00
有,但是費用會很嚇人....cloud GPU更不用說一個月一兩千美金一台,組一台PC都有剩
作者: freeunixer (御劍客)   2019-10-04 17:32:00
光買專用的顯卡就貴死你,用 1060 加舊版驅動擋著用...
作者: asdfghjklasd (好累的大一生活)   2019-10-04 18:10:00
可以..不過有多少錢要做?
作者: VictorZ (月下的貓)   2019-10-05 00:17:00
試試看裝CentOS然後把那幾台主機串在一起當叢集共用資源,再開VDI出來,但是驅動那些要自己處理。
作者: antigenius (喵~)   2019-10-05 08:25:00
給你關鍵字 kubeflow花錢請一個做aws flow的DevOps幫你做poc先
作者: darktasi (桃園達克大叔)   2019-10-05 16:18:00
說到最後還是預算問題有興趣我可以站內你
作者: changmary (changmary)   2019-10-06 11:26:00
集中貴資源最大化 分散便宜很多
作者: atrix (班班)   2019-10-10 00:11:00
麻煩死了,大部分方案都只適合所有人都是超高等級人才的環境

Links booklink

Contact Us: admin [ a t ] ucptt.com