軟體篇
測試環境:Windows7 + Aparapi + OpenCL
測試硬體1:I3-3220 + Quadro K2000 (FP performance:732.7 GFLOPS) 0.7 T
測試硬體2:Phenom II X3 720 + AMD 6670 (FP performance:1,360.0 GFLOPS)1.3 T
測試硬體3:G3420 + R270X (FP performance:2,560.0 GFLOPS)2.5 T
模式1:JTP模式(Java Thread Pool)
模式2:GPU模式(用GPU計算)
(原本有要用E5,但是LINUX下的環境一直建置失敗,只好先拿這三個出來講)
這三台電腦的主要差異在於Conversion Time(GPU模式)
主要是跑四則運算的迴圈(10次)
硬體1平均為22ms
硬體2平均為50ms
硬體3平均為45ms
(影響Convertion Time的主因應該是處理器沒錯)
而四則運算的時間如下:
GPU平均執行時間為1ms
JTP平均執行時間為2ms
但是將迴圈增加到100次時
GPU平均為2ms
JTP平均為8ms
迴圈增加到1000次
GPU平均為3ms
JTP平均為25ms
從這可以得知GPU的確是很快
但是以Aparapi來說還無法做即時運算
(仔細思考過後 轉換時間普遍小於50ms 1 tick 應該可以承擔重要迴圈的運算)
這個套件算是最好上手的
如果要快速套用在麥塊的伺服端
我想是可行的
像是非即時的運算如地圖的載入(手拿的地圖)
一次就要跑128*128次的迴圈
像是CHUNK 產生器
一次要產生上千個陣列
還有AI的部分
以上參考Spigot的原始碼
使用了大量迴圈
就很適合丟給GPU算
最近會先嘗試將比較簡單的部分作程式碼的置換