: 推 a2935373 : 然後在隔壁版看到V100好像還是很搶手 懷疑老黃這次 08/22 03:18
: → a2935373 : 是為了出給專業公司順便炒作一下遊戲來交代股東 不 08/22 03:18
: → a2935373 : 然RTX這幾張真的怎麼看都不像遊戲用 08/22 03:18
講到這個V100 我朋友最近分享一個 ML Benchmark Result 給我
https://github.com/u39kun/deep-learning-benchmark
先看一下 V100 和 1080 Ti 的規格差異
Model Memory CUDA Cores Tensor Cores
Tesla V100 16GB HBM2 5120 640
1080 Ti 11GB GDDR5 3584 0
V100 boosted Frequency 1455 MHz
1080Ti boosted Frequency: 1582 MHz
測試結果
PyTorch 0.3.0
1080 Ti
精度 vgg16 eval vgg16 train resnet152 eval resnet152 train
32-bit 39.3ms 131.9ms 57.8ms 206.4ms
16-bit 33.5ms 117.6ms 46.9ms 193.5ms
V100
精度 vgg16 eval vgg16 train resnet152 eval resnet152 train
32-bit 26.2ms 83.5ms 38.7ms 136.5ms
16-bit 12.6ms 58.8ms 21.7ms 92.9ms
Tensorflow 1.4.0
1080 Ti
精度 vgg16 eval vgg16 train resnet152 eval resnet152 train
32-bit 43.4ms 131.3ms 69.6ms 300.6ms
16-bit 38.6ms 121.1ms 53.9ms 257.0ms
Tensorflow 1.5.0
V100
精度 vgg16 eval vgg16 train resnet152 eval resnet152 train
32-bit 24.0ms 71.7ms 39.4ms 199.8ms
16-bit 13.6ms 49.4ms 22.6ms 147.4ms
V100 TDP 300W
1080Ti TDP 275W
這樣看下來,Tensor Core 的強是表現在能耗比上面
V100 一張要 $8900 @@"