100萬售價的計算卡,英偉達發布Tesla V100

日前,在 GTC 2017 大上,NVIDIA 正式發布了迄今為止最強大的核彈——旗艦計算卡 Tesla V100。

Tesla V100 是基於 Volta 架構的產品,內置 5120 個 CUDA 單元,核心頻率 1455MHz,配備 16GB HBM2 顯存,單精度浮點性能 15 TFLOPS,雙精度浮點 7.5 TFLOPS,顯存帶寬 900GB/s。

此外,Tesla V100 還增加與深度學習高度相關的 Tensor 單元,Tensor 性能號稱可以達到 120 TFLOPS。此舉使得 Tesla V100 擁有超過 210 億個晶體管,核心面積達到了史無前例的 815 平方毫米,採用的是 12nmFFN 工藝製造。

Advertisements

相比較來看,上代旗艦 Tesla P100 也只有 3584 個 CUDA 單元而已,擁有 153 億個晶體管,核心面積 610 平方毫米。此外,Tesla V100 的 L2 緩存由 Tesla P100 的 4096KB 增加到了 6144KB,每組 SM 單元的寄存器文件大小總數從 14336KB 增加到了 20480KB。

NVIDIA 表示,Tesla V100 將首先用在用於深度學習超算 DGX-1 上,內部擁有 8 張 Tesla V100 計算卡,峰值計算性能高達960 TFLOPS,號稱 8 小時便可以完成 TITAN X 八天的工作量。

而 DGX-1 的售價為 14.9 萬美元(約合人民幣102萬元),為什麼這麼貴呢?因為這可不是什麼民用顯卡,不過別擔心,無需多久之後,該款民用級的也會出來了,而且從內置的 CUDA 單元數來看,性能將會爆棚。

Advertisements


Advertisements

你可能會喜歡