NVIDIA解密Volta顯卡,完整5376核心,性能暴增50%

8月初,AMD就將借RX Vega重新殺回高性能顯卡市場。不過等待Vega的將不光是16nm Pascal顯卡,還有新一代12nm FFN製程NVIDIA Volta顯卡。今天英偉達公開了Volta核心的架構,確認了完整版Volta核心將擁有84組SM單元,共5376個CUDA核心,並且SM單元性能相比當代Pascal架構暴增50%。

Volta的每個SM單元具有64組FP32浮點單元、64組INT32整數單元、32組FP64雙精度浮點單元、9個用於深度學習的Tensor單元、4個紋理單元以及8組512bit顯存控制器。每個HBM2堆棧搭配2組顯存控制器,總共有5376個CUDA核心(FP32、INT32)、2688個FP64單元、336個紋理單元、672個Tensor單元,還有4096bit的等效帶寬、16GB HBM2顯存,顯存帶寬達到900GB/s。

Advertisements

Volta將使用台積電為NVIDIA定製的12nm FFN製程,相比當前的16nm製程性能可提升10%,核心面積減少20%。使用Volta架構GV100核心的Tesla V100因而可以在相同TDP下相比前代計算卡Tesla P100(Pascal架構)大幅提升浮點運算性能。

GV100主要用作計算卡,而在遊戲卡當中NVIDIA勢必會砍去對遊戲沒有價值的Tensor深度學習單元,並減少L2緩存、重組SM單元,遊戲用的GV102的遊戲性能相比Pascal架構勢必會再上一個新的高度。

Advertisements

你可能會喜歡