天天看點

NVIDIA Tesla GPU系列P4、T4、P40以及V100參數性能對比二、NVIDIA Tesla GPU系列P4、T4、P40以及V100

一、關于 NVIDIA TESLA系列GPU 詳細介紹如下:

NVIDIA TESLA V100

NVIDIA Tesla V100采用NVIDIA Volta架構,非常适合為要求極為苛刻的雙精度計算工作流程提供加速,并且還是從P100更新的理想路徑。該GPU的渲染性能比Tesla P100提升了高達80%,借此可縮短設計周期和上市時間。

Tesla V100的每個GPU均可提供125 teraflops的推理性能,配有8塊Tesla V100的單個伺服器可實作1 petaflop的計算性能。

NVIDIA TESLA P40

The Tesla P40能夠提供高達2倍的專業圖形性能。Tesla P40能夠對組織中每個vGPU虛拟化加速圖形和計算(NVIDIA CUDA® 和 OpenCL)工作負載。支援多種行業标準的2U伺服器。

Tesla P40可提供出色的推理性能、INT8精度和24GB闆載記憶體。

NVIDIA TESLA T4

NVIDIA Tesla T4的幀緩存高達P4的2倍,性能高達M60的2倍,對于利用NVIDIA Quadro vDWS軟體開啟高端3D設計和工程工作流程的使用者而言,不失為一種理想的解決方案。憑借單插槽、半高外形特性以及低至70瓦的功耗,Tesla T4堪稱為每個伺服器節點實作最大GPU密度的絕佳之選。

NVIDIA TESLA P4

Tesla P4可加快任何外擴型伺服器的運作速度,能效高達CPU的60倍。

二、 NVIDIA Tesla GPU 系列P4、T4、P40以及V100

NVIDIA Tesla系列GPUP4、T4、P40以及V100性能規格參數對比表,

阿裡雲GPU雲伺服器

提供的執行個體GN4(Nvidia M40)、GN5(Nvidia P100)、GN5i(Nvidia P4)及GN6(Nvidia V100),也會基于NVIDIA Tesla GPU系列。

雲伺服器 Tesla T4:世界領先的推理加速器 Tesla V100:通用資料中心 GPU 适用于超高效、外擴型伺服器的 Tesla P4 适用于推理吞吐量伺服器的 Tesla P40
單精度性能 (FP32) 8.1 TFLOPS 14 TFLOPS (PCIe) 15.7 teraflops (SXM2) 5.5 TFLOPS 12 TFLOPS
半精度性能 (FP16) 65 TFLOPS 112 TFLOPS (PCIe)125 TFLOPS (SXM2)
整數運算能力 (INT8) 130 TOPS 22 TOPS* 47 TOPS*
整數運算能力 (INT4) 260 TOPS
GPU 顯存 16GB 32/16GB HBM2 8GB 24GB
顯存帶寬 320GB/秒 900GB/秒 192GB/秒 346GB/秒
系統接口/外形規格 PCI Express 半高外形 PCI Express 雙插槽全高外形 SXM2/NVLink PCI Express 雙插槽全高外形
功率 70 W 250 W (PCIe) 300 W (SXM2) 50 W/75 W 250 W
硬體加速視訊引擎 1 個解碼引擎,2 個編碼引擎

繼續閱讀