一、關于 NVIDIA TESLA系列GPU 詳細介紹如下:
NVIDIA TESLA V100
NVIDIA Tesla V100采用NVIDIA Volta架構,非常适合為要求極為苛刻的雙精度計算工作流程提供加速,并且還是從P100更新的理想路徑。該GPU的渲染性能比Tesla P100提升了高達80%,借此可縮短設計周期和上市時間。
Tesla V100的每個GPU均可提供125 teraflops的推理性能,配有8塊Tesla V100的單個伺服器可實作1 petaflop的計算性能。
NVIDIA TESLA P40
The Tesla P40能夠提供高達2倍的專業圖形性能。Tesla P40能夠對組織中每個vGPU虛拟化加速圖形和計算(NVIDIA CUDA® 和 OpenCL)工作負載。支援多種行業标準的2U伺服器。
Tesla P40可提供出色的推理性能、INT8精度和24GB闆載記憶體。
NVIDIA TESLA T4
NVIDIA Tesla T4的幀緩存高達P4的2倍,性能高達M60的2倍,對于利用NVIDIA Quadro vDWS軟體開啟高端3D設計和工程工作流程的使用者而言,不失為一種理想的解決方案。憑借單插槽、半高外形特性以及低至70瓦的功耗,Tesla T4堪稱為每個伺服器節點實作最大GPU密度的絕佳之選。
NVIDIA TESLA P4
Tesla P4可加快任何外擴型伺服器的運作速度,能效高達CPU的60倍。
二、 NVIDIA Tesla GPU 系列P4、T4、P40以及V100
NVIDIA Tesla系列GPUP4、T4、P40以及V100性能規格參數對比表,
阿裡雲GPU雲伺服器提供的執行個體GN4(Nvidia M40)、GN5(Nvidia P100)、GN5i(Nvidia P4)及GN6(Nvidia V100),也會基于NVIDIA Tesla GPU系列。
雲伺服器 | Tesla T4:世界領先的推理加速器 | Tesla V100:通用資料中心 GPU | 适用于超高效、外擴型伺服器的 | Tesla P4 适用于推理吞吐量伺服器的 Tesla P40 |
---|---|---|---|---|
單精度性能 (FP32) | 8.1 TFLOPS | 14 TFLOPS (PCIe) 15.7 teraflops (SXM2) | 5.5 TFLOPS | 12 TFLOPS |
半精度性能 (FP16) | 65 TFLOPS | 112 TFLOPS (PCIe)125 TFLOPS (SXM2) | — | |
整數運算能力 (INT8) | 130 TOPS | 22 TOPS* | 47 TOPS* | |
整數運算能力 (INT4) | 260 TOPS | |||
GPU 顯存 | 16GB | 32/16GB HBM2 | 8GB | 24GB |
顯存帶寬 | 320GB/秒 | 900GB/秒 | 192GB/秒 | 346GB/秒 |
系統接口/外形規格 | PCI Express 半高外形 | PCI Express 雙插槽全高外形 SXM2/NVLink | PCI Express 雙插槽全高外形 | |
功率 | 70 W | 250 W (PCIe) 300 W (SXM2) | 50 W/75 W | 250 W |
硬體加速視訊引擎 | 1 個解碼引擎,2 個編碼引擎 |