Pascal 架構帶來巨大的性能飛躍
NVIDIA Pascal 架構使 Tesla P100 能為 HPC 和超大規模工作負載提供性能。憑借每秒超過 21 萬億次的 16 位浮點 (FP16) 運算性能,經過優化的 Pascal 為深度學習應用程序帶來了令人興奮的新可能。Pascal 還可為 HPC 工作負載提供超過 5 萬億次的雙精度浮點運算和 10 萬億次的單精度浮點運算能力。
通過采用 HBM2 的 CoWoS 技術實現更高效率
通過加入采用 HBM2 的晶圓基底芯片 (CoWoS) 技術,Tesla P100 將計算性能和數據緊密集成在同一個程序包內,提供的內存性能是 NVIDIA Maxwell™ 架構的三倍以上。這大幅縮短了為數據密集型應用程序算出解決方案的時間。
頁面遷移引擎使編程更簡單
頁面遷移引擎可使開發人員從管理數據移動的工作中騰出時間,將精力更多地放在計算性能的調整上。應用程序現在可以突破 GPU 物理顯存的容量限制,達到幾乎無限量的顯存。
適用于混合型工作負載 HPC 的 NVIDIA Tesla P100
適用于 PCIe 的 Tesla P100 使混合型工作負載 HPC 數據中心能在節省資金的同時大幅提升吞吐量。例如,一個由四個與 PCIe 互聯的 Tesla P100 驅動的 GPU 加速節點,可以替代各種應用程序的多達 32 個通用 CPU 節點。利用數量大幅減少而性能強大的節點完成各種作業,意味著客戶可以節省多達 70% 的整體數據中心成本。
|