在今日舉行的GTC 大會上,英偉達正式宣布推出采用 NVIDIA Hopper 架構的新一代加速計算平臺,同時發布其首款基于 Hopper 架構的 GPU — NVIDIA H100。
根據英偉達介紹,H100 NVIDIA GPU帶來了六項突破性創新:
第一,世界最先進的芯片。英偉達表示,H100 由 800 億個晶體管構建而成,這些晶體管采用了專為 NVIDIA 加速計算需求設計的尖端的 TSMC 4N 工藝。同時,H100 是首款支持 PCIe 5.0 的 GPU,也是首款采用 HBM3 的 GPU,可實現 3TB/s 的顯存帶寬。
第二,搭載新的 Transformer 引擎。H100 加速器的 Transformer 引擎旨在不影響精度的情況下,將這些網絡的速度提升至上一代的六倍。
第三,第二代安全多實例 GPU 。與上一代產品相比,在云環境中 Hopper 架構通過為每個 GPU 實例提供安全的多租戶配置,將 MIG 的部分能力擴展了 7 倍。
第四,機密計算。H100 是全球首款具有機密計算功能的加速器,可保護 AI 模型和正在處理的客戶數據。客戶還可以將機密計算應用于醫療健康和金融服務等隱私敏感型行業的聯邦學習,也可以應用于共享云基礎設施。
第五,第 4 代 NVIDIA NVLink。為加速大型 AI 模型,NVLink 結合全新的外接 NVLink Switch,可將 NVLink 擴展為服務器間的互聯網絡,最多可以連接多達 256 個 H100 GPU,相較于上一代采用 NVIDIA HDR Quantum InfiniBand網絡,帶寬高出9倍。
第六,DPX 指令。新的 DPX 指令可加速動態規劃,適用于包括路徑優化和基因組學在內的一系列算法,與 CPU 和上一代 GPU 相比,其速度提升分別可達 40 倍和 7 倍。
據了解,NVIDIA H100可部署于各種數據中心,包括內部私有云、云、混合云和邊緣數據中心。這款產品預計于今年晚些時候全面發售,屆時企業可從全球各大云服務提供商和計算機制造商處購買,或者直接從NVIDIA官方渠道購買。NVIDIA 的第四代 DGX 系統 DGX H100 配備 8 塊 H100 GPU,以全新的 FP8 精度提供 32 Petaflop 的 AI 性能,并支持擴展,能夠滿足大型語言模型、推薦系統、醫療健康研究和氣候科學的海量計算需求。
英偉達創始人兼 CEO 黃仁勛表示:“數據中心正在轉變成‘AI 工廠’。它們處理大量數據,以實現智能。NVIDIA H100 是全球 AI 基礎設施的引擎,讓企業能夠利用其實現自身 AI 業務的加速。”
凡注有"環球傳媒網"或電頭為"環球傳媒網"的稿件,均為環球傳媒網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網",并保留"環球傳媒網"的電頭。