NVIDIA 憑藉 H100 GPU 打破了 MLPerf 基準,並證明了為什麼它是人工智慧市場無可爭議的領導者
NVIDIA 的 H100 GPU 在人工智慧方面處於領先地位,該公司再次在 MLPerf 基準測試中創造了新記錄。
隨著 Hopper H100 GPU 實現破紀錄的 MLPerf 生成 AI 效能,NVIDIA 繼續保持 AI 領先地位
在 NVIDIA發布的最新 MLPerf 基準測試中,該公司強調他們創造了多項新記錄,其中Eos 超級電腦在短短3.9 分鐘內完成了基於GPT-3 模型的訓練基準,該模型在10 億個代幣上訓練了1750 億個參數。這與之前的記錄相比是一個巨大的進步,之前的記錄是超級電腦在 10.9 分鐘內完成了相同的基準測試,標誌著驚人的 3 倍提升。
現在,超級電腦所取得的成績確實是驚人的,但背後的主要原因是什麼?
簡而言之,NVIDIA 尖端的 Hopper GPU 架構與完善的軟體資源相結合。Eos 超級電腦目前採用 10,752 個 NVIDIA H100 Tensor Core GPU,取代了相當舊的 A100,這就是為什麼效能大幅提升的原因。此外,透過開發完善的軟體資源(例如有助於 LLM 培訓的NVIDIA NeMo) ,Team Green 成功地從其平台中榨取了卓越的功能。
此外,貼文中提到的NVIDIA另一項創紀錄的成就是在「系統擴展」方面取得的進步,透過各種軟體優化的幫助,該公司成功地展現了93%的效率。10,752 個 H100 GPU 遠遠超過了6 月AI 訓練的規模,當時 NVIDIA 使用了 3,584 個 Hopper GPU。高效擴展在業界非常重要,因為實現高運算能力需要使用更多的硬體資源,而如果沒有足夠的軟體支持,系統的效率會受到更大程度的影響。
NVIDIA 在 AI 產業中的作用意義重大,因為該公司有能力提供人類已知的最強大的 AI GPU(至少目前如此)。撇開財務方面不談,Green 團隊一直在快速開發其軟體資源,並與客戶合作,透過保持效率和穩定性來確保其產品組合提供最佳效能。
新聞來源:NVIDIA 博客
發佈留言