NVIDIA 憑藉 H100 GPU 打破了 MLPerf 基準，並證明了為什麼它是人工智慧市場無可爭議的領導者

2023/11/08

NVIDIA 的 H100 GPU 在人工智慧方面處於領先地位，該公司再次在 MLPerf 基準測試中創造了新記錄。

隨著 Hopper H100 GPU 實現破紀錄的 MLPerf 生成 AI 效能，NVIDIA 繼續保持 AI 領先地位

在 NVIDIA發布的最新 MLPerf 基準測試中，該公司強調他們創造了多項新記錄，其中Eos 超級電腦在短短3.9 分鐘內完成了基於GPT-3 模型的訓練基準，該模型在10 億個代幣上訓練了1750 億個參數。這與之前的記錄相比是一個巨大的進步，之前的記錄是超級電腦在 10.9 分鐘內完成了相同的基準測試，標誌著驚人的 3 倍提升。

現在，超級電腦所取得的成績確實是驚人的，但背後的主要原因是什麼？

簡而言之，NVIDIA 尖端的 Hopper GPU 架構與完善的軟體資源相結合。Eos 超級電腦目前採用 10,752 個 NVIDIA H100 Tensor Core GPU，取代了相當舊的 A100，這就是為什麼效能大幅提升的原因。此外，透過開發完善的軟體資源（例如有助於 LLM 培訓的NVIDIA NeMo），Team Green 成功地從其平台中榨取了卓越的功能。

此外，貼文中提到的NVIDIA另一項創紀錄的成就是在「系統擴展」方面取得的進步，透過各種軟體優化的幫助，該公司成功地展現了93%的效率。10,752 個 H100 GPU 遠遠超過了6 月AI 訓練的規模，當時 NVIDIA 使用了 3,584 個 Hopper GPU。高效擴展在業界非常重要，因為實現高運算能力需要使用更多的硬體資源，而如果沒有足夠的軟體支持，系統的效率會受到更大程度的影響。

NVIDIA 在 AI 產業中的作用意義重大，因為該公司有能力提供人類已知的最強大的 AI GPU（至少目前如此）。撇開財務方面不談，Green 團隊一直在快速開發其軟體資源，並與客戶合作，透過保持效率和穩定性來確保其產品組合提供最佳效能。

新聞來源：NVIDIA 博客

隨著 Hopper H100 GPU 實現破紀錄的 MLPerf 生成 AI 效能，NVIDIA 繼續保持 AI 領先地位

發佈留言 取消回覆

發佈留言取消回覆