GPU 服務器規格參數眾多,FP32、TF32、NVLink、IB 網絡...這些都是什麼意思?這篇文章幫你快速理解。
一、精度類型
- FP32(單精度):傳統精度,通用計算
- FP16(半精度):AI 訓練常用,速度更快
- BF16:Google 提出,適合深度學習
- INT8/INT4:量化推理,速度極快
二、顯存類型
- GDDR6X:消費級,如 RTX 4090
- HBM2e:數據中心級,如 A100
- HBM3:最新一代,如 H100/H200
三、互連技術
- NVLink:NVIDIA 多卡互連,帶寬高達 600GB/s
- PCIe 4.0/5.0:標準擴展接口
- InfiniBand:高速網絡,適合集群
四、交付形式
- 容器實例:輕量化,秒級部署
- 裸金屬:物理服務器,性能最強
- 虛擬機:傳統雲服務器模式