當你 600 萬美元成本 10000張Nivdia 卡,$600 一張run AI 嘅 N卡邊度買?
javacomhk 發表於 2025-1-29 16:31 
先去看看原文再顛,560萬是是訓練出一個相同模型時提的數字,可沒有說設立伺服器的整體成本或程序的開發成本是560萬
有些無關行業的亂解讀,你隨便找個行業相關的報導就能理解,隨便找了個
Deepseek 仅用 2,048 个 GPU 运行了 57 天,在 Nvidia H800 芯片上使用了 278 万个 GPU 小时来训练其 6710 亿个参数的模型。
相比之下,Meta 需要 11 倍的计算能力(约 3080 万个 GPU 小时)来训练其 Llama 3 模型,该模型的参数较少,为 4050 亿个。
這裏的560萬指的是 2,048 个 GPU 运行了 57 天的成本 |