天下數據一大抄
不過講明自己抄就核突左少少

TOP

新的角度思考DeepSeek帶來的爭議

TOP

回覆  VV


    只要美國制裁持續,最終都一定要全套轉國產
始終手頭 n 記卡只係存貨,要繼續發展轉國產係 ...
rabbit82047 發表於 2025-1-30 14:01

已經變為事實了

DeepSeek|全套國產來了! 華為雲與硅基流動發布推理服務

via HKEPC Reader for Android

TOP

高手在民間真正彎道超車。。
好多孫文黑心鬼唔抵得不斷抹黑。
事實證明有好嘅軟件先至可以發揮硬件性能

TOP

SAP SE (SAP): Adding DeepSeek to SAP’s AI Hub


又有人開發deepsearch opensource 板。

TOP

當你 600 萬美元成本 10000張Nivdia 卡,$600 一張run AI 嘅 N卡邊度買?
javacomhk 發表於 2025-1-29 16:31



先去看看原文再顛,560萬是是訓練出一個相同模型時提的數字,可沒有說設立伺服器的整體成本或程序的開發成本是560萬
有些無關行業的亂解讀,你隨便找個行業相關的報導就能理解,隨便找了個
    Deepseek 仅用 2,048 个 GPU 运行了 57 天,在 Nvidia H800 芯片上使用了 278 万个 GPU 小时来训练其 6710 亿个参数的模型。
    相比之下,Meta 需要 11 倍的计算能力(约 3080 万个 GPU 小时)来训练其 Llama 3 模型,该模型的参数较少,为 4050 亿个。
這裏的560萬指的是 2,048 个 GPU 运行了 57 天的成本

TOP

先去看看原文再顛,560萬是是訓練出一個相同模型時提的數字,可沒有說設立伺服器的整體成本或程序的開發 ...
一隻人 發表於 2025-2-7 02:38


梗係啦, 呢樣又唔計嗰樣又唔計,唔使錢啦,阿爺比架嘛。

TOP

提示: 作者被禁止或刪除 內容自動屏蔽

TOP

梗係啦, 呢樣又唔計嗰樣又唔計,唔使錢啦,阿爺比架嘛。
javacomhk 發表於 2025-2-7 11:02

仲有  0 ->1 既成本當然比1->2 高

via HKEPC Reader for Android

TOP

本帖最後由 javacomhk 於 2025-2-7 08:49 編輯

所以我覺得就係使乜用呢的語言偽述呀,直接的講:係呀我蒸餾你的訓練數據用呀,唔使錢用咗你的晶片 run 呀,電費平過你,人工平過你,吹呀! 我項目用600萬美金都唔夠你 OpenAI 一個高管一年人工啦。

TOP