作者: godchoi 時間: 2025-1-28 19:02 標題: 特朗普讚 DeepSeek 對美國是好事 美國應視為警號,AI 一定要贏
本帖最後由 godchoi 於 2025-1-28 19:04 編輯
特朗普讚 DeepSeek 對美國是好事 美國應視為警號,AI 一定要贏

作者
Oscar
發佈日期
2025-01-28
近日中國新興人工智能公司 DeepSeek 推出一款成本較低的 AI 模型,引發美國股市大量拋售,導致劇烈暴跌。 Nvidia 等科技龍頭受影響尤其深遠。然而美國現任總統特朗普在接受訪問時視 DeepSeek 的發展為「正面進展」,並表示美國應該視之為警號。
DeepSeek 推出的 R1 先進推理模型,成為引發這場股市暴跌的根本原因。據外媒報道,R1 模型效能上可與 OpenAI o1 模型匹敵,甚至在數學任務、一般知識及問答表現上超越了競爭對手。DeepSeek 模型的低成本開發方式,令其在與美國科技巨頭如 Microsoft、Meta 等公司競爭時顯得更具優勢。尤其在美國出口管制下,DeepSeek 能夠在無需高端計算資源的情況下,達成如此出色的表現,令全球科技領域感到震驚。
DeepSeek 的推出在短短幾天內,便引發了美國股市的大規模拋售,尤其對多家大型科技公司影響甚鉅。DeepSeek 顯示中國在全球 AI 戰爭中崛起,同時也讓美國股市的投資者對未來的投資潛力產生了疑慮。許多美國公司,例如 Nvidia 必須消耗大量資源來支撐 AI 發展。Nvidia 的股價在 DeepSeek 發布後,於美國東部時間 1 月 27 日單日暴跌 17%。
雖然 DeepSeek 的崛起在短期內造成市場恐慌,分析師對其長期可持續性提出了質疑。Bernstein 分析師 Stacy Rasgon 報告指,DeepSeek 宣稱僅花費 560 萬美元(約港幣 4,361 萬元)開發該模型的說法並不準確,質疑數字未考慮到其他開發成本。此外分析師表示, DeepSeek 模型未來仍需面對來自美國的技術封鎖與出口管制等挑戰。
DeepSeek 的成功無疑加劇了美國科技股,尤其是在 AI 技術領域的競爭壓力。儘管特朗普和共和黨官員視此為促進美國 AI 發展的機會,但對於深度學習模型的開發者來說,這是一場持久的戰爭。隨著更多國際競爭者進入這一領域,AI 的未來無疑將變得更加多變,並對全球科技市場的影響更為深遠。
https://unwire.hk/2025/01/28/deepseek-rapid/ai/
via HKEPC Reader for Android
作者: freefdhk 時間: 2025-1-28 19:16
應該睇怕要打壓到勁過3050 既顯卡都要審查、限制出口。
作者: godchoi 時間: 2025-1-28 19:25
本帖最後由 godchoi 於 2025-1-28 19:26 編輯
睇黎閣下都好憎恨大陸.
我反而覺得正正有呢啲公司成功 將來嘅AI先可能更以低成本普及化 連一般大學都可以擁有自己嘅AI去做各式各樣推動人類科技嘅實驗同研究 總好過所有High-End科技嘢比一國壟斷及收取天價使用費
加上佢係開放資源 所以成件事係全球得益 除了美國之外
via HKEPC Reader for Android
作者: freefdhk 時間: 2025-1-28 20:00
何以見得我的言論有仇中,只係 5090 上架前爆單咁既野,一張卡都跑贏一個數據中心,
反而擔心會收緊到只能買 GT 1030 .
以前一隻磁碟放到隻Game 咁會節約資源,呢廿年既野真係大家鬥大食,
手機單機都跑到既 Local AI 算係造福人群。
作者: godchoi 時間: 2025-1-28 20:11
咁可能是我誤會了 抱歉
via HKEPC Reader for Android
作者: rabbit82047 時間: 2025-1-28 20:21
禁到1030係無任何意思,單純就只係叫 nv 唔好賣野去中國
禁到 4090 都攔唔到中國 AI 發展,再擴大禁令就只係自欺欺人
DeepSeek 係開源,大家都可以用,又拍得住唔 open 既 o1 model,你好我好
作者: Baggio3go 時間: 2025-1-29 00:53
點解你會覺得全球得益 除了美國之外??
而家好明顯除左nvidia 外, 幾間美國科技巨頭都得益, 成本下降, 資本開支可以大減
amazon/ meta 都岩岩股價創左新高
基本上最大得益既, 就係果幾間美國科技巨企
作者: Baggio3go 時間: 2025-1-29 00:56
其實 560 萬美元成本就一定係吹水架啦
140個人員, 10000張N卡, 二年時間 , 唔駛租唔駛人工都計唔掂啦
作者: Baggio3go 時間: 2025-1-29 01:00
人地DeepSeek 禁令前已經囤積左一大堆N卡, 所以老黃先咁夠膽話賣比DeepSeek 冇問題
你而加先去禁有鬼用, 人地一早入重貨啦
作者: godchoi 時間: 2025-1-29 01:48
我意思係講美國之前對中國嘅限售令無效 係國家政策失敗 並非單指個別公司
如果以公司計 應該係全球想發展AI嘅科技公司均會受益
via HKEPC Reader for Android
作者: javacomhk 時間: 2025-1-29 16:31
當你 600 萬美元成本 10000張Nivdia 卡,$600 一張run AI 嘅 N卡邊度買?
作者: Baggio3go 時間: 2025-1-29 17:13
DeepSeek 圑隊140人
佢計成本應該唔計買N卡錢, 唔計人工
作者: rabbit82047 時間: 2025-1-29 21:14
回覆 11# javacomhk
其實係計 GPU 既使用時數,公佈既係用左 H800 278.8萬工時
然後再以 H800 每工時 2美元租金計,結果就得出總訓練成本係五百幾萬美元
作者: s84292 時間: 2025-1-30 10:19
佢本身老闆係做ai 交易量化工具,佢係第一間做全自動ai 金融交易的公司
本身千億+資產管理
拎佢有個批h80/100 做訓練都唔奇, ai量化又唔洗咁大食
作者: VV 時間: 2025-1-30 11:07
本帖最後由 VV 於 2025-1-30 11:11 編輯
20240814 國產晶片|華為AI晶片「昇騰910C」傳最快10月推出 媲美NVIDIA H100 勢搶中國市佔 會唔會???
20250129 網民引述美媒《CNBC》 (CNBC 有咩出名自己諗, 依家加埋一個網民)
作者: rabbit82047 時間: 2025-1-30 14:01
回覆 15# VV
只要美國制裁持續,最終都一定要全套轉國產
始終手頭 n 記卡只係存貨,要繼續發展轉國產係必經階段
作者: VV 時間: 2025-1-30 15:27
其實依家最好笑係.....制裁下........黑化油太美 唔知你發展到咩階段同用緊咩技術.........
作者: ampm 時間: 2025-1-30 22:11
我發覺上年下半年內地對美國已改變了,應該有D嘢已自已攪惦了
作者: javacomhk 時間: 2025-1-30 22:38
本帖最後由 javacomhk 於 2025-1-30 15:19 編輯
原本真係作弊抄 OpenAI 嘅!
https://h2.hkepc.com/forum/attachment.php?aid=2462819&k=42490a9205ce668bbfd091b53a403abc&t=1781541351&sid=8MQqWwgqLR

作者: VV 時間: 2025-1-31 03:52
昇腾ing
作者: VV 時間: 2025-1-31 04:02
本帖最後由 VV 於 2025-2-1 08:59 編輯
AI界因果報應?OpenAI控DeepSeek盜數據 反被酸偷網路內容「活該」
隨著OpenAI指控中國新創深度求索(DeepSeek)盜用其模型進行開發,人工智慧領域的先驅與新秀之爭越演越烈。不過,華爾街日報29日刊登一則公開信,由一群自稱網路內容創作者致信OpenAI執行長奧特曼,大酸這是ChatGPT竊取別人成果「遭受報應」,重提ChatGPT「撞聲」好萊塢女星史嘉蕾喬韓森事件,直言OpenAI同樣迴避訓練數據的問題。
這封公開信署名為「世界各地的文字工作者、藝術家、電影創作者等」,開頭先調侃OpenAI指控DeepSeek擅自使用其AI工具打造、訓練自己的產品一事「很有趣」。
信中寫道:「嗯,竊取別人的成果!那句話怎麼說來著?因果報應是......(Karma’s a...)。你懂的,如果你不理解,GPT-4可以為你補全這個句子」
儘管致信者話接著肯認OpenAI、奧特曼努力彌補那些為創造ChatGPT模型提供燃料的人,包含與各家新聞媒體、出版商達成協議,諸如華爾街日報、金融時報等。不過,還有許多藝術家和組織正在對公司提起訴訟。隨後來一句:「那麼,史嘉蕾喬韓森的事情如何了?」
致信者到此話鋒一轉表示:「但是你依然迴避關於訓練數據的問題。記得你的前技術官被問到使用YouTube數據時,她回答『我其實不確定』。」
信中再問及OpenAI提出的「媒體管理人工具」(Media Manager),承諾創作者和內容所有者可以表達「希望自己的作品如何被納入或排除在機器學習研究和訓練中」。但是,當一名華爾街日報專欄記者問及此事,產品官維爾(Kevin Weil)卻回答:「我們還在努力開發,有更多可以說的時候會再說。」
最後,致信者拋下一句:「如果DeepSeek開發一套讓你能選擇自己數據不被使用的工具,我們想你應該會......現在就想要它吧。」
信中還附言:「隨意用這封信訓練你的AI吧。看吧?許可!」
諗起真西方大英博物館
作者: Baggio3go 時間: 2025-1-31 04:25
所以我感覺未來中國AI 超越歐美AI 係遲早既事
歐美要訓練AI , 一陣又話有版權問題, 一陣又話有人權問題, 一陣又會用戶私隱問題
起中國, 直頭用你訓練成果你都吹佢唔脹, 什麼版權人權私隱原全唔係問題
遲D等國民黨當選, 成個台灣食埋, 我就唔信一個民主選舉, 國民黨會一次都贏唔到, 只要一次就夠, 就時台積電就係中國, 連晶片都搞掂埋
回覆 21# VV
作者: VV 時間: 2025-1-31 05:00
本帖最後由 VV 於 2025-1-31 05:32 編輯
歐美 有既咩?? 佢地有既最出名 標標 , 人權問題 可以 問下加沙問下聯合國.....
btw, tiktok 之前都係咁......
依家民進黨當選, 等黑化油太美成個台灣食埋先算......仲有美積電 晶片生意
版權問題
信中再問及OpenAI提出的「媒體管理人工具」(Media Manager),承諾創作者和內容所有者可以表達「希望自己的作品如何被納入或排除在機器學習研究和訓練中」。但是,當一名華爾街日報專欄記者問及此事,產品官維爾(Kevin Weil)卻回答:「我們還在努力開發,有更多可以說的時候會再說。」
作者: Baggio3go 時間: 2025-1-31 05:50
歐洲就真係算把啦, 仲係左膠當道, 譴責過咁多次, 都唔覺得佢地會出兵
台灣油就應該唔係問題既, 我所知佢地有大量儲備, 你比黑化油佢都唔會有大影響
國民黨今年玩到咁, 全部野同市民作對, 大約兩屈後先會有機會, 我都有信心只要民進黨做錯少少野, 國民黨就會有機會, 只係唔知要等幾耐, 都時台積電就手到拿來
作者: godchoi 時間: 2025-1-31 06:34
本帖最後由 godchoi 於 2025-1-31 06:36 編輯
其實歐美來來去去都係嗰幾招:
領先緊你時-限購限售 唔比你有機會公平競爭追上佢哋
當被追上時-用文宣 打手 抹黑 污名化等 去貶低你嘅成功
當被超越時-例如華為5G 太陽能板 電動車等 就 加關稅 立法禁止 甚至虜人勒索等手段 已經睇到麻木晒
認真呢幾年真係睇到歐美赤裸裸嘅手段同虛偽面孔
via HKEPC Reader for Android
作者: VV 時間: 2025-1-31 09:48
跟尾 民進黨 有14509 2700傻鳥9....自然有 民主AI晶片, 加埋有隻小鷹用 愛"Ài" 發電, 美積電 等 perfect match 啦....佢地食住進口萊豬等 民主AI晶片
作者: 視帝 時間: 2025-1-31 19:11
提示: 作者被禁止或刪除 內容自動屏蔽
作者: godchoi 時間: 2025-2-1 19:36
但係而家連Nvidia都宣佈DeepSeek-R1可搭載Nvidia NIM使用
原文網址: 英偉達順水推舟? 宣布DeepSeek-R1可搭載Nvidia NIM使用 | 香港01
https://www.hk01.com/%E5%8D%B3%E6%99%82%E5%9C%8B%E9%9A%9B/1098974/%E8%8B%B1%E5%81%89%E9%81%94%E9%A0%86%E6%B0%B4%E6%8E%A8%E8%88%9F-%E5%AE%A3%E5%B8%83deepseek-r1%E5%8F%AF%E6%90%AD%E8%BC%89nvidia-nim%E4%BD%BF%E7%94%A8#google_vignette
via HKEPC Reader for Android
作者: VV 時間: 2025-2-2 07:47
yt 留言見到 (org eng 的)
China does it, its called copying/cheating...USA/Western Country does it, its called "Knowledge Sharing".
中國這樣做,這被稱為抄襲/欺騙……美國/西方國家這樣做,這被稱為“知識共享”。
作者: kcthomlau 時間: 2025-2-2 21:57
浸浸講野不嬲掉轉講
作者: jacktsui 時間: 2025-2-3 09:08
天下數據一大抄
不過講明自己抄就核突左少少

作者: VV 時間: 2025-2-3 11:04
新的角度思考DeepSeek帶來的爭議
[youtube]ATFpE7LgMuo[/youtube]
作者: godchoi 時間: 2025-2-3 20:53
已經變為事實了
DeepSeek|全套國產來了! 華為雲與硅基流動發布推理服務
via HKEPC Reader for Android
作者: penay 時間: 2025-2-6 16:32
高手在民間真正彎道超車。。
好多孫文黑心鬼唔抵得不斷抹黑。
事實證明有好嘅軟件先至可以發揮硬件性能
作者: ampm 時間: 2025-2-6 18:10
SAP SE (SAP): Adding DeepSeek to SAP’s AI Hub
又有人開發deepsearch opensource 板。
作者: 一隻人 時間: 2025-2-7 10:38
先去看看原文再顛,560萬是是訓練出一個相同模型時提的數字,可沒有說設立伺服器的整體成本或程序的開發成本是560萬
有些無關行業的亂解讀,你隨便找個行業相關的報導就能理解,隨便找了個
Deepseek 仅用 2,048 个 GPU 运行了 57 天,在 Nvidia H800 芯片上使用了 278 万个 GPU 小时来训练其 6710 亿个参数的模型。
相比之下,Meta 需要 11 倍的计算能力(约 3080 万个 GPU 小时)来训练其 Llama 3 模型,该模型的参数较少,为 4050 亿个。
這裏的560萬指的是 2,048 个 GPU 运行了 57 天的成本
作者: javacomhk 時間: 2025-2-7 11:02
梗係啦, 呢樣又唔計嗰樣又唔計,唔使錢啦,阿爺比架嘛。
作者: jasonchanwf 時間: 2025-2-7 12:54
提示: 作者被禁止或刪除 內容自動屏蔽
作者: jacktsui 時間: 2025-2-7 14:08
仲有 0 ->1 既成本當然比1->2 高
via HKEPC Reader for Android
作者: javacomhk 時間: 2025-2-7 15:07
本帖最後由 javacomhk 於 2025-2-7 08:49 編輯
所以我覺得就係使乜用呢的語言偽述呀,直接的講:係呀我蒸餾你的訓練數據用呀,唔使錢用咗你的晶片 run 呀,電費平過你,人工平過你,吹呀! 我項目用600萬美金都唔夠你 OpenAI 一個高管一年人工啦。
作者: godchoi 時間: 2025-2-9 18:13
世事邊度有咁簡單嫁?真係咁容易做嘅話 又唔見日本 韓國 星加坡 印度等國家可以出倒個Deepseek出黎?人哋其他國家都要無芯片禁令添
就算歐盟國家法國個Lucie都因為上架後發覺錯漏百出而三幾日就要下架
https://ezone.hk/article/20055434/%E6%B3%95%E5%9C%8B-ai-%E8%81%8A%E5%A4%A9%E6%A9%9F%E6%A2%B0%E4%BA%BA-lucie-%E8%A2%AB%E5%81%9C%E7%94%A8-%E6%9C%89%E6%94%BF%E5%BA%9C%E6%92%90%E8%85%B0%E9%83%BD%E7%84%A1%E7%94%A8
via HKEPC Reader for Android
作者: ampm 時間: 2025-2-9 23:08
未爆出deepseek之前,內地的大模型公司打生打死,好多唔見咗或無乜聲氣了。文心丶商湯,和01已落後了半年有多,最後先跑出一隻deepseek,相對背景無咁有$後台。都希望佢地繼續有新的product推出,而令到一般user可以用到。
作者: jasonchanwf 時間: 2025-2-11 13:33
提示: 作者被禁止或刪除 內容自動屏蔽
作者: ckyuen2 時間: 2025-2-11 17:58
前列外圍仲有qwen/豆包/kimi果個梯隊
點睇都比起剛剛放出嚟果個Le Chat好太多

當然後者可能sell法文啩
唔識無得評
作者: ronimos 時間: 2025-2-12 10:40
中國追得這麼快原因可能很簡單,中文只需用英文7成token在同一文本。
追上來就很簡單
以下是Copilot 的分析:
要比較BBC新聞中英文平行文本的token數差異,我們可以使用一些公開的平行語料庫來進行分析。這些語料庫通常包含大量的中英文對照文本,適合用來進行這類比較。
示例分析
假設我們從BBC新聞中隨機選取10個中英文平行文本,並使用常見的tokenizer進行token數量的計算。以下是一些可能的結果:
新聞標題1
中文:50個token
英文:70個token
新聞標題2
中文:45個token
英文:65個token
新聞標題3
中文:55個token
英文:75個token
新聞標題4
中文:60個token
英文:80個token
新聞標題5
中文:52個token
英文:72個token
新聞標題6
中文:48個token
英文:68個token
新聞標題7
中文:53個token
英文:73個token
新聞標題8
中文:57個token
英文:77個token
新聞標題9
中文:49個token
英文:69個token
新聞標題10
中文:54個token
英文:74個token
平均比例
根據上述示例,我們可以計算出中英文token數量的平均比例:
中文平均token數:50.3
英文平均token數:72.3
這樣,中英文token數量的平均比例約為 50.3:72.3,即 1:1.44。這意味著,英文文本的token數量大約是中文文本的1.44倍。
這只是簡單的示例,實際情況會因文本的具體內容和tokenizer的不同而有所變化。如果你有具體的文本或需要更詳細的分析,可以提供文本,我可以幫助進行更精確的計算。
作者: ampm 時間: 2025-2-12 16:53
本帖最後由 ampm 於 2025-2-12 17:18 編輯
受益了!原来中文在AI 是有jetso....
.
另外在YT睇了一位意大佬对DS睇法. 简约摘要
* DeepSeek R1 Zero 的突破:
R1 Zero 模型通过强化学习 (Reinforcement Learning),自主学习到 Chain of Thought 的能力,而无需任何监督式学习 (Supervised Learning) 的范例。这项突破改变了传统的 scaling law,显示数据质量比数据数量更重要。
*强化学习的重要性:
影片详细解释了强化学习的机制,以及其在不同应用场景中的潜力,例如优化函数速度、解决各种优化问题等。
模型大小与强化学习的关系:
影片指出,大型 LLM 仍然具有优势,但强化学习可以弥补数据不足的问题,让模型在有限数据下也能取得突破性进展。
作者: ronimos 時間: 2025-2-12 17:53
回覆 46# ampm
中文比英文更易出現OOV, 但中文比英文更易應對OOV,在推理時也有優勢。中文最難的分詞,在這10幾年時已經解決得7788。
以下是Copilot 分析:
在降低OOV(Out-Of-Vocabulary)比例方面,中文和英文有一些显著的区别:
1. **分词处理**:
- **中文**:由于中文没有明确的单词边界,分词是一个重要的预处理步骤。使用更好的分词算法可以显著减少OOV的出现[1](https://www.cnblogs.com/miners/p/14984990.html)。
- **英文**:英文单词之间有空格分隔,分词相对简单,因此OOV问题主要依赖于词汇表的大小和覆盖率[2](https://www.zhihu.com/question/55172758)。
2. **子词单元**:
- **中文**:使用子词单元(如BPE或WordPiece)可以有效减少OOV,因为中文字符本身就具有一定的语义信息[1](https://www.cnblogs.com/miners/p/14984990.html)。
- **英文**:同样可以使用子词单元,但英文的词根、前缀和后缀的组合相对固定,效果可能不如中文显著[2](https://www.zhihu.com/question/55172758)。
3. **字符级模型**:
- **中文**:字符级模型在中文中非常有效,因为每个汉字都有独立的意义,即使是未知词也可以通过字符组合来理解[1](https://www.cnblogs.com/miners/p/14984990.html)。
- **英文**:字符级模型在处理拼写错误和新词方面也有优势,但由于英文单词的长度和结构,处理起来可能更复杂[2](https://www.zhihu.com/question/55172758)。
4. **动态词表**:
- **中文**:动态词表可以根据上下文动态更新,特别适用于处理新词和罕见词[1](https://www.cnblogs.com/miners/p/14984990.html)。
- **英文**:同样可以使用动态词表,但由于英文词汇的固定性,效果可能不如中文明显[2](https://www.zhihu.com/question/55172758)。
总体来说,中文在降低OOV比例方面的挑战主要在于分词和字符的多样性,而英文则更多依赖于词汇表的覆盖率和处理拼写变体的能力。如果你有具体的应用场景或进一步的问题,欢迎随时告诉我!
[1](https://www.cnblogs.com/miners/p/14984990.html): [NLP之文本摘要](https://www.cnblogs.com/miners/p/14984990.html)
[2](https://www.zhihu.com/question/55172758): [NLP 研究主流目前如何处理 out of vocabulary words](https://www.zhihu.com/question/55172758)
作者: JASV 時間: 2025-2-22 00:04
假呀!
作者: usei 時間: 2025-2-24 17:42
外國可以抄返你來降低成本
外國用返外國版 deepseek 無問題
不會有咩優勢
作者: big_nature 時間: 2025-2-25 13:40
Deepseek真係唔錯!


