電腦領域 HKEPC Hardware - Powered by Discuz! Board

標題: M4 Mac Mini算唔算SoC？玩Local LLM係唔係佢粒M4最實際？ [打印本頁]

作者: ntony 時間: 2025-6-28 19:07 標題: M4 Mac Mini算唔算SoC？玩Local LLM係唔係佢粒M4最實際？

本帖最後由 ntony 於 2025-6-28 19:12 編輯

M4 Mac Mini成部機乜都齊，個價錢同自己加呢樣嗰樣去增加個token/second。係唔係直接一部M4 Mac Mini順手又萬用，又好似慳少少電。

我自己就主要係想做inferencing，用Ollama或者llama.cpp有OpenAI嘅API layer去自己試驗下寫AI application。

我諗呢個group有玩local LLM嘅高手應該有考慮過呢個方案。會唔會有咩分析同心得分享下？

作者: john_linux 時間: 2025-6-28 22:42

M4 Mac Mini成部機乜都齊，個價錢同自己加呢樣嗰樣去增加個token/second。係唔係直接一部M4 Mac Mini順手又萬用，又好似慳少少電。

我自己就主要係想做inferencing，用Ollama或者llama.cpp有OpenAI嘅API layer去自己試驗下寫AI application。

我諗呢個group有玩local LLM嘅高手應該有考慮過呢個方案。會唔會有咩分析同心得分享下？
ntony 發表於 2025-6-28 07:07 PM

錯區
Mac mini係唔係SoC都好，都同單板電腦無關
建議改去系統組件或者蘋果國度

作者: john_linux 時間: 2025-6-28 22:53

本帖最後由 john_linux 於 2025-6-28 22:59 編輯

M4 Mac Mini成部機乜都齊，個價錢同自己加呢樣嗰樣去增加個token/second。係唔係直接一部M4 Mac Mini順手又萬用，又好似慳少少電。

我自己就主要係想做inferencing，用Ollama或者llama.cpp有OpenAI嘅API layer去自己試驗下寫AI application。

我諗呢個group有玩local LLM嘅高手應該有考慮過呢個方案。會唔會有咩分析同心得分享下？
ntony 發表於 2025-6-28 07:07 PM

Any肥
作為Mac mini M4 Pro（CPU 10P4E/GPU 20-core/64GB RAM）用家，佢粒GPU行AI都係慢（用Ollama行command-r:35b只有12 token/s）
所以要b數大定係速度快就睇你預算

要行b數大嘅model就買Mac
要行得快就買Nvidia

作者: ntony 時間: 2025-6-29 00:28

本帖最後由 ntony 於 2025-6-29 00:32 編輯

多謝分享！

我考慮過有玩SoC嘅高手會有其他SoC local行AI model嘅經驗。雖然我明白SoC非常唔合適，起碼無得加memory。但砌一部機去行local AI model或者open source LLM model，真係無乜好討論。
如果唔使計成本，唔使理耗電，我都識自己去買兩塊nVidia咭用LXC或Docker image去開埋CUDA玩。

蘋果國度班group友真係有咁多人會用Apple機為咗行local AI model？

command-r:35b只有12 token/s

行35b有12 t/s都算係咁。

作者: john_linux 時間: 2025-6-29 01:26

本帖最後由 john_linux 於 2025-6-29 01:31 編輯

行35b有12 t/s都算係咁
ntony 發表於 2025-6-29 12:28 AM

12 token/s 就滿足真係好幸福

畀多少少實測數據
Llama3.3:70b=5 token/s
Llama4=唔好諗
R1-1776:70b=5 token/s
Gemma3:12b=26 token/s

自己試吓先
https://tokens-per-second-visualizer.tiiny.site/

作者: kenken33 時間: 2025-6-29 01:52

本帖最後由 kenken33 於 2025-6-29 01:56 編輯

行模型最緊要係記憶體頻寬，MAC MINI 唔係比你玩AI，係文書上網機
mac studio啦，入門萬6 410GB/s 記憶體頻寬 36GB RAM，再上一級3皮2 就M3 Ultra 819GB/s 96GB一般都夠晒玩, 已經係接近5070TI 既記憶體頻寬，96GB都唔夠就打爆512GB 佢，已經係行到原生AI大模型最平嘅機。

作者: ntony 時間: 2025-6-30 03:27

12 token/s 就滿足真係好幸福

畀多少少實測數據
Llama3.3:70b=5 token/s
Llama4=唔好諗
R1-1776 ...
john_linux 發表於 2025-6-29 01:26

我睇Digital Spaceport砌咁多機，就算用Xeon或者直接插3090 24GB VRAM都只係快少少。
不過我覺得要有用，條baseline起碼要用Llama3.3:70b或者Gwen3 335b，DeepSeek R1 671b已經係好好用嘅model。有10 t/s速度，咁一般回覆都係幾分鐘左右。

作者: normalyan 時間: 2025-6-30 10:02

text prompt冇乜所謂啦, 又唔係趕時間

你話如果image gen就一定唔得啦！要等兩三日一幅相

作者: ntony 時間: 2025-6-30 17:28

text prompt冇乜所謂啦, 又唔係趕時間

你話如果image gen就一定唔得啦！要等兩三日一幅相 ...
normalyan 發表於 2025-6-30 10:02

無錯

唔係image或video generation，又唔係image或voice to text，真係無急得咁緊要嘅。咁急就只能使錢。

正如做一般software development都唔會用部十萬銀嘅機去做unit test同build from source。

作者: ntony 時間: 2025-6-30 17:35

行模型最緊要係記憶體頻寬，MAC MINI 唔係比你玩AI，係文書上網機
mac studio啦，入門萬6 410GB/s 記憶體頻 ...
kenken33 發表於 2025-6-29 01:52

雖然仁兄您講緊嘅可能係事實。
Apple自己唔係咁講。我知HKEPC要用十萬蚊嘅文書機去send email嘅。而家變得好合理丫，要local LLM inferencing幫手寫email，咁緊係要插張5090落去幫手下，雖然直接用AI card會更加快。

作者: madebyp90 時間: 2025-6-30 17:39

行模型最緊要係記憶體頻寬，MAC MINI 唔係比你玩AI，係文書上網機
mac studio啦，入門萬6 410GB/s 記憶體頻 ...
kenken33 發表於 2025-6-29 01:52

用緊 m4 max 64/1T
$22xxx

同價而家可以5080
只係64G ram vs 16GB

如果玩大陸魔改display
可以48G ram

via HKEPC IR 5.1.14 - iOS(5.1.1F)

作者: kenken33 時間: 2025-6-30 20:14

本帖最後由 kenken33 於 2025-6-30 20:15 編輯

雖然仁兄您講緊嘅可能係事實。
Apple自己唔係咁講。我知HKEPC要用十萬蚊嘅文書機去send email嘅。而家變 ...
ntony 發表於 30-6-2025 17:35

聽APPLE講

，APPLE夠話佢個Apple Intelligence好巴閉同IPAD可以取代電腦，結果係點大家有眼睇

幫手寫email就用ChatGPT、Google Gemini 啦，PCCW 客都免費有Perplexity Pro用，怕資料外洩一定要offline行但又唔肯洗錢咁幫唔到你

作者: ntony 時間: 2025-6-30 22:25

本帖最後由 ntony 於 2025-6-30 22:29 編輯

回覆 12# kenken33

Apple Intelligence係屎。
iPad可以取代電腦某程度上可以同意，視乎點樣定義電腦。

小弟人不在香港、英國、美國，我有用ChatGPT、Grok 3、Claude、Gemini、HuggingChat，等等。
我無話因為怕資料外洩而想要行Local LLM。
我唔係唔肯使錢丫，就算只係買塊RPi5加個AI module都係要錢，莫講話M4 Mac Mini。至於如果話肯唔肯使大筆錢，咁都要睇目標、原因、需要。有錢唔等於要九唔搭八咁去使，呢種行為反而只係窮鬼先會做。

Apple起M3同M4上面加入AI processor係因為edge AI。行低耗電都可以又快又足夠應付小助手級嘅細model或特定train出來嘅model。呢樣嘢而家好多公司同地方都做緊唔同嘅試驗同摸索。

我而家唔係要買隻私人飛機用來渡假。Bill Gate都無私人飛機，亦唔買Business Class。HKEPC呢度邊個有錢得過佢？

作者: kenken33 時間: 2025-6-30 23:09

回覆 kenken33

Apple Intelligence係屎。
iPad可以取代電腦某程度上可以同意，視乎點樣定義電腦。

小弟人不在香港、英國、美國，我有用ChatGPT、Grok 3、Claude、Gemini、HuggingChat，等等。
我無話因為怕資料外洩而想要行Local LLM。
我唔係唔肯使錢丫，就算只係買塊RPi5加個AI module都係要錢，莫講話M4 Mac Mini。至於如果話肯唔肯使大筆錢，咁都要睇目標、原因、需要。有錢唔等於要九唔搭八咁去使，呢種行為反而只係窮鬼先會做。

Apple起M3同M4上面加入AI processor係因為edge AI。行低耗電都可以又快又足夠應付小助手級嘅細model或特定train出來嘅model。呢樣嘢而家好多公司同地方都做緊唔同嘅試驗同摸索。

我而家唔係要買隻私人飛機用來渡假。Bill Gate都無私人飛機，亦唔買Business Class。HKEPC呢度邊個有錢得過佢？
ntony 發表於 30-6-2025 22:25

咁你繼續對住M4打飛機啦，我公司都係探索緊不過係入咗部打爆512GB RAM既mac studio去探索囉

M4對我嚟講就係一部慳電文書機，我另外有5090 +5070TI PC 去行本地AI應用

比爾·蓋茨（Bill Gates）擁有的私人飛機主要是龐巴迪BD-700 Global Express（全球快車），這是一款頂級超遠程公務機，以其舒適性、速度和遠航程著稱。
主要資訊如下：
• 機型：龐巴迪BD-700 Global Express（又稱「全球快車」）
• 乘客容量：可容納約19名乘客
• 航程：超長續航能力，幾乎可飛到全球任何地方
• 價值：約4500萬美元（依不同配置和年份有差異）
• 特點：機艙寬敞、設施豪華、飛行速度快、可在小型機場起降，被稱為「空中辦公室」
• 用途：主要用於商務旅行和家庭出行
此外，也有資料提到比爾·蓋茨可能擁有其他型號的私人飛機，例如Gulfstream G650，但根據主流媒體和航空資訊，龐巴迪BD-700 Global Express是其最具代表性的私人飛機。
一些報導曾提及蓋茨還擁有一架波音737，但這類消息較少且未獲官方確認。目前最可靠且廣泛報導的機型仍是龐巴迪BD-700 Global Express。

擁私人飛機談氣候變化被批虛偽　比爾蓋茨這樣回應

原文網址: 擁私人飛機談氣候變化被批虛偽　比爾蓋茨這樣回應 | 香港01 https://www.hk01.com/article/864 ... utm_medium=referral

作者: chue 時間: 2025-7-1 03:43

算,同埋原生MAC 個 SAMBA 超掂,唔需要玩另裝,佢粒 U 都未必支援