或者 Nvidia DGX Spark 吧,始終 CUDA 有市場
fakeman 發表於 2026-3-29 02:11 
DGX Spark memory bandwidth更低, 算力更弱, 行MoE model玩玩可以, activate 個位數字B嘅parameters, 行Dense 20B以上嘅話太慢, 就算唔要求interactive但都慢到好難搞
Arc Pro B70 出來了
usei 發表於 2026-3-27 11:45 
今次Intel都算係咁, 自己包辦咗套docker image俾B60/B70去用, 有vLLM, ComfyUI, SGLang等等
https://github.com/intel/llm-scaler
但都幾kick嘅係 model受限, 最新都係support到Qwen 3.5/3.6, Gemma 4都未有, 如果指定要用Qwen 3.5/3.6咁都還好, 但想試llama.cpp就要靠街外指導先得, 仲慢過AMD
https://github.com/ChrisTitusTech/gemma4-intelb70-archsetup |