【生活中心/綜合報導】Meta Platforms今天(9日)天揭曉備受矚目的人工智慧(AI)模型Muse Spark,這是去年Meta為追趕對手OpenAI,所斥資組建「超級智慧實驗室」(Meta Superintelligence Labs)」的首張成績單。
這款體積小、速度快的AI模型,多模態感知、視覺生成能力十分強大,使用者拍下餐食照上傳,Muse Spark就能辨識商品規格、分析食物的營養成分、計算出預估熱量等。

Muse Spark體積小、速度快 「深思模式」抗衡對手
Meta表示:「這款初始模型設計上追求體積小、速度快,仍具備足夠能力推理科學、數學和健康領域的複雜問題;它是一個強大的基礎,而下一代產品已在開發中。」
此外,模型有「深思模式(Contemplating Mode)」,透過同時執行多個代理程式來提升推理能力,例如規劃家庭旅遊,它能同時啟動多個「子代理程式 (subagents)」,分別負責安排行程、比較景點與搜尋活動,大幅縮短運算時間並提供更完善的解答。這也使得Muse Spark能與Google的Gemini Deep Think和 OpenAI的GPT Pro等深度思考模式相抗衡。

優勢:多模態感知、視覺生成 劣勢:程式設計、抽象推理
Muse Spark不侷限於文字訊息對話,具備強大的「多模態感知(Multimodal Perception)」能力,用「看」就能懂世界。拍下餐食照,Muse Spark就能辨識商品規格、分析食物的營養成分、計算出預估熱量,Meta還特別與醫師團隊合作,開發能看懂健康圖表、提供醫療相關的參考資訊。
此外,「視覺化程式設計(Visual Coding)」的表現也相當優異,只需輸入簡單的文字指令,就能瞬間生成客製化網站,或是直接寫出一款簡單有趣的小遊戲。
獨立評估顯示,該模型在語言與視覺理解方面已接近市場領導者,如 Google、OpenAI、Anthropic),不過程式設計與抽象推理方面仍有差距,整體排名並列第4。

目前僅限美國使用 採「私人預覽」開源轉向更封閉
新模型目前僅在美國推出,與先前優先開發開放原始碼模型的策略不同,Muse Spark初期僅於Meta AI應用程式與網站提供,並採「私人預覽」形式開放給部分合作夥伴,顯示公司正從過去「開源」策略轉向更「封閉」模式。
Muse Spark最初將在Meta AI應用程式提供,但很快就會全面驅動WhatsApp、Facebook及Meta智慧眼鏡的各項 AI功能,觸及超過35億用戶。
在商業模式上,Meta正探索將AI與電商整合,例如在聊天機器人中嵌入購物功能,引導用戶直接購買商品。
Holy smokes! Meta AI strikes back with Muse Spark. It’s SOTA on quite a few benchmarks! What excited me the most was the contemplation mode, if true this is big! :
“We’re also releasing Contemplating mode, which orchestrates multiple agents that reason in parallel. This allows… https://t.co/KRaMh6vi2A pic.twitter.com/evZ34jB6td
— Derya Unutmaz, MD (@DeryaTR_) April 8, 2026

