Daily Briefing
2026-06-02 AI Daily
5 則 AI 技術與產品重點:MiniMax M3 強化 coding 與 1M context、NVIDIA Cosmos 3 推出 open omni-model、NVIDIA Alpamayo 2 Super 釋出 32B VLA、JetBrains 開源 Mellum2 12B MoE、ClawHub 發布 agent skill 安全資料集
01 / Model
MiniMax M3 強化 coding 與 1M context
MiniMax 發表 M3,主打 1M context、前沿 coding 與 agentic 能力,並以原生多模態混合訓練支援文字與圖像等輸入。它在 SWE-Bench Pro、Terminal Bench、KernelBench、MCP Atlas 等評測列出具體成績,也強調用互動式使用者模擬器訓練模型,讓 coding agent 更貼近真實工程協作。
關鍵影響:coding model 競爭轉向長期協作
來源:MiniMax Research - MiniMax M3
02 / Physical AI
NVIDIA Cosmos 3 推出 open omni-model
NVIDIA 在 Hugging Face 發布 Cosmos 3,定位是給 robotics、自駕與 smart spaces 使用的 open world foundation model。這次的重點是 omni-model 架構,把 world generation、physical reasoning 與 action generation 放進同一個模型,並提供 Nano 與 Super 兩種版本、Diffusers 整合與 GitHub post-training scripts。
關鍵影響:physical AI 開放模型開始整合生成、推理與行動
來源:Hugging Face - Welcome NVIDIA Cosmos 3
03 / Autonomy
NVIDIA Alpamayo 2 Super 釋出 32B VLA
NVIDIA 發表 Alpamayo 2 Super,這是一個 32B reasoning-based vision language action model,面向 L4 robotaxi 的感知、推理、規劃與行動。同步推出的 AlpaGym、OmniDreams 與 Omniverse NuRec 相關工具,讓開發者能用 closed-loop reinforcement learning、scenario generation 與 fleet data reconstruction 改進長尾場景訓練。
關鍵影響:自駕 AI 工具鏈補齊 closed-loop 訓練
04 / Open Model
JetBrains 開源 Mellum2 12B MoE
JetBrains 發布 Mellum2,這是從零訓練的 12B Mixture-of-Experts text-and-code model,每個 token 啟用 2.5B 參數,採 Apache 2.0 授權。官方把它定位為高頻、低延遲的 focal model,可用在 routing、RAG、summarization、sub-agents、高吞吐 coding features 與 private deployment。對 AI 工程團隊來說,這反映 production agent stack 正走向多模型分工,用較小但專門的模型承擔常見子任務。
關鍵影響:agent stack 會更常用專門小模型處理高頻任務
來源:Hugging Face - Introducing Mellum2
05 / Security
ClawHub 發布 agent skill 安全資料集
OpenClaw 發布 ClawHub Security Signals,整理 67,453 個公開 agent skill 版本,包含 redacted SKILL.md、sanitized bundled files、ClawScan verdicts,以及 VirusTotal、static heuristic analysis、NVIDIA SkillSpector 等掃描證據。資料集聚焦多個 scanner 對 agent skill 風險的結構化分歧,可支援 multi-signal triage 與供應鏈安全評估。
關鍵影響:agent skill 安全需要多訊號資料集
來源:Hugging Face - ClawHub Security Signals