Daily Briefing
2026-05-28 AI Daily
6 則 AI 技術與產品重點:Cisco:frontier model 仍怕多輪攻擊、OpenAI 展示 self-improving tax agents、Anthropic 拆解 Claude containment、Microsoft 發布 MAI-Image-2.5、Hugging Face 降低 RL 權重同步成本、Reachy Mini 對話 stack 改成本地執行
01 / Safety
Cisco:frontier model 仍怕多輪攻擊
Cisco AI Defense 發布 proprietary model 多輪攻擊評估,測試 15 個來自 OpenAI、Anthropic、Google、Amazon 與 xAI 的閉源模型。研究指出 single-turn ASR 無法代表攻擊者會逐步改寫、拆解與升級 prompt 的真實情境,多輪 ASR 落在 7.89% 到 88.30%。對企業採購與部署模型來說,重點是把多輪、策略分層與設定差異納入驗收。
關鍵影響:模型安全評估要用多輪攻擊與策略切片建立部署門檻
來源:Cisco Blogs - Proprietary Problems: No Frontier Model Is Multi-Turn Immune
02 / Agent
OpenAI 展示 self-improving tax agents
OpenAI 與 Thrive Holdings 說明 Tax AI 如何把會計師的實務修正、production traces 與 eval infrastructure 串成 Codex-driven improvement loop。系統在 Crete 旗下 30 多家會計師事務所試點,處理 7,000 份 tax returns,並把重複錯誤整理成可驗證的工程任務。這篇重點在於 agent 產品要把現場回饋轉成結構化證據,再用 eval gate 推動持續改善。
關鍵影響:domain agent 的進步需要 traces、專家回饋與可重跑 evals
來源:OpenAI - Building self-improving tax agents with Codex
03 / Agent
Anthropic 拆解 Claude containment
Anthropic Engineering 說明 Claude 在 claude.ai、Claude Code 與 Cowork 裡如何做 containment。文章把 agent 風險拆成使用者誤用、模型失控與外部攻擊,並把防線放在執行環境、模型層與外部內容來源。重點是當 agent 權限變大,安全設計要先限定最大影響範圍,讓高價值自動化能在可控邊界內運作。
關鍵影響:agent 產品要用環境隔離與權限邊界限制最大損害
來源:Anthropic Engineering - How we contain Claude across products
04 / Image
Microsoft 發布 MAI-Image-2.5
Microsoft 宣布 MAI-Image-2.5,稱這是目前最強的 MAI-Image 系列模型,並在 Arena text-to-image 排名第 3。這次重點放在更可靠的文字渲染、產品與品牌圖像、構圖一致性與視覺推理。對設計、行銷與企業內容團隊來說,圖像模型競爭正在從好看走向可直接用在商業素材的細節控制。
關鍵影響:圖像生成模型的差異會集中在文字、產品細節與可用性
來源:Microsoft Source LATAM - MAI-Image-2.5 se lanza en el puesto número 3 de Arena
05 / Training
Hugging Face 降低 RL 權重同步成本
Hugging Face 發布 TRL 的 Delta Weight Sync 實作,解決 async RL 每一步都要把完整模型權重送到 inference engine 的瓶頸。團隊利用 bf16 權重在相鄰 step 大多沒有變動的特性,把 Qwen3-0.6B 每步同步量從 1.2GB 降到約 20 到 35MB,並透過 Hub Bucket 讓 trainer、vLLM rollout server 與環境能分散部署。
關鍵影響:RL 訓練效率可以靠 sparse delta 與共享 object store 改善
來源:Hugging Face Blog - Shipping a Trillion Parameters With a Hub Bucket
06 / Local AI
Reachy Mini 對話 stack 改成本地執行
Hugging Face 說明 Reachy Mini conversation app 如何改用完全本地的 speech-to-speech stack。流程以 VAD、STT、LLM、TTS 串成 Realtime API 相容 WebSocket,並可用 llama.cpp、MLX、Transformers 或 vLLM 服務本地模型。這對機器人與語音 agent 很實用,因為音訊可以留在使用者硬體上,同時保留替換模型與降低成本的彈性。
關鍵影響:本地 voice agent 會靠可替換 pipeline 平衡隱私、延遲與成本
來源:Hugging Face Blog - Reachy Mini goes fully local