Daily Briefing

2026-05-28 AI Daily

6 則 AI 技術與產品重點：Cisco：frontier model 仍怕多輪攻擊、OpenAI 展示 self-improving tax agents、Anthropic 拆解 Claude containment、Microsoft 發布 MAI-Image-2.5、Hugging Face 降低 RL 權重同步成本、Reachy Mini 對話 stack 改成本地執行

Threads Instagram

01 / Safety

Cisco：frontier model 仍怕多輪攻擊

Cisco AI Defense 發布 proprietary model 多輪攻擊評估，測試 15 個來自 OpenAI、Anthropic、Google、Amazon 與 xAI 的閉源模型。研究指出 single-turn ASR 無法代表攻擊者會逐步改寫、拆解與升級 prompt 的真實情境，多輪 ASR 落在 7.89% 到 88.30%。對企業採購與部署模型來說，重點是把多輪、策略分層與設定差異納入驗收。

關鍵影響：模型安全評估要用多輪攻擊與策略切片建立部署門檻

來源：Cisco Blogs - Proprietary Problems: No Frontier Model Is Multi-Turn Immune

02 / Agent

OpenAI 展示 self-improving tax agents

OpenAI 與 Thrive Holdings 說明 Tax AI 如何把會計師的實務修正、production traces 與 eval infrastructure 串成 Codex-driven improvement loop。系統在 Crete 旗下 30 多家會計師事務所試點，處理 7,000 份 tax returns，並把重複錯誤整理成可驗證的工程任務。這篇重點在於 agent 產品要把現場回饋轉成結構化證據，再用 eval gate 推動持續改善。

關鍵影響：domain agent 的進步需要 traces、專家回饋與可重跑 evals

來源：OpenAI - Building self-improving tax agents with Codex

OpenAI 展示 self-improving tax agents 圖片摘要

03 / Agent

Anthropic 拆解 Claude containment

Anthropic Engineering 說明 Claude 在 claude.ai、Claude Code 與 Cowork 裡如何做 containment。文章把 agent 風險拆成使用者誤用、模型失控與外部攻擊，並把防線放在執行環境、模型層與外部內容來源。重點是當 agent 權限變大，安全設計要先限定最大影響範圍，讓高價值自動化能在可控邊界內運作。

關鍵影響：agent 產品要用環境隔離與權限邊界限制最大損害

來源：Anthropic Engineering - How we contain Claude across products

04 / Image

Microsoft 發布 MAI-Image-2.5

Microsoft 宣布 MAI-Image-2.5，稱這是目前最強的 MAI-Image 系列模型，並在 Arena text-to-image 排名第 3。這次重點放在更可靠的文字渲染、產品與品牌圖像、構圖一致性與視覺推理。對設計、行銷與企業內容團隊來說，圖像模型競爭正在從好看走向可直接用在商業素材的細節控制。

關鍵影響：圖像生成模型的差異會集中在文字、產品細節與可用性

來源：Microsoft Source LATAM - MAI-Image-2.5 se lanza en el puesto número 3 de Arena

05 / Training

Hugging Face 降低 RL 權重同步成本

Hugging Face 發布 TRL 的 Delta Weight Sync 實作，解決 async RL 每一步都要把完整模型權重送到 inference engine 的瓶頸。團隊利用 bf16 權重在相鄰 step 大多沒有變動的特性，把 Qwen3-0.6B 每步同步量從 1.2GB 降到約 20 到 35MB，並透過 Hub Bucket 讓 trainer、vLLM rollout server 與環境能分散部署。

關鍵影響：RL 訓練效率可以靠 sparse delta 與共享 object store 改善

來源：Hugging Face Blog - Shipping a Trillion Parameters With a Hub Bucket

06 / Local AI

Reachy Mini 對話 stack 改成本地執行

Hugging Face 說明 Reachy Mini conversation app 如何改用完全本地的 speech-to-speech stack。流程以 VAD、STT、LLM、TTS 串成 Realtime API 相容 WebSocket，並可用 llama.cpp、MLX、Transformers 或 vLLM 服務本地模型。這對機器人與語音 agent 很實用，因為音訊可以留在使用者硬體上，同時保留替換模型與降低成本的彈性。

關鍵影響：本地 voice agent 會靠可替換 pipeline 平衡隱私、延遲與成本

來源：Hugging Face Blog - Reachy Mini goes fully local