Daily Briefing

2026-06-13 AI Daily

agent 工作流進入可部署階段,今天的重點從模型能力轉向評測、權限、MCP 串接與組織導入。 5 則 AI 技術與產品重點:GitHub Copilot code review 加入組織 runner、內容排除與自訂指令控制、Ai2 發布 olmo-eval,讓模型評測能跨 checkpoint 追蹤、AWS 公開 Rocket Close Supercharger 生產級 agent 架構、AWS 示範 Amazon Quick 串接 Webex MCP,建立會議準備 agent、OpenAI Academy 新增 Agents and Workflows,聚焦可重複工作流

ThreadsInstagram

01 / 開發工具

GitHub Copilot code review 加入組織 runner、內容排除與自訂指令控制

GitHub 更新 Copilot code review,組織管理員可以替所有 repo 設定預設 runner,也能鎖定組織層級設定。新版同時支援 Copilot content exclusion,讓 repo、組織或企業排除的檔案不會被拿去做 code review 脈絡,並移除 custom instructions 的 4,000 字元限制。對工程團隊來說,AI reviewer 更適合放進既有權限、成本與資料邊界管理流程。

關鍵影響:把 AI reviewer 納入權限治理

來源:GitHub Changelog - Copilot code review: New configurations and controls

02 / 評測

Ai2 發布 olmo-eval,讓模型評測能跨 checkpoint 追蹤

Ai2 在 Hugging Face 發布 olmo-eval,定位是模型開發迴圈用的評測 workbench,而不是只替完成品跑 leaderboard。它把 benchmark 邏輯、執行方式與工具使用拆成 task、suite、harness 與 sandbox,讓同一個任務能在不同 checkpoint、工具設定或容器環境下重跑。結果也提供 standard error、minimum detectable effect 與逐題比較,幫助團隊判斷小幅分數變化是有效改善或只是雜訊。

關鍵影響:用逐題比較驗證模型改動

來源:Hugging Face Blog - olmo-eval: An evaluation workbench for the model development loop

03 / 企業 agent

AWS 公開 Rocket Close Supercharger 生產級 agent 架構

AWS 說明 Rocket Close 如何用 Strands Agents、Amazon Bedrock、Bedrock Knowledge Bases 與 MCP tools 建置 Supercharger,讓產權作業人員用自然語言查詢訂單、州別規則與內部流程。架構加入 Bedrock Guardrails、row-level data entitlements、完整對話稽核與 WebSocket 串流,並把 MCP tools 用來封裝不同資料來源。官方案例指出聯絡中心來電與信件量降低 30%,提示與架構調整也帶來 3 倍延遲改善。

關鍵影響:先設計權限、稽核與工具邊界

來源:AWS Machine Learning Blog - Building Supercharger: How Rocket Close optimized title operations with agentic AI

04 / MCP

AWS 示範 Amazon Quick 串接 Webex MCP,建立會議準備 agent

AWS 發布教學,示範 Amazon Quick chat agent 透過 Cisco Webex Meetings、Vidcast 與 Messaging MCP servers 整理會前準備與會後追蹤。使用者用單一 prompt 要求 agent 找 upcoming meeting、讀前次摘要與 transcript、搜尋 Vidcast 重點、檢查 Webex 訊息串待辦,最後產出 prep brief 或 follow-up 草稿。這篇把 MCP 從概念拉到多人協作流程,也提醒團隊要明確設計工具範圍、OAuth 權限與人工確認點。

關鍵影響:用 MCP 串起可審核會議流程

來源:AWS Machine Learning Blog - Build a meeting prep and follow-up assistant with Amazon Quick and Cisco Webex MCP servers

05 / AI 導入

OpenAI Academy 新增 Agents and Workflows,聚焦可重複工作流

OpenAI Academy 新增 AI Foundations、Applied AI Foundations、Agents and Workflows 三門課,目標是讓組織從日常任務使用 AI,逐步進到可重複的工作流與 agent-assisted work。課程強調輸入、模型、工具、checkpoint、人類審核、品質、速度與成本的平衡,也要求使用者定義 context、輸出、邊界與結果檢查方式。這不是模型發布,但反映企業導入 AI agent 時,教育、治理與工作流設計正變成產品的一部分。

關鍵影響:用工作流規格訓練使用習慣

來源:OpenAI - New OpenAI Academy courses for the next era of work