Daily Briefing

2026-06-13 AI Daily

agent 工作流進入可部署階段，今天的重點從模型能力轉向評測、權限、MCP 串接與組織導入。 5 則 AI 技術與產品重點：GitHub Copilot code review 加入組織 runner、內容排除與自訂指令控制、Ai2 發布 olmo-eval，讓模型評測能跨 checkpoint 追蹤、AWS 公開 Rocket Close Supercharger 生產級 agent 架構、AWS 示範 Amazon Quick 串接 Webex MCP，建立會議準備 agent、OpenAI Academy 新增 Agents and Workflows，聚焦可重複工作流

Threads Instagram

01 / 開發工具

GitHub Copilot code review 加入組織 runner、內容排除與自訂指令控制

GitHub 更新 Copilot code review，組織管理員可以替所有 repo 設定預設 runner，也能鎖定組織層級設定。新版同時支援 Copilot content exclusion，讓 repo、組織或企業排除的檔案不會被拿去做 code review 脈絡，並移除 custom instructions 的 4,000 字元限制。對工程團隊來說，AI reviewer 更適合放進既有權限、成本與資料邊界管理流程。

關鍵影響：把 AI reviewer 納入權限治理

來源：GitHub Changelog - Copilot code review: New configurations and controls

GitHub Copilot code review 加入組織 runner、內容排除與自訂指令控制圖片摘要

02 / 評測

Ai2 發布 olmo-eval，讓模型評測能跨 checkpoint 追蹤

Ai2 在 Hugging Face 發布 olmo-eval，定位是模型開發迴圈用的評測 workbench，而不是只替完成品跑 leaderboard。它把 benchmark 邏輯、執行方式與工具使用拆成 task、suite、harness 與 sandbox，讓同一個任務能在不同 checkpoint、工具設定或容器環境下重跑。結果也提供 standard error、minimum detectable effect 與逐題比較，幫助團隊判斷小幅分數變化是有效改善或只是雜訊。

關鍵影響：用逐題比較驗證模型改動

來源：Hugging Face Blog - olmo-eval: An evaluation workbench for the model development loop

Ai2 發布 olmo-eval，讓模型評測能跨 checkpoint 追蹤圖片摘要

03 / 企業 agent

AWS 公開 Rocket Close Supercharger 生產級 agent 架構

AWS 說明 Rocket Close 如何用 Strands Agents、Amazon Bedrock、Bedrock Knowledge Bases 與 MCP tools 建置 Supercharger，讓產權作業人員用自然語言查詢訂單、州別規則與內部流程。架構加入 Bedrock Guardrails、row-level data entitlements、完整對話稽核與 WebSocket 串流，並把 MCP tools 用來封裝不同資料來源。官方案例指出聯絡中心來電與信件量降低 30%，提示與架構調整也帶來 3 倍延遲改善。

關鍵影響：先設計權限、稽核與工具邊界

來源：AWS Machine Learning Blog - Building Supercharger: How Rocket Close optimized title operations with agentic AI

AWS 公開 Rocket Close Supercharger 生產級 agent 架構圖片摘要

04 / MCP

AWS 示範 Amazon Quick 串接 Webex MCP，建立會議準備 agent

AWS 發布教學，示範 Amazon Quick chat agent 透過 Cisco Webex Meetings、Vidcast 與 Messaging MCP servers 整理會前準備與會後追蹤。使用者用單一 prompt 要求 agent 找 upcoming meeting、讀前次摘要與 transcript、搜尋 Vidcast 重點、檢查 Webex 訊息串待辦，最後產出 prep brief 或 follow-up 草稿。這篇把 MCP 從概念拉到多人協作流程，也提醒團隊要明確設計工具範圍、OAuth 權限與人工確認點。

關鍵影響：用 MCP 串起可審核會議流程

來源：AWS Machine Learning Blog - Build a meeting prep and follow-up assistant with Amazon Quick and Cisco Webex MCP servers

AWS 示範 Amazon Quick 串接 Webex MCP，建立會議準備 agent 圖片摘要

05 / AI 導入

OpenAI Academy 新增 Agents and Workflows，聚焦可重複工作流

OpenAI Academy 新增 AI Foundations、Applied AI Foundations、Agents and Workflows 三門課，目標是讓組織從日常任務使用 AI，逐步進到可重複的工作流與 agent-assisted work。課程強調輸入、模型、工具、checkpoint、人類審核、品質、速度與成本的平衡，也要求使用者定義 context、輸出、邊界與結果檢查方式。這不是模型發布，但反映企業導入 AI agent 時，教育、治理與工作流設計正變成產品的一部分。

關鍵影響：用工作流規格訓練使用習慣

來源：OpenAI - New OpenAI Academy courses for the next era of work

OpenAI Academy 新增 Agents and Workflows，聚焦可重複工作流圖片摘要