Daily Briefing

2026-06-19 AI Daily

AI agent 從單次對話走向可重播、可分享、可協作與可評測的工作流。 5 則 AI 技術與產品重點：Claude Code artifacts 把 coding agent 進度變成可分享的工作頁面、Codex Record & Replay 將示範過的 Mac 流程轉成可重複使用的 skill、OpenAI 改善 ChatGPT 健康回答，GPT-5.5 Instant 用醫師審查驗證、Google A2A 把多 agent 協作推向可控交接與安全邊界、Hugging Face 用工具使用評測檢查開源模型是否適合 agent

Threads Instagram

01 / 開發工具

Claude Code artifacts 把 coding agent 進度變成可分享的工作頁面

Anthropic 讓 Claude Code 支援 artifacts，能把目前工作階段的程式碼、連接器與對話脈絡整理成互動式網頁，例如 PR walkthrough、incident timeline、dashboard 或 release checklist。頁面可在同一連結更新、保留版本，也可在組織內分享。這讓 coding agent 的中間成果不只停在聊天紀錄，團隊可以把除錯、審查與交接變成可檢查的共享成果。

關鍵影響：把 agent 進度交付成可檢查頁面

來源：Claude - Claude Code now supports artifacts

Claude Code artifacts 把 coding agent 進度變成可分享的工作頁面圖片摘要

02 / 自動化

Codex Record & Replay 將示範過的 Mac 流程轉成可重複使用的 skill

OpenAI Developers 文件新增 Codex Record & Replay，讓使用者在 macOS 示範一次重複工作，Codex 會根據錄下的動作與視窗內容草擬 skill，包含使用時機、輸入、步驟與驗證方式。之後只要在新對話串提供不同檔案、日期或 issue 內容，Codex 就能搭配 Computer Use、瀏覽器動作或 plugins 重播。適合把穩定但難用文字描述的日常流程變成可維護自動化。

關鍵影響：先錄穩定流程

來源：OpenAI Developers - Record & Replay

Codex Record & Replay 將示範過的 Mac 流程轉成可重複使用的 skill 圖片摘要

03 / 健康 AI

OpenAI 改善 ChatGPT 健康回答，GPT-5.5 Instant 用醫師審查驗證

OpenAI 說明 ChatGPT 健康智慧的更新，指出 GPT-5.5 Instant 在 HealthBench 與 HealthBench Professional 等健康評估中接近頂尖 Thinking 模型，且免費使用者也能在限額內使用。OpenAI 另以醫師撰寫與醫師審查的真實健康對話比較模型表現，並監測上線後對話中可能有事實問題的回覆比例。對健康 AI 產品來說，重點是把準確性、安全升級、在地情境與不確定性說明一起納入評估。

關鍵影響：重測安全與在地情境

來源：OpenAI - Improving health intelligence in ChatGPT

OpenAI 改善 ChatGPT 健康回答，GPT-5.5 Instant 用醫師審查驗證圖片摘要

04 / Agent 協定

Google A2A 把多 agent 協作推向可控交接與安全邊界

Google Developers Blog 在 A2A 一週年回顧中，強調 agent 不能只被當成無狀態 API 呼叫。A2A 讓請求方 agent 能把任務交給專門 agent，對方在自己的安全環境處理敏感資料與內部流程，再回傳完成後的判斷、資料或工作成果。這對企業 agent 架構很關鍵，因為跨部門或跨供應商協作時，需要讓能力可被呼叫，同時保留資料、權限與實作邊界。

關鍵影響：把跨 agent 任務交接納入架構設計

來源：Google Developers Blog - How A2A is Building a World of Collaborative Agents

05 / 開源評測

Hugging Face 用工具使用評測檢查開源模型是否適合 agent

Hugging Face 發表以 agent 使用情境為核心的評測，重點不是只看答案是否正確，而是看 coding agent 是否能用程式庫、工具與文件找到答案。文章以 transformers 不同版本、不同開源模型與 pi coding agent 進行實驗，並把模型、版本與任務大量分派到 Hugging Face Jobs。對開源工具維護者來說，這提醒 API、文件與錯誤訊息也要為 agent 使用情境調整。

關鍵影響：讓文件與 API 對 agent 友善

來源：Hugging Face - Is it agentic enough? Benchmarking open models on your own tooling

Hugging Face 用工具使用評測檢查開源模型是否適合 agent 圖片摘要