Daily Briefing

2026-06-05 AI Daily

7 則 AI 技術與產品重點：ChatGPT Memory 改用 Dreaming、Gemma 4 12B 主打本機多模態、Google 用手機前鏡頭量心率、Perplexity 把推論分流到本機、OpenAI 升級 GPT-Rosalind、Qwen3.7-Plus 強化 GUI Agent、Copilot 在 VS Code 走向 Agent-first

Threads Instagram

01 / 產品架構

ChatGPT Memory 改用 Dreaming

OpenAI 開始推出新版 ChatGPT memory architecture，以 dreaming 在背景整理跨對話脈絡，處理長期記憶的新鮮度、正確性與可擴展性。產品團隊可以把個人化設計成可檢視摘要、偏好修正與時間感知更新，讓使用者在長週期任務中延續脈絡。

關鍵影響：個人化 AI 要把記憶整理做成產品能力

來源：OpenAI - Dreaming: Better memory for a more helpful ChatGPT

02 / 開源模型

Gemma 4 12B 主打本機多模態

Google 發布 Gemma 4 12B，定位為能在 16GB VRAM 或 unified memory 裝置上執行的多模態模型。它用 encoder-free 架構處理視覺與音訊輸入，並提供 Apache 2.0 權重、MTP drafters 與主流推論工具支援。開發者可以用它打造本機 agent、低延遲多模態流程與私有部署。

關鍵影響：本機 AI agent 開始需要原生多模態能力

來源：Google - Introducing Gemma 4 12B

03 / 健康 AI

Google 用手機前鏡頭量心率

Google Research 發表 PHRM，透過手機解鎖後的前鏡頭臉部影片估測心率與每日靜息心率。研究以真實使用場景與多膚色資料驗證，並釋出資料與 PHRM-mini 給合格研究者。健康產品團隊可以把手機感測、信心分數、Kalman filtering 與資料授權流程一起設計成可審核的研究管線。

關鍵影響：手機感測 AI 可補上穿戴裝置以外的健康入口

來源：Google Research - Towards passive heart health monitoring via smartphone camera

04 / Agent 架構

Perplexity 把推論分流到本機

Perplexity Computer 公布 hybrid agentic inference，讓 agent 依資料敏感度、任務難度與成本，在本機模型和雲端 frontier model 之間分流。企業導入 agent 時，可以把隱私資料處理、輕量分類與格式整理放在裝置端，把高難度推理與大型檢索交給雲端模型，讓成本、隱私與能力在同一個工作流裡被調度。

關鍵影響：Agent 系統開始需要推論路由層

來源：Perplexity - The data center moves to your machine

05 / 生命科學

OpenAI 升級 GPT-Rosalind

OpenAI 更新 GPT-Rosalind，主打生命科學研究中的證據處理、藥物化學、基因體分析與實驗工作流。新版結合 GPT-5.5 的 agentic coding 與 tool use，並在 Codex 加入序列、alignment 與結構檢視器。研究組織可以把文獻證據、內部 omics 分析、工具執行與 provenance 放在同一個可追蹤 workspace。

關鍵影響：垂直模型的重點正在移向可執行研究流程

來源：OpenAI - Introducing new capabilities to GPT-Rosalind

06 / 多模態模型

Qwen3.7-Plus 強化 GUI Agent

Alibaba Cloud 發布 Qwen3.7-Plus，定位為 multimodal interactive hybrid agent foundation。模型能讀取畫面、定位 UI 元件、操作 GUI、執行 CLI、產生程式並用環境回饋驗證結果。開發團隊可以把它用在前端原型、App 自動化、視覺問答與跨 harness agent 工作流，評估時同步看 ScreenSpot Pro、OSWorld、Terminal-Bench 與實際工具鏈表現。

關鍵影響：GUI agent 要看視覺定位與執行閉環

來源：Alibaba Cloud - Qwen3.7-Plus: Multimodal Agent Intelligence

07 / 開發者工具

Copilot 在 VS Code 走向 Agent-first

GitHub 整理 Copilot in VS Code 五月到六月初更新，Agents window 已進入 Stable preview，支援多專案導覽、變更檢查、remote agent sessions、session sync 與 AHP 狀態同步。工程團隊可以把 agent 工作從聊天窗移到可並排審查、可遠端續跑、可記錄歷史的 IDE 表面，並用 BYOK 與 utility model 設定控制成本與部署環境。

關鍵影響：Coding agent 的產品面正在變成專用工作台

來源：GitHub Changelog - GitHub Copilot in Visual Studio Code, May releases