Daily Briefing
2026-06-05 AI Daily
7 則 AI 技術與產品重點:ChatGPT Memory 改用 Dreaming、Gemma 4 12B 主打本機多模態、Google 用手機前鏡頭量心率、Perplexity 把推論分流到本機、OpenAI 升級 GPT-Rosalind、Qwen3.7-Plus 強化 GUI Agent、Copilot 在 VS Code 走向 Agent-first
01 / 產品架構
ChatGPT Memory 改用 Dreaming
OpenAI 開始推出新版 ChatGPT memory architecture,以 dreaming 在背景整理跨對話脈絡,處理長期記憶的新鮮度、正確性與可擴展性。產品團隊可以把個人化設計成可檢視摘要、偏好修正與時間感知更新,讓使用者在長週期任務中延續脈絡。
關鍵影響:個人化 AI 要把記憶整理做成產品能力
來源:OpenAI - Dreaming: Better memory for a more helpful ChatGPT
02 / 開源模型
Gemma 4 12B 主打本機多模態
Google 發布 Gemma 4 12B,定位為能在 16GB VRAM 或 unified memory 裝置上執行的多模態模型。它用 encoder-free 架構處理視覺與音訊輸入,並提供 Apache 2.0 權重、MTP drafters 與主流推論工具支援。開發者可以用它打造本機 agent、低延遲多模態流程與私有部署。
關鍵影響:本機 AI agent 開始需要原生多模態能力
來源:Google - Introducing Gemma 4 12B
03 / 健康 AI
Google 用手機前鏡頭量心率
Google Research 發表 PHRM,透過手機解鎖後的前鏡頭臉部影片估測心率與每日靜息心率。研究以真實使用場景與多膚色資料驗證,並釋出資料與 PHRM-mini 給合格研究者。健康產品團隊可以把手機感測、信心分數、Kalman filtering 與資料授權流程一起設計成可審核的研究管線。
關鍵影響:手機感測 AI 可補上穿戴裝置以外的健康入口
來源:Google Research - Towards passive heart health monitoring via smartphone camera
04 / Agent 架構
Perplexity 把推論分流到本機
Perplexity Computer 公布 hybrid agentic inference,讓 agent 依資料敏感度、任務難度與成本,在本機模型和雲端 frontier model 之間分流。企業導入 agent 時,可以把隱私資料處理、輕量分類與格式整理放在裝置端,把高難度推理與大型檢索交給雲端模型,讓成本、隱私與能力在同一個工作流裡被調度。
關鍵影響:Agent 系統開始需要推論路由層
來源:Perplexity - The data center moves to your machine
05 / 生命科學
OpenAI 升級 GPT-Rosalind
OpenAI 更新 GPT-Rosalind,主打生命科學研究中的證據處理、藥物化學、基因體分析與實驗工作流。新版結合 GPT-5.5 的 agentic coding 與 tool use,並在 Codex 加入序列、alignment 與結構檢視器。研究組織可以把文獻證據、內部 omics 分析、工具執行與 provenance 放在同一個可追蹤 workspace。
關鍵影響:垂直模型的重點正在移向可執行研究流程
來源:OpenAI - Introducing new capabilities to GPT-Rosalind
06 / 多模態模型
Qwen3.7-Plus 強化 GUI Agent
Alibaba Cloud 發布 Qwen3.7-Plus,定位為 multimodal interactive hybrid agent foundation。模型能讀取畫面、定位 UI 元件、操作 GUI、執行 CLI、產生程式並用環境回饋驗證結果。開發團隊可以把它用在前端原型、App 自動化、視覺問答與跨 harness agent 工作流,評估時同步看 ScreenSpot Pro、OSWorld、Terminal-Bench 與實際工具鏈表現。
關鍵影響:GUI agent 要看視覺定位與執行閉環
來源:Alibaba Cloud - Qwen3.7-Plus: Multimodal Agent Intelligence
07 / 開發者工具
Copilot 在 VS Code 走向 Agent-first
GitHub 整理 Copilot in VS Code 五月到六月初更新,Agents window 已進入 Stable preview,支援多專案導覽、變更檢查、remote agent sessions、session sync 與 AHP 狀態同步。工程團隊可以把 agent 工作從聊天窗移到可並排審查、可遠端續跑、可記錄歷史的 IDE 表面,並用 BYOK 與 utility model 設定控制成本與部署環境。
關鍵影響:Coding agent 的產品面正在變成專用工作台
來源:GitHub Changelog - GitHub Copilot in Visual Studio Code, May releases