Daily Briefing

2026-06-10 AI Daily

今天 AI 重點從更強模型延伸到可驗證 agent 與語音流程 5 則 AI 技術與產品重點：Anthropic 發布 Claude Fable 5，把 Mythos 級能力開放給一般使用者、Cohere 開源 North Mini Code，30B MoE 專攻 agentic coding、GitHub 將第三方 coding agent 產出的 PR 納入自動安全驗證、ServiceNow 發布 code-switching ASR benchmark，量測雙語客服語音代理、Krisp 推出 Voice Translation API，主打真實通話資料驗證的即時語音翻譯

Threads Instagram

01 / 模型

Anthropic 發布 Claude Fable 5，把 Mythos 級能力開放給一般使用者

Anthropic 發布 Claude Fable 5 與受限存取的 Claude Mythos 5。Fable 5 是加上防護的 Mythos 級模型，主打更長時間的自主 coding、知識工作、視覺驗證、長上下文記憶與科學研究任務，API model ID 為 claude-fable-5，定價為每百萬 input token 10 美元、output token 50 美元。團隊導入時可先挑長流程工作、可重跑測試與人工審查節點，評估能力提升是否真的轉成可交付成果。

關鍵影響：用長流程任務驗證交付品質

來源：Anthropic - Claude Fable 5 and Claude Mythos 5

Anthropic 發布 Claude Fable 5，把 Mythos 級能力開放給一般使用者圖片摘要

02 / 開源模型

Cohere 開源 North Mini Code，30B MoE 專攻 agentic coding

Cohere 在 Hugging Face 發布 North Mini Code，這是 30B 參數、每次啟用 3B 參數的 sparse MoE coding model，採 Apache 2.0。文章說明模型用多種 agent harness 訓練，後訓練包含 SFT 與 RLVR，資料涵蓋 7 萬多個可驗證任務、約 5 千個 repo，並針對 terminal 任務與真實軟體工程流程最佳化。評估開源 coding model 時，可同時看授權、部署成本、harness 相容性、工具呼叫與可驗證任務覆蓋率。

關鍵影響：把 harness 相容性列入模型評估

來源：Hugging Face - Introducing North Mini Code: Cohere’s First Model For Developers

Cohere 開源 North Mini Code，30B MoE 專攻 agentic coding 圖片摘要

03 / 開發安全

GitHub 將第三方 coding agent 產出的 PR 納入自動安全驗證

GitHub 宣布第三方 coding agent 的 security validation 正式可用。當 Claude、OpenAI Codex 等外部 agent 在 repo 內建立程式碼時，GitHub 會用 CodeQL 分析新增漏洞，檢查新依賴是否命中 GitHub Advisory Database，並用 secret scanning 找 API keys 與 tokens。若發現問題，agent 會在完成 PR 前嘗試修正。使用 coding agent 的團隊可把這層檢查接到 PR 流程，讓不同 agent 產出的程式碼都先經過一致安全閘門。

關鍵影響：把 agent PR 先接安全閘門

來源：GitHub Changelog - Security validation for third-party coding agents

GitHub 將第三方 coding agent 產出的 PR 納入自動安全驗證圖片摘要

04 / 語音評測

ServiceNow 發布 code-switching ASR benchmark，量測雙語客服語音代理

ServiceNow-AI 發布 code-switched speech benchmark，測試語音代理在西英、法英、加拿大法英與德英混語客服情境中的 ASR 表現。資料來自 HR 與 ITSM 場景，合成後由語言專家審查，評估指標包含 WER、Semantic WER 與 Answer Error Rate。結果顯示 ElevenLabs Scribe V2、Gemini 3 Flash 與 AssemblyAI Universal 3-Pro 在多數指標領先。做語音代理時，可先用目標客群實際語言切換方式建立 eval，再檢查轉錄錯誤如何傳到下游任務。

關鍵影響：用實際語言切換建立語音 eval

來源：Hugging Face - Can Voice Agents Handle Bilingual Customers?

ServiceNow 發布 code-switching ASR benchmark，量測雙語客服語音代理圖片摘要

05 / 語音 API

Krisp 推出 Voice Translation API，主打真實通話資料驗證的即時語音翻譯

Krisp 發布自助式 Voice Translation API，把原本用在企業 contact center 的即時語音翻譯引擎開放給開發者。官方表示引擎以超過 100 萬分鐘生產通話驗證，支援 61 種語言任意互譯，輸入 PCM 16 kHz mono 音訊後透過 WebSocket 回傳翻譯語音、來源轉錄與翻譯文字，並提供 Python 與 JavaScript SDK。語音產品團隊可用它評估客服、醫療、法律與跨語會議場景，重點看真實噪音、口音、專有名詞與延遲是否符合流程需求。

關鍵影響：用真實通話條件測翻譯 API

來源：Krisp Engineering - Introducing the Voice Translation API

Krisp 推出 Voice Translation API，主打真實通話資料驗證的即時語音翻譯圖片摘要