AI TEAM OPS FIELD REPORT

Hermes Agent OS 深度拆解

這集不是介紹一個聊天機器人,而是把 Hermes 拆成一套可以長期代理工作的 AI 團隊作業系統:入口、模型路由、工具、記憶、技能、排程、API、Obsidian,以及 M5 Max 本地模型接法。

Runtime52:20

長篇教學,不是短新聞摘要。

Scope9 layers

從入口到安全邊界拆完整系統。

IntegrationAPI / MCP / Obsidian

包含外部服務、工具與筆記庫串接。

Local ModelM5 Max

128G / 4T 筆電作本地模型節點。

LISTENING SURFACE

先確認聲音,再回來看架構圖

這頁現在是 episode report,不只是播放頁。聲音、講義、逐字稿、YouTube metadata、package gate 都放在同一個驗收表面。

SYSTEM MAP

Hermes 的價值在外部結構,不只在模型權重

如果模型每次都空手上班,它就只是聊天。Hermes 真正有意思的地方,是讓模型每次進入工作時,都接到記憶、工具、技能、排程與門禁。

01

入口層

CLI、gateway、API server、batch、editor、Python library。

02

核心代理層

接收請求、建構上下文、決定下一步。

03

提示詞組裝層

把規則、任務、記憶、技能與工具說明組成工作上下文。

04

模型供應商層

解析 provider、model、base URL、fallback 與 routing。

05

工具層

把檔案、終端、瀏覽器、MCP、資料庫與內部 API 註冊成能力。

06

Session 層

用 SQLite 與全文索引保存工作階段。

07

Memory / Skills

把經驗與可重複流程變成可回用資料。

08

Gateway / Cron

讓代理長期在線,也能跑背景任務。

09

安全邊界

把憑證、工具權限、寫入權與人工審核分清楚。

INTEGRATION PLAYBOOK

三條 API 路線,決定 Hermes 能不能進團隊工作流

Model API 決定 Hermes 用哪個模型思考。Tool API 決定 Hermes 能操作哪些外部系統。External caller API 決定別的前端、服務或排程怎麼把 Hermes 當後端呼叫。

Model API

OpenAI-compatible endpoint、LM Studio、Ollama、llama.cpp server、MLX-LM wrapper。

Tool API

GitHub、Gmail、Calendar、LINE、Notion、Slack、internal admin、browser、database。

Obsidian

先 read-only,再 draft-only,最後才開受控寫入。每次寫入都要有來源、任務、時間、決策理由與 reviewer。

LOCAL MODEL ROUTE

M5 Max 128G / 4T 怎麼接上 Hermes

Hermes Router
OpenAI-compatible URL
LM Studio / Ollama / MLX
Local model worker
Memory + Tool gate

本地模型適合摘要、分類、Obsidian 草稿整理、隱私資料預處理與低風險批次工作;高風險決策與最終審核仍保留 human gate 或 cloud frontier model。

DELIVERY GATE

Podcast 不只看 RSS,要看完整 package

EP16 已公開,但聲音品質被退回,所以狀態是 voice revision required。現在每集都要同時檢查音檔、講義、逐字稿、封面、YouTube/social 資產、網站報告與講者聽審。

AudioHotfix v2
Cover3000 x 3000
SocialReady
AcceptanceVoice review