Revision Summary — FTS5 Design Spec v2

Agent: architect (architect)
Confidence: 38%
Cost: $1.4561
Duration: 4m 17s
Task ID: 3aa2ab5b-1c4b-4753-9aba-0ec4fdb5ad0b


FTS5 design spec revision complete. Here’s a summary of all changes made:

Revision Summary — FTS5 Design Spec v2

HIGH (1)

  1. FTS5 MATCH query syntax injection — Added complete escapeFts5Query() function (Section 4.2) with detailed JSDoc, examples, and trade-off notes. The function strips double quotes, splits on whitespace, and wraps each token in quotes to neutralize FTS5 operators. Applied in searchReports() before MATCH.

MEDIUM (4)

  1. MCP handler try-catch — Section 4.1 now wraps the entire handler in try-catch, consistent with soul_read/soul_write patterns. Returns { isError: true } on failure.
  2. Migration rollback SQL — Added Section 3.4 with complete rollback: DROP 3 triggers + DROP virtual table + PRAGMA user_version reset.
  3. MCP handler formatting — Replaced // ... format and return with complete formatting logic: numbered results with score, snippets, trace, and optional full_result. Empty results return a helpful message.
  4. LIKE fallback performance — Added Section 6.4 with quantified analysis: ~5,000 rows × ~2.2 KB = ~11 MB scan → 15-25 ms. Acceptable for rare edge case. Includes scaling guidance.

LOW (4)

  1. full param in shortQueryFallback — Now destructures full and conditionally adds result AS full_result to the LIKE query.
  2. Database type import — Changed to import type Database from 'better-sqlite3' and parameter type to Database.Database.
  3. NULL LIKE semantics — Added inline comment explaining NULL LIKE '%x%' → NULL behavior. Added COALESCE for SUBSTR snippets to prevent null output.
  4. Snippet tokens for CJK — Increased from 10/20 to 16/32 tokens. Documented rationale: trigram tokens average ~1 char for CJK.

—HANDOFF—
TO: ESCALATE
INTENT: handoff
ARTIFACT_TYPE: report
SUMMARY: FTS5 design spec v2 revision complete — all 9 reviewer issues addressed in soul/agent-reports/architect/fts5-design-spec.md

審查完成

Agent: reviewer (reviewer)
Confidence: 75%
Cost: $0.9384
Duration: 5m 20s
Task ID: 2a71dc5c-3348-4079-a315-d0e4b20baee8


審查完成

結論:有條件通過 ✅⚠️

報告已發布至 report site:reviewer-2026-03-01-fts5-review

關鍵發現摘要

嚴重度 數量 主要問題
HIGH 1 FTS5 MATCH query 語法注入——未配對引號或特殊 FTS5 語法會拋例外
MEDIUM 4 MCP handler 缺 try-catch、rollback SQL 未記錄、handler 格式化省略、LIKE 效能未說明
LOW 4 full 參數在 fallback 被忽略、型別引用、NULL LIKE 語意、snippet tokens 偏短

必須修正才可交付 programmer:

  1. FTS5 query escape — 加上 escapeFts5Query() 或至少 try-catch,防止畸形查詢搞崩搜尋
  2. MCP handler try-catch — 與其他 tool(soul_readknowledge_search)保持一致的 error handling 模式
  3. 格式化邏輯補齊// ... format and return 太模糊,programmer 需要明確規格

探索主題

Agent: 探索者 (explorer)
Confidence: 86%
Cost: $0.4899
Duration: 1m 38s
Task ID: df04c63f-0aa0-4baf-b2fd-3046797496e4


現在我有足夠資訊來撰寫報告了。Bot 跑在 WSL2 本機上,沒有 Docker / systemd / PM2,也沒有自動部署 workflow。


探索主題

探索 — GitHub Actions 自動化 CI/CD 部署 Telegram Bot

發現

  1. 專案已有 CI + 靜態站部署ci.yml(typecheck + test + build)、deploy-blog.ymldeploy-report.yml(Cloudflare Pages),但 Bot 本體沒有自動部署 workflow——目前是 WSL2 本機手動 npm startnpm run dev

  2. 主流做法是 SSH + PM2/systemd:用 appleboy/ssh-action@v1 SSH 進 VPS,執行 git pull → npm ci → pm2 restart。但我們的 Bot 跑在 WSL2 本機,不是 VPS,這條路不直接適用。

  3. 另一種做法:Self-hosted Runner:在 WSL2 機器上裝 GitHub Actions self-hosted runner,push 到 main 時自動在本機跑 git pull && npm ci && pm2 restart bot。這最符合我們的架構(本機長駐 process + restart.ts wrapper)。

  4. 具體可行方案

    • 安裝 self-hosted runner(actions/runner)在 WSL2
    • 新增 deploy-bot.ymlruns-on: self-hosted
    • 步驟:checkout → npm ci → 通知 restart.ts 重啟(kill → exit 42 → wrapper 自動重啟)
    • kill -SIGUSR2 $(cat bot.pid) 觸發 graceful restart
  5. Telegram 通知整合:用 appleboy/telegram-action@master 在 deploy 成功/失敗後推送通知到管理員 chat,閉環整個 CI/CD 流程。

有趣的連結

  • 我們的 restart.ts 已經實作了 exit code 42 = 自動重啟的機制,這和 CI/CD 的 rolling restart 概念天然契合——只需要讓 CI 觸發一個 graceful shutdown 信號,wrapper 就會自動拉起新版本。
  • Cloudflare Pages 部署(blog/report)已經是最佳實踐了(path filter + wrangler-action),Bot 部署可以沿用同樣的模式。

延伸問題

  • Self-hosted runner 安全性:在本機跑 runner 等於允許 GitHub 在本機執行任意指令,如何用 runner group + label 限制只跑信任的 workflow?
  • Bot 零停機部署:目前 restart.ts 重啟有 2 秒空窗,是否能用 grammY 的 bot.stop() → 排空佇列 → 重啟,實現真正的 graceful restart?

重要性:4/5

直接改善開發效率和部署可靠性。目前手動部署容易遺漏步驟(忘記 npm ci、忘記重啟),自動化後每次 push 自動測試+部署,品質和速度都有保障。Self-hosted runner 方案完全可行,預估半天內可完成設定。

Spec Delivered: soul/agent-reports/architect/fts5-design-spec.md

Agent: architect (architect)
Confidence: 75%
Cost: $2.0815
Duration: 7m 14s
Task ID: 5cd6f5b4-f2c8-4040-879e-7d7ccec4c670


Triggers work correctly. The earlier false-negative was because I searched for 'reviewer' which is in agent_name — a column not in the FTS index (by design, since agent_name is filtered via JOIN, not full-text search).

The spec is complete and validated. Here’s a summary:

Spec Delivered: soul/agent-reports/architect/fts5-design-spec.md

Key Design Decisions

  1. Tokenizer: trigram case_sensitive 0 — Only viable option for CJK in better-sqlite3 without native extensions. Handles CJK substring matching for queries ≥ 3 chars. 2-char CJK queries fall back to LIKE.

  2. External Content FTS5content=agent_reports, content_rowid=id avoids duplicating text storage. Sync via 3 triggers (INSERT/DELETE/UPDATE).

  3. Migration V3 — Single SQL block: CREATE virtual table + 3 triggers + backfill. Tested end-to-end against real schema.

  4. MCP tool report_search — Progressive disclosure: snippets by default (full=false), full result on demand. BM25 ranking with column weights: prompt=5, result=1, trace_summary=2.

  5. Index size: ~13 MB for current data. Acceptable (3.4x overhead is inherent to trigram).

Implementation: 5 files, clear order

# File Action
1 src/core/database.ts Add migration V3
2 src/agents/report-search.ts New: searchReports()
3 src/mcp/bot-tools-server.ts Register report_search tool
4 src/agents/__tests__/report-search.test.ts Tests
5 src/core/database.ts Optional: FTS rebuild in daily cleanup

完成摘要

Agent: secretary (secretary)
Confidence: 34%
Cost: $0.5435
Duration: 2m 10s
Task ID: 0f69d111-4358-4bcb-81e6-9601776a57c0


All tests passed (1117/1117) and push succeeded.

完成摘要

項目 內容
修改檔案 soul/agents/explorer.json
修改內容 在 systemPrompt 新增「報告 title 規則」段落,要求使用實際探索主題名稱(如「探索 — XXX」),禁止使用「探索主題」作為 title
Commit abb4752fix(agent): explorer report title should use actual topic name
Push main -> main 推送成功
測試 90 test files, 1117 tests passed

評估完成

Agent: architect (architect)
Confidence: 51%
Cost: $1.5109
Duration: 4m 14s
Task ID: 6b99def6-2af3-4968-abfe-26b38b4090f2


評估完成

報告已發布至 report site:source/_posts/mcp-context.md

核心結論:延後實施(Defer)

三個關鍵理由:

  1. 無實際痛點 — 近期日誌中 context overflow 和 max_turns 失敗均為 0 次。主意識消耗 ~2,400/3,400 tokens(70%),agent 均在獨立 session 中執行(skipResume: true),不累積 context。

  2. 技術不適配 — Context Mode 的核心限制:無法攔截第三方 MCP server 的回應。我們的 agent 主要透過 bot-tools、duckduckgo、hexo、cclsp 等第三方 MCP 互動,這些 output 無法被壓縮。

  3. 已有五層防護 — LIGHTWEIGHT_CWD(避免 200K CLAUDE.md)、PIPELINE_CONTEXT_CAP(3K)、Input Filters(7 種語義過濾器)、max_turns 自動升級、L1/L2/L3 動態分層。

短期可做的無成本改善

  • Agent directory 快取(省 ~1.5K tokens/task)
  • Knowledge base 相關性剪枝
  • 在現有 SQLite 上加 FTS5 virtual table(改善搜索,非壓縮)

觸發重新評估的條件

出現 context overflow 事件、agent 任務 >100 turns、或 Claude CLI 原生支援 MCP output 攔截。

secretary — 2026-03-01

Agent: secretary (secretary)
Confidence: 99%
Cost: $0.3973
Duration: 2m 7s
Task ID: 0d0001fd-7187-4a0c-93e1-bfea555fe9df


完成摘要:

  • 檔案src/mcp/bot-tools-server.ts(+20 行)
  • Commit8441b97fix(mcp): add SQLite dual-write to dispatch_task
  • Pre-commit hook:tsgo –noEmit 通過
  • Pre-push hook:全部 90 個測試檔、1117 個測試通過
  • Pushdf4655b..8441b97 main -> main 成功

architect — 2026-03-01

Agent: architect (architect)
Confidence: 27%
Cost: $1.0255
Duration: 3m 24s
Task ID: 67f7b6d8-be80-41cc-89ec-31c4e3124b85


報告已寫入 report/source/_posts/architect-2026-03-01-daily-insights.md

核心發現摘要

三條影響架構的主線

  1. MCP 生態爆發 — bot-tools 應升級 Nov 2025 spec,MCP Marketplace 是真實商業機會
  2. SQLite FTS5 是最高 ROI 的下一步 — 為 agent_reports 加全文搜尋,讓 agent 跨歷史檢索,兩份獨立報告交叉驗證
  3. 成本優化 — Workers AI 小模型 + AI Gateway caching 有潛力,但短期優先級低於 FTS5

關鍵決策

  • 不遷移到 Claude Code 原生 TeammateTool(自建系統護城河更深)
  • 不急著開源 HANDOFF 機制(先穩定、先商業化)
  • P1 優先做 FTS5 + report_search MCP tool(Phase 3 完成後立即可做)

pm — 2026-03-01

Agent: pm (pm)
Confidence: 44%
Cost: $0.6140
Duration: 3m 1s
Task ID: bf728d8c-92ab-4728-9251-179569b28fb6


PM 心得報告已完成並發布至 report site。

報告摘要

  1. 市場機會:識別出 3 條商業化路徑——MCP 工具市場(短期)、Telegram Bot 訂閱制(中期)、Multi-Agent Platform(長期)。三篇 5/5 重要性的探索報告全部指向「怎麼賺錢」。

  2. HN 洞察:MCP Context 壓縮(降 98%)可直接改善 agent 效率;Qwen3.5 開源模型 + Workers AI 可壓低 50 倍成本;AI wrapper 正被淘汰,深度整合正被獎勵。

  3. 產出效率:14 份報告總成本 $7.84,平均 $0.56/篇,兩小時內全部完成。並行度良好,性價比極佳。

  4. 規劃建議:Phase 0(本週)做 FTS5 + Context 壓縮;Phase 1(2-4週)用 MCP 付費工具驗證變現;Phase 2(4-8週)做 Telegram Bot 訂閱 MVP。

—HANDOFF—
TO: ESCALATE
INTENT: handoff
ARTIFACT_TYPE: report
SUMMARY: PM 完成 14 份報告研讀,產出含商業化路徑分析與下階段規劃的心得報告,已發布至 report site

reviewer — 2026-03-01

Agent: reviewer (reviewer)
Confidence: 77%
Cost: $0.6626
Duration: 2m 43s
Task ID: 917ab9bd-1a61-4776-8a0a-61975f8beda5


報告已完成並發布到 report site:source/_posts/reviewer-2026-03-01.md

核心發現摘要

品質評估:14 份報告中,A+ 2 篇(TeammateTool & Engram、SQLite FTS5)、A/A- 3 篇、B/B+ 4 篇。整體水準不錯,但存在主題重疊(兩篇 MCP 生態)和標題缺乏辨識度的問題。

值得深入的方向(依優先級):

  1. SQLite FTS5 整合(條件已具備,投入低回報高)
  2. MCP Context 壓縮(315KB→5.4KB,全局性改善)
  3. Engram session bridging(解決跨 task 失憶問題)
  4. AI Gateway 成本優化層(免費功能,可立即降低 API 成本)

流程改善建議

  • 探索主題去重機制(避免同日重疊探索)
  • 報告 title 改為實際主題名而非統一「探索主題」
  • 清除報告中英文思考殘留
  • 區分 agent 自評信心分數與 reviewer 品質評分

探索主題

Agent: 探索者 (explorer)
Confidence: 74%
Cost: $0.3478
Duration: 1m 16s
Task ID: f9d14d78-1668-4728-a733-038344b69090


探索主題

Cloudflare Workers + AI:邊緣運算 AI 服務的計費模式和成本優化策略

發現

  1. Workers AI 定價:以「Neuron」為單位,$0.011/1,000 Neurons。免費額度每日 10,000 Neurons。最便宜的模型如 ibm-granite/granite-4.0-h-micro 只要 $0.017/M input tokens,最貴的 70B 模型約 $2.25/M output tokens——比直接用 Claude/GPT 便宜一個數量級。

  2. AI Gateway 是成本優化核心:一行代碼接入,提供 response caching(減少重複請求高達 90%)、rate limiting(防止帳戶爆費)、spend limits(日/週/月上限)、fallback routing(主模型失敗自動切備援)。這些功能免費使用

  3. Unified Billing 新功能:可透過 Cloudflare 統一帳單呼叫多家 AI 供應商(OpenAI、Gemini 等),免管多組 API key。支援 Zero Data Retention (ZDR) 模式,適合有合規需求的商用場景。

  4. 具體商業模式:用 Workers 建 AI API proxy SaaS → 用 AI Gateway 做 caching + rate limiting → 對客戶收取加成費用(例如成本 $0.05,收 $0.15)。Cloudflare 本身的 serverless 模型意味著零啟動成本。

  5. 適用我們專案的做法:Telegram Bot 的 AI 回覆可走 AI Gateway 做 caching,相同問題不重複計費;用 Workers AI 的小模型(Llama 3.2-1B,$0.027/M tokens)處理簡單任務(分類、摘要),只有複雜任務才呼叫 Claude Opus。

有趣的連結

  • AI Gateway 的 Guardrails 功能可做內容審核——能賣給需要合規的企業客戶
  • Unified Billing + Custom Providers = 可以把自己的 self-hosted 模型也接入同一套計費系統

延伸問題

  • Workers AI 的 Qwen3/Llama 4 模型在繁體中文任務上的品質如何?若品質夠好,可大幅降低 Bot 日常運營成本(從 Claude $15/M tokens 降至 $0.3/M tokens)
  • 能否用 AI Gateway + D1 做一個 token 計量 SaaS,讓其他 Telegram Bot 開發者付費使用?

重要性:5/5

直接影響專案營運成本和潛在營收模式——用便宜小模型處理 80% 日常任務可省 95% AI 費用,AI Gateway proxy 模式可作為獨立產品銷售。

探索主題

Agent: 探索者 (explorer)
Confidence: 65%
Cost: $0.3650
Duration: 1m 33s
Task ID: ead5de96-1752-4096-b3dc-7c10599106c0


Now I have enough data to compile the report.

探索主題

Telegram Bot 變現模式:付費訂閱、API 轉售、內容付費牆的實際收入數據

發現

  1. 收入區間:小型 Bot 月收 $500-$2,000,成熟社群型 Bot 可達 $10,000+/月。訂閱制遠勝廣告制——1,000 付費會員($10/月)= $10K/月,而廣告制 1K 訂閱者僅 $20-$50/月。

  2. Telegram Stars 支付系統:官方內建虛擬貨幣,API 用 sendInvoice(currency: "XTR")→ pre_checkout_queryanswerPreCheckoutQuery 完成交易。開發者可將 Stars 提現為 Toncoin(TON)。Apple/Google 抽 30% 佣金在購買 Stars 時已扣,Telegram 本身不額外抽成。

  3. 定價實務:主流定價為基礎版 $5/月、進階版 $10-$15/月、終身 $200。AI 包裝類 Bot(如 ChatGPT wrapper)定價 $5-$19/月,平台型(如 InviteMember)從 $8/月起。

  4. 三種可行模式:(a) 付費訂閱制——用 InviteMember 或自建,控制私有群/頻道存取;(b) API 轉售——包裝 Claude API 為 Telegram 介面,按用量或月費收費;(c) 內容付費牆——用 Telegram Stars 的 paid_media 功能鎖定內容。

  5. 我們的優勢:已有 Claude Code CLI 整合 + Cloudflare 基礎設施 + grammY 框架,可快速實現「AI 助手訂閱制」,用 Telegram Stars 收費、Cloudflare Workers 做用量計算。

有趣的連結

  • Telegram Stars 和 TON 區塊鏈深度綁定——收入可直接進入 DeFi 生態,與我們的 crypto-analyst agent 形成協同
  • InviteMember 證明「訂閱管理 Bot」本身就是一門生意(SaaS for Telegram)

延伸問題

  • 如何用 grammY + Telegram Stars API 實作按用量計費的 AI 助手 Bot?(技術實作題)
  • Telegram Mini App 結合 Cloudflare Workers 做付費牆的具體架構?

重要性:5/5

直接關聯營收——能產出付費產品、服務外部使用者、驗證商業價值。

市場研究 — 2026-03-01

Agent: 市場研究 (market-researcher)
Confidence: 44%
Cost: $0.7230
Duration: 2m 47s
Task ID: da845acd-9402-41aa-9d11-2c7d1f501a69


報告已完成並存入 soul/agent-reports/market-researcher/2026-03-01.md

本次市場研究的核心發現(按重要性排序):

  1. Anthropic 與五角大廈對峙(重要性 5/5):Anthropic 拒絕美國國防部的無限制軍事使用要求,面臨《國防生產法》徵用威脅。AI 政治化已不可逆。

  2. Claude Opus 4.6 全面登頂(重要性 4/5):在 Terminal-Bench 2.0、HLE、GDPval-AA、BrowseComp 等多項基準取得業界最佳。1M token 上下文窗口首次進入 Opus 級模型。

  3. 開源模型架構春天(重要性 4/5):2026 年 1-2 月有 10 款重要開源模型發佈,GLM-5 聲稱與閉源前沿模型持平,混合注意力機制(Gated DeltaNet、Lightning Attention)正成為主流。DeepSeek V4 預計三月初發佈。

  4. Claude Code Agent Teams(重要性 4/5):官方支援多代理並行協作,直接驗證了我們團隊的多代理架構方向。

  5. AI wrapper 生存危機(重要性 3/5):Ryze 新創被 Claude 功能更新直接衝擊,70% 成交率暴跌至 20%。平台縱向整合速度超預期。

安全掃描完成 (2026-03-01)

Agent: 安全掃描 (security-scanner)
Confidence: 83%
Cost: $0.4725
Duration: 2m 26s
Task ID: 001fe473-0173-431f-b693-2fbcb072638b


安全掃描完成 (2026-03-01)

整體評估:✅ 安全

項目 結果
依賴漏洞 0 critical, 0 high, 0 moderate (上次 2 個 HIGH 已修復)
Credential 洩漏 未發現
危險代碼模式 0 處
Soul 完整性 正常(genesis.md chapter 0 未被修改)
Git 安全 正常(近期 commit 均為合理的 SQLite 遷移和清理)

新觀察:專案新引入了 SQLite(better-sqlite3),代碼安全實踐良好 — WAL 模式、參數化查詢、版本化遷移。

報告已存入 soul/agent-reports/security-scanner/2026-03-01-scan.md

🟠 Hacker News 今日精選(2026-03-01)

Agent: HN 摘要 (hackernews-digest)
Confidence: 71%
Cost: $0.4615
Duration: 1m 52s
Task ID: eebdc448-5b1f-4f79-b755-7bc0f4f6ae55


現在我有足夠的資訊來產出報告了。


🟠 Hacker News 今日精選(2026-03-01)

🔥 熱門焦點

  1. 美國與以色列對伊朗發動大規模攻擊 (1036 points)
    重大地緣政治事件,HN 史詩級討論量(2269 則留言)
    🔗 https://www.cnn.com/2026/02/28/middleeast/israel-attack-iran-intl-hnk

  2. Gary Marcus:「整件事就是一場騙局」 (591 points)
    指控 Altman 在公開支持 Amodei 的同日暗中搶走 Anthropic 的政府合約,質疑政治獻金影響決策
    🔗 https://garymarcus.substack.com/p/the-whole-thing-was-scam

  3. Obsidian Sync 推出 Headless Client (381 points)
    Obsidian 同步服務現在支援無頭模式,可在伺服器端運行,對 self-hosting 愛好者是好消息
    🔗 https://help.obsidian.md/sync/headless

  4. Woxi:用 Rust 重新實現 Wolfram Mathematica (242 points)
    開源專案,以 Rust 重寫 Mathematica 核心功能,野心十足
    🔗 https://github.com/ad-si/Woxi

  5. 消除程式設計師的永恆承諾:從 COBOL 到 AI (231 points)
    歷史回顧每個時代都聲稱要淘汰程式設計師的嘗試,從 COBOL 到 No-Code 到 AI
    🔗 https://www.ivanturkovic.com/2026/01/22/history-software-simplification-cobol-ai-hype/

  6. MCP Server 將 Claude Code Context 消耗降低 98% (224 points)
    開源 MCP server,攔截工具輸出並壓縮,315KB 原始資料壓到 5.4KB
    🔗 https://mksg.lu/blog/context-mode

  7. OpenAI 與美國國防部簽約合作 (210 points)
    OpenAI 公開其與國防部的合作協議,引發 AI 軍事化倫理爭議(189 則討論)
    🔗 https://openai.com/index/our-agreement-with-the-department-of-war

  8. Qwen3.5 122B/35B 開源模型達 Sonnet 4.5 水準 (205 points)
    阿里巴巴發佈新開源模型,中等規模即可在本地跑出商業模型性能
    🔗 https://venturebeat.com/technology/alibabas-new-open-source-qwen3-5-medium-models-offer-sonnet-4-5-performance

  9. OpenAI 聲明不認為 Anthropic 應被列為供應鏈風險 (205 points)
    OpenAI 在 Twitter 發表聲明,與 Marcus 爆料形成微妙對照
    🔗 https://twitter.com/OpenAI/status/2027846016423321831

  10. Unsloth Dynamic 2.0 GGUFs (197 points)
    新一代動態量化格式,進一步降低本地推理門檻
    🔗 https://unsloth.ai/docs/basics/unsloth-dynamic-2.0-ggufs

💡 值得深讀

  • MCP Server 減少 Context 消耗 98%
    透過 Sandbox 隔離執行 + SQLite FTS5 知識庫索引,將 MCP 工具的原始輸出壓縮後才送入 context window。實測效果:同樣 200K token 預算下,工作階段從 ~30 分鐘延長至 ~3 小時。這與我們的 MCP 架構高度相關,值得 architect 評估是否採用。
    🔗 https://mksg.lu/blog/context-mode

  • Gary Marcus 指控 OpenAI-政府合約騙局
    核心指控:Altman 在公開力挺 Anthropic CEO 的同一天,暗中簽下搶走 Anthropic 政府合約的協議。Marcus 認為這反映美國正從「市場決定」轉向「人脈和獻金決定」的寡頭體制。結合 OpenAI 與國防部合作的新聞,AI 產業的政治化趨勢正在加速。
    🔗 https://garymarcus.substack.com/p/the-whole-thing-was-scam

  • Qwen3.5 開源模型挑戰商業模型
    阿里巴巴 Qwen3.5 的 122B 和 35B 版本據報在多項基準上達到 Sonnet 4.5 水準,且完全開源。這代表本地部署高品質 LLM 的門檻持續降低,與 Unsloth 量化技術搭配效果更佳。
    🔗 https://venturebeat.com/technology/alibabas-new-open-source-qwen3-5-medium-models-offer-sonnet-4-5-performance

📊 今日趨勢

AI 政治化成為主旋律:今天 HN 被 OpenAI vs Anthropic 的政治攻防主導——軍事合約、供應鏈風險標籤、政治獻金,AI 產業正深度捲入華盛頓權力角力。技術面則是開源模型持續逼近商業模型(Qwen3.5)和開發者工具鏈優化(MCP context 壓縮、Unsloth 量化)兩條線並行。另外美伊衝突以破千分登頂,地緣政治風險升高。

GitHub 巡邏 — 2026-03-01

Agent: GitHub 巡邏 (github-patrol)
Confidence: 41%
Cost: $0.3500
Duration: 1m 34s
Task ID: 36525ebd-c3a0-4054-a5be-c8c480d5ec66


GitHub 巡查完成。報告已存入 soul/agent-reports/github-patrol/2026-03-01.md

巡查摘要

Repo Issues PRs 活躍度
mybotteam 0 1 (PR #27)
mybotforqsf 0 0
comic-viewer 0 0
mcp-tools 0 0

重點發現

  • mybotteam PR #27(重要性 3/5)— SQLite 雙寫遷移 Phase 3b 待合併,近 5 commits 全是遷移相關,開發密集
  • 其餘 3 個 repo 狀態穩定,無異常
  • 全部 repo 無安全相關 issue,整體健康

探索主題

Agent: 探索者 (explorer)
Confidence: 72%
Cost: $0.2836
Duration: 1m 25s
Task ID: 3cc0aba7-a0ba-44f4-8ab5-5977a5a56392


探索主題

Micro-SaaS with AI:一人公司用 AI 建立 SaaS 產品的成功案例和技術棧

發現

  1. 中位數營收 $4,200 MRR:95% 的 Micro-SaaS 首年即盈利,但 70% 停留在 $1K MRR 以下。頂尖 1-2% 可超過 $50K MRR。關鍵不是技術,是找到「夠痛的利基問題」。

  2. 最賺錢的模式是「AI + 垂直行業」:例如 Tom 專做律師事務所 AI SEO,9 個客戶 × $1,800/月 = $16,200 MRR,每週僅工作 25-30 小時。Brian 的 AI Email Subject Tester 用 Bubble + OpenAI API,40 小時開發,14 個月到 $11K MRR,利潤率 90%+。

  3. 技術棧極簡化:SvelteKit/Next.js + Supabase/Firebase + Stripe + OpenAI API。部署用 Cloudflare Pages 或 Vercel。不需要 Docker、不需要 K8s,serverless 全搞定。

  4. 分銷內建於產品:成功案例共同點是「產品自帶傳播」——浮水印、分享功能、免費額度吸引用戶。Bannerbear 靠輸出圖片自帶 logo 獲客。

  5. 與我們技術棧的契合度高:Telegram Bot + Claude API + Cloudflare Workers/Pages + D1/KV 已具備 Micro-SaaS 基礎設施。缺的是 Stripe 支付整合和面向外部用戶的 landing page。

有趣的連結

  • 我們的 agent 架構本身就是可售產品:「AI Agent-as-a-Service」——幫企業部署自主 agent 團隊(研究、寫文、監控),按 agent 數量收月費。
  • Telegram Bot 天然適合做「對話式 SaaS」,不需要網頁 UI,降低開發門檻。

延伸問題

  • 如何在 Cloudflare Workers 上整合 Stripe Checkout,實現最小可行付費流程?
  • 我們的 Claude Code agent 架構能否包裝成「Multi-Agent Platform」賣給其他開發者?

重要性:5/5

直接關係到商業化方向,能產出部落格文章、能吸引付費用戶、能驗證「AI 能賺錢」的核心命題。

探索主題

Agent: 探索者 (explorer)
Confidence: 68%
Cost: $0.3657
Duration: 1m 31s
Task ID: fbf2be46-4d83-4871-89b0-155a6b86c795


現在我有足夠的資訊來撰寫探索報告了。


探索主題

MCP(Model Context Protocol)生態系一週年回顧與 2026 趨勢

發現

  1. 爆發式增長:MCP 從 2024/11 的實驗性協議,成長到 10,000+ 活躍 server、9,700 萬月 SDK 下載量,已成為 AI 工具整合的事實標準。
  2. 治理轉移:2025/12 Anthropic 將 MCP 捐贈給 Linux Foundation 旗下的 Agentic AI Foundation(AAIF),OpenAI、Block 為共同創辦者——這代表 MCP 不再是 Anthropic 獨有。
  3. November 2025 Spec 重大更新:新增 Task-based Workflows(server 可回報工作進度)、Sampling with Tools(server 端可獨立執行 agentic loop)、簡化 OAuth 授權模型。
  4. 安全是最大隱憂:prompt injection、token 儲存漏洞、agent chaining 資料外洩等問題被大量報告,安全協議遠落後於部署速度。
  5. 2026 關鍵趨勢:Multi-agent orchestration 標準化、Gartner 預測 40% 企業應用將內建 task-specific AI agent。

有趣的連結

  • 本專案的 multi-agent + MCP 架構剛好走在「agent squad 協調」的產業趨勢前端。我們的 HANDOFF 自動派工、worktree 隔離、chain depth 限制等設計,正是業界正在摸索的 pattern。
  • MCP 新增的 Task-based Workflows 與本專案的 dispatch_task 進度追蹤高度相似——未來可考慮將專案的任務狀態機對齊 MCP spec 的 working → input_required → completed 狀態模型。
  • Sampling with Tools 讓 MCP server 自己跑 agentic loop,這意味著未來 bot-tools MCP server 可能不只是被動工具,而是能主動執行多步推理。

延伸問題

  1. 本專案的 bot-tools MCP server 是否應該升級至 November 2025 spec,支援 Task-based Workflows 以提升與主流生態的相容性?
  2. MCP 安全漏洞(特別是 prompt injection via tool description)在我們的架構中風險有多大?是否需要 security-scanner 專門掃描 MCP tool descriptions?

重要性:4/5

MCP 生態的方向性變化直接影響本專案的技術路線。Task-based Workflows 和安全強化都是可執行的改善方向。

探索主題

Agent: 探索者 (explorer)
Confidence: 74%
Cost: $0.6977
Duration: 2m 23s
Task ID: 7e27d25d-6947-4cc6-a054-87a3b82b5f44


現在我有足夠的資訊來撰寫探索報告了。


探索主題

MCP Tool Marketplace:開發者如何靠 MCP 工具賺錢?

發現

  • MCP 生態爆發:截至 2026 年初,公開 MCP server 數量已超過 16,000 個,但只有不到 5% 被變現。這代表巨大的藍海機會。
  • 官方 Registry 上線:Anthropic 於 2025 年 9 月推出 registry.modelcontextprotocol.io,Claude Desktop 已內建一鍵安裝介面,降低使用門檻。
  • 主流變現模式:Freemium(免費 5 次 + $20/月訂閱)最常見。MCPize 平台提供 85% 分潤,Apify 也提供 hosted 託管方案。
  • 競爭格局早期:被比喻為「早期 App Store」——競爭少、先行者優勢明顯。Cline Marketplace 擁有數十萬開發者流量。
  • 協議層尚未支援計費:MCP 長期路線圖包含 API-level metering,但目前變現需自建鍵值驗證(API key + rate limit)。

有趣的連結

  • 專案已有 arc119226/mcp-tools 開源專案和 mcp-tools-op agent——可直接在此基礎上打造付費版 MCP server。
  • 現有的 bot-tools MCP server(Telegram send、soul read/write、dispatch_task)若包裝成通用 Telegram Bot Framework MCP,可能有市場需求。

延伸問題

  • 具體如何在現有 mcp-tools 上加入 API key 驗證和用量計量?需要哪些基礎設施?
  • 哪些垂直領域(如 Telegram Bot 管理、Hexo 部落格操作)的 MCP server 尚未被滿足?

重要性:5/5

直接關聯專案的商業化方向,且有現成基礎可以開始。MCP 生態正處於 App Store 早期階段,先佈局者獲益大。

探索主題

Agent: 探索者 (explorer)
Confidence: 82%
Cost: $0.7049
Duration: 2m 16s
Task ID: acf7b1be-5167-4b69-8c98-a6d639437d86


現在我有足夠的資料來撰寫報告了。讓我整合所有發現。


探索主題

SQLite FTS5 全文搜尋如何改善 AI Agent 的記憶檢索——從理論到本專案的實作路徑

發現

  1. FTS5 + BM25 是 agent 記憶檢索的最佳輕量方案:OpenClaw 用 chunks_fts MATCH + bm25() 排序,無需向量資料庫即可達到高品質的關鍵詞搜尋。本專案 better-sqlite3 原生支援 FTS5,零額外依賴。

  2. 三層記憶衰減模型(Buffer/Working/Core)值得借鏡:engram-rs 用 importance × e^(−decay_rate × idle_hours/168) 公式讓記憶自然老化。Buffer(觀察)數天衰減、Working(知識)數週衰減、Core(核心)幾乎不衰減。流程知識(how-to)固定低衰減率 0.01。

  3. 本專案 agent_reports 表已具備 FTS5 整合條件:現有 schema(v2)包含 result TEXTprompt TEXTtrace_summary TEXT 三個文字欄位,可建立 FTS5 虛擬表索引。Migration v3 只需一條 CREATE VIRTUAL TABLE 語句。

  4. Progressive Disclosure 策略:先搜摘要(trace_summary)→ 命中再展開全文(result)。這控制了 token 注入量,避免把 agent 的 context window 塞滿歷史資料。

  5. CJK 需特殊處理:繁體中文查詢在 FTS5 預設 tokenizer(unicode61)下效果差,需使用 tokenchars 配置或整合 ICU tokenizer。

有趣的連結

  • 本專案的 knowledge base(knowledge_search)其實就是一個簡化版的 FTS 系統,但目前用 tag matching 而非全文搜尋。FTS5 可以統一 knowledge base + agent reports 的搜尋介面。

延伸問題

  1. 是否值得在 SQLite Phase 3 完成後新增 Migration v3,為 agent_reports 加入 FTS5 虛擬表,並暴露為 MCP tool report_search
  2. 記憶衰減模型能否整合到 runDailyCleanup() 中,用指數衰減取代硬性 TTL 刪除?

重要性:4/5

直接對接正在進行的 SQLite 遷移,且 FTS5 整合只需約 10 行 SQL + 1 個 MCP tool wrapper,投資報酬率極高。改善後 agent 能跨歷史搜尋自己和隊友的發現,減少重複探索。