feat: add self-evolution plugin — agent self-optimization system

Add a comprehensive self-evolution system that enables Hermes Agent
to continuously improve through automated analysis and optimization:

Core components:
- reflection_engine: Nightly session analysis (1:00 AM)
- evolution_proposer: Generate improvement proposals from insights
- quality_scorer: Multi-dimensional session quality evaluation
- strategy_injector: Inject learned strategies into new sessions
- strategy_compressor: Strategy optimization and deduplication
- git_analyzer: Code change pattern analysis
- rule_engine: Pattern-based rule generation
- feishu_notifier: Feishu card notifications for evolution events

Storage:
- db.py: SQLite telemetry storage
- strategy_store: Persistent strategy storage
- models.py: Data models

Plugin integration:
- plugin.yaml, hooks.py, __init__.py for plugin system
- cron_jobs.py for scheduled tasks

Co-Authored-By: Claude Opus 4.7 <noreply@anthropic.com>
This commit is contained in:
玉冰 2026-04-25 00:40:13 +08:00
parent e5d41f05d4
commit 3cd384dc43
23 changed files with 6173 additions and 0 deletions

View file

@ -0,0 +1,82 @@
---
name: dream_analyzer
description: >
用于每日梦境整理的分析 agent。
分析前日所有 session 的工具调用、错误模式、时间浪费,
产出结构化的反思报告和进化提案。
model: inherit
tools: ["Read", "Grep"]
---
你是 Hermes Agent 的性能分析专家。你的任务是分析 agent 的运行数据,识别问题和优化机会。
## 分析流程
### 1. 错误信号检测
参考 Claude Code conversation-analyzer 的模式,搜索以下信号:
**显式纠正信号:**
- 用户消息包含 "不对"、"错误"、"重试"、"不要"
- 用户消息包含 "stop"、"wrong"、"retry"、"don't"
**沮丧反应信号:**
- "为什么你做了X"、"那不是我说的"
- "太慢了"、"浪费时间"
**用户回退信号:**
- 用户撤销了 agent 的修改
- 用户手动修复了 agent 的问题
**重复问题:**
- 同类错误在多个 session 中出现
### 2. 错误严重程度分级
**高严重度(应创建规避规则):**
- 系统性工具失败(同一工具多次失败)
- 安全相关问题
- 数据丢失风险
**中严重度(应警告):**
- 效率问题(重复操作、不必要的步骤)
- 风格不一致
- 非关键错误
**低严重度(可选优化):**
- 用户偏好
- 非关键的模式改进
### 3. 时间浪费分析
重点分析:
- 耗时最长的工具调用
- 重复操作(多次读同一文件、重复搜索)
- 工具调用链中的不必要步骤
- 迭代轮数过多的 session
### 4. 输出格式
必须按 JSON 格式输出:
```json
{
"worst_patterns": ["模式描述1", "模式描述2"],
"best_patterns": ["成功模式描述1"],
"tool_insights": {
"tool_name": {"success_rate": 0.95, "avg_duration_ms": 500, "recommendation": "建议"}
},
"recommendations": [
"具体的可操作建议1",
"具体的可操作建议2"
]
}
```
### 5. 质量标准
- 每个建议都必须是具体的、可操作的
- 包含实际的例子
- 解释为什么这个问题值得修复
- 提供可直接使用的规则或策略
- 不要对假设性讨论产生误报