功能描述
建议添加分层记忆系统,实现对话上下文的智能管理和压缩,解决长对话场景下的 token 消耗和上下文丢失问题。
背景与动机
当前对话系统在处理长对话时面临以下问题:
- 上下文窗口有限,无法保留完整的对话历史
- token 消耗随对话长度线性增长
- 重要信息可能被后续消息淹没
- 缺乏跨会话的长期记忆能力
提议的解决方案
实现三层记忆架构:
L0 - 原始消息层 (Raw Messages)
- 保留最近 N 条完整对话消息
- 用于即时上下文理解
- 默认保留 10-20 条消息
L1 - 会话摘要层 (Session Summary)
- 自动总结已完成对话段落
- 压缩比约 80-90%
- 在 L0 满时触发总结
- 保留关键决策、代码修改、用户偏好
L2 - 长期记忆层 (Long-term Memory)
- 跨会话持久化存储
- 提取重要事实、规则、用户习惯
- 支持手动编辑和查询
- 可导出为 memory.md
预期效果
- 减少 80%+ 的 token 消耗
- 保持长对话的连贯性
- 实现跨会话记忆延续
- 支持用户自定义记忆规则
参考实现
类似功能已在 NousResearch/hermes-agent#43955 中讨论,实现了 85% token 节省。
相关 Issue
标签: enhancement, memory, feature-request
功能描述
建议添加分层记忆系统,实现对话上下文的智能管理和压缩,解决长对话场景下的 token 消耗和上下文丢失问题。
背景与动机
当前对话系统在处理长对话时面临以下问题:
提议的解决方案
实现三层记忆架构:
L0 - 原始消息层 (Raw Messages)
L1 - 会话摘要层 (Session Summary)
L2 - 长期记忆层 (Long-term Memory)
预期效果
参考实现
类似功能已在 NousResearch/hermes-agent#43955 中讨论,实现了 85% token 节省。
相关 Issue
标签: enhancement, memory, feature-request