长期记忆
构建可检索、可压缩、可更新的记忆层,让模型在跨会话任务中保持上下文连续性。
AI Research · Memory · Reasoning
Research Focus
作品集围绕大模型在真实环境中的核心短板展开:记忆如何沉淀、推理如何验证、智能体如何从工具调用走向稳定执行。
构建可检索、可压缩、可更新的记忆层,让模型在跨会话任务中保持上下文连续性。
关注复杂任务拆解、证据追踪、反思校验与失败恢复,降低幻觉和不可复现结论。
把模型、工具、浏览器、文件系统和评价闭环连接起来,面向真实工作流做系统实验。
Selected Work
下面是可替换为真实论文、代码仓库或产品 demo 的项目卡片,已按 AI 研究主页的展示逻辑组织。
长程对话记忆原型,支持事实抽取、冲突检测、摘要压缩和跨会话召回。
面向多步推理的评测集,记录证据引用、推理分支、失败节点和修正路径。
研究助手工作流实验,覆盖网页检索、文档解析、代码运行和引用追踪。
把论文、实验日志和概念关系整理成知识图谱,服务研究复盘和选题发现。
针对模型回答的事实性审计工具,标注来源缺失、概念漂移和过度推断。
面向个人研究主页的展示系统,整合论文、项目、博客和联系入口。
Stack & Methods
从模型能力评估到研究原型落地,强调可解释的数据流、可复现的实验记录和面向实际任务的系统工程。
01
构建任务集、评分标准和错误分类,分析模型在记忆和推理上的边界。
02
用轻量前后端、脚本和自动化工具快速验证研究想法。
03
把论文、实验、代码和结论沉淀成可复用的研究资产。
04
连接 LLM、检索、浏览器、文件和部署环境,形成闭环工作流。
Contact
适合放置邮箱、GitHub、论文主页或微信二维码。当前表单为前端演示,部署后可接入 Formspree、Netlify Forms 或自建 API。