AI Research · Memory · Reasoning

郎佳奇

让大模型拥有可追溯的记忆与更稳健的推理。

Long-Context MemoryTool-Augmented ReasoningAgent EvaluationRetrieval SystemsAI Safety NotesResearch Prototypes Long-Context MemoryTool-Augmented ReasoningAgent EvaluationRetrieval SystemsAI Safety NotesResearch Prototypes

Research Focus

研究方向

作品集围绕大模型在真实环境中的核心短板展开:记忆如何沉淀、推理如何验证、智能体如何从工具调用走向稳定执行。

01

长期记忆

构建可检索、可压缩、可更新的记忆层,让模型在跨会话任务中保持上下文连续性。

02

推理可靠性

关注复杂任务拆解、证据追踪、反思校验与失败恢复,降低幻觉和不可复现结论。

03

智能体系统

把模型、工具、浏览器、文件系统和评价闭环连接起来,面向真实工作流做系统实验。

Selected Work

项目占位

下面是可替换为真实论文、代码仓库或产品 demo 的项目卡片,已按 AI 研究主页的展示逻辑组织。

Memory System 2026

LongMem Lab

长程对话记忆原型,支持事实抽取、冲突检测、摘要压缩和跨会话召回。

RAGVector DBEvaluation
Reasoning 2026

TraceReason Bench

面向多步推理的评测集,记录证据引用、推理分支、失败节点和修正路径。

BenchmarkCoTVerifier
Agent 2025

Research Agent OS

研究助手工作流实验,覆盖网页检索、文档解析、代码运行和引用追踪。

BrowserToolsWorkflow
Knowledge 2025

Knowledge Graph Notes

把论文、实验日志和概念关系整理成知识图谱,服务研究复盘和选题发现。

GraphNotesRetrieval
Safety 2025

Hallucination Audit

针对模型回答的事实性审计工具,标注来源缺失、概念漂移和过度推断。

AuditSourceRisk
Interface 2024

AI Portfolio Studio

面向个人研究主页的展示系统,整合论文、项目、博客和联系入口。

HTMLTailwindDesign

Stack & Methods

能力结构

从模型能力评估到研究原型落地,强调可解释的数据流、可复现的实验记录和面向实际任务的系统工程。

01

模型评测

构建任务集、评分标准和错误分类,分析模型在记忆和推理上的边界。

02

原型工程

用轻量前后端、脚本和自动化工具快速验证研究想法。

03

知识整理

把论文、实验、代码和结论沉淀成可复用的研究资产。

04

系统集成

连接 LLM、检索、浏览器、文件和部署环境,形成闭环工作流。

Contact

联系我

适合放置邮箱、GitHub、论文主页或微信二维码。当前表单为前端演示,部署后可接入 Formspree、Netlify Forms 或自建 API。