GoForum🌐 V2EX

我把 Karpathy 的 LLM + Obsidian 知识库方法论落地了,跑了一周数据超出预期

mansunyunxin · 2026-04-16 23:35 · 0 次点赞 · 0 条回复

最近把 Karpathy 那套「 LLM + Obsidian 个人知识库」方法论真正落地了。不是简单抄概念,是搭了一套能跑的系统:自动 Ingest 文章、自动体检、自动同步。跑了三天,数据说话。

Karpathy 说了什么

他的核心洞察:不要把 LLM 当搜索引擎用,让它像程序员维护代码库一样帮你维护 Wiki 。

现在大部分人用 AI 管知识的套路是 RAG:上传文档,提问,AI 检索相关片段,生成回答。ChatGPT 文件上传、NotebookLM 都是这个路数。

问题在于:没有积累。 每次都得从头来,问完了答案就没了,知识从来没被真正沉淀下来。

他的方案是:让 AI 持续地、增量式地构建和维护一个 Wiki——结构化的、互相链接的 Markdown 文件集合。添加新资料时,AI 会读资料、提取关键信息、更新相关实体页面、修正矛盾点。知识编译一次,然后持续保持最新。

三层架构

  • Raw Sources:原始资料层,只读不变
  • The Wiki:LLM 生成和维护的知识库层
  • The Schema:规则文件,对 Claude Code 来说就是 CLAUDE.md

三个核心操作

  1. Ingest:往 Wiki 里录入新资料,可能牵动 10-15 个 Wiki 页面的更新
  2. Query:对着 Wiki 提问,好的回答可以回存到 Wiki 里变成新页面,知识在复利增长
  3. Lint:定期体检,找矛盾点、过时信息、孤儿页面

我的落地实践

核心是一个 Obsidian Vault ,叫 brain:

brain/
├── ontology.md       # 知识索引
├── SCHEMA_OPS.md    # 操作规则
├── learnings/       # LLM 生成
├── memory/          # 每日日志
└── preferences/     # 用户偏好

实现了三个自动化:

  • Ingest 自动化:丢 URL → 抓取 → LLM 提取 → 写 learnings → 更新索引 → 记录来源
  • Lint 体检自动化:每周自动检查孤儿页面、悬空链接、90 天以上旧页面
  • Cron 调度:每天 23:00 同步 MEMORY.md ,每周 Lint

跑了十天,Vault 里有 23 个页面,健康评分 75100

为什么值得花时间

之前用飞书、Notion 、Obsidian ,页面之间都是孤立的。想找「关于 XX 主题我知道些什么」,得靠记忆而不是工具。

现在每 Ingest 一篇新文章,LLM 会自动更新相关概念页面、标注矛盾点、补充交叉引用。这个网络会随着使用不断生长,而且生长是有结构的。

知识复利,在系统里是真的能感受到的。

社区已经在卷

  • sage-wiki:Go 写的,一个二进制,支持 MCP Server
  • Claude Code Skill 版本:一行命令安装,直接在 Agent 里 ingest 来源

完整文章在微信公众号「云小虾」:我把 Karpathy 的知识库方法论落地了,效果超出预期

有同样在搭个人知识系统的同学,欢迎交流。

0 条回复
添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: mansunyunxin
发布: 2026-04-16
点赞: 0
回复: 0