满足的需求 Need

个人知识管理中,笔记越积越多却找不到、用不上。传统RAG每次都从原始文档重新检索和拼凑答案,没有积累,问了白问。 Personal notes pile up but become unfindable and unusable. Traditional RAG re-derives answers from raw documents every time — no accumulation, making repeated queries pointless.

为什么开发 Motivation

受Karpathy LLM Wiki启发:应该让AI把零散知识「编译」成结构化知识库,而不是每次临时翻找。知识编译一次,持续增值。 Inspired by Karpathy's LLM Wiki: AI should 'compile' scattered knowledge into a structured knowledge base, not rummage through raw documents each time. Compile once, appreciate forever.

核心价值 Value

三层知识架构让原始资料和最终答案之间有了「编译层」——AI主动维护的结构化知识库;AI问答基于编译后的知识而非原始文档,答案质量更高且越用越准;双向链接+关系图让知识真正连成网。 Three-layer knowledge architecture inserts a 'compilation layer' between raw materials and final answers — an AI-maintained structured knowledge base. AI Q&A leverages compiled knowledge for higher-quality answers that improve over time. Bidirectional links + relationship graphs turn knowledge into a real network.

技术栈 Tech Stack

PythonTauri v2RustLangChainMilvus LiteTiptapCodeMirror 6

AI 驱动的个人知识库 + AI 助手

灵感源自 Karpathy LLM Wiki:不是每次提问都从原始文档重新检索,而是让 LLM 把零散资料「编译」成持续增值的结构化知识库。

Stop re-deriving, start compiling.

核心理念

传统 RAG 每次提问都从原始文档临时翻找、拼凑答案,没有积累。NoteAI 在原始资料和最终答案之间插入一个「编译层」——由 AI 主动维护的结构化 Markdown 知识库。知识编译一次,持续增值。

功能全景

  • 采集 — 网页文章下载(微信公众号/知乎优化)、PDF/DOCX/PPTX 多格式转换、AI 辅助排版
  • 整理 — 多级主题树、jieba 自动标签、笔记整合、AI 主题分析
  • 链接 — 双向链接发现(本地粗筛 + AI 精判)、关系图可视化、WIKI.md 自动索引
  • 编辑 — Tiptap + CodeMirror 6 双引擎、实时预览、AI 改写、主题综述
  • AI 助手 — RAG 问答、HyDE 查询优化、Flashrank 重排序、父子文档检索、长短记忆

RAG 检索流水线

用户提问 → HyDE 假设性答案生成
         → Milvus Lite 混合检索 (dense + sparse, bge-small-zh-v1.5)
         → 主题/标签过滤
         → FlagReranker 重排序 (bge-reranker-v2-m3)
         → MMR 去重
         → LLM 生成回答(流式输出)

三层知识架构

目录说明
RawNotes/原始 Markdown(不可变,来源真相)
WikiOrganized/AI 编译的结构化知识(LLM 拥有,持续更新)
ArchiveRaw/原始文件归档(PDF/DOCX/PPTX)