本地知识库

概述

本地知识库让你快速关联本地文件目录,通过向量化和全文检索技术,让 AI 能够理解和利用你的文件内容。所有操作均在本地执行,你的数据永远不离开你的设备。

核心特性

  • 快速关联 —— 一键选择本地文件夹作为知识库
  • 向量化 —— 自动向量化文件内容,支持语义搜索(基于 BGE 模型)
  • 全文检索 —— 快速精确匹配关键词(使用 Jieba 分词)
  • 本地执行 —— 所有操作在本地执行,数据隐私得到保护
  • 智能上下文 —— AI 对话时自动检索相关知识作为上下文
  • 多格式支持 —— 支持 PDF、Word、Excel、PowerPoint、Markdown、纯文本等

添加知识库

  1. 在 ClawSky 侧边栏点击 知识库
  2. 点击 + 添加知识库 按钮
  3. 选择本地文件夹
  4. 系统自动扫描、解析和向量化文件内容

在对话中使用

添加知识库后,在 AI 对话中发起提问时:

  1. 系统自动检索相关的知识库内容
  2. 将检索到的上下文发送给 AI
  3. AI 基于知识库内容生成更准确的回答

你也可以在对话界面明确指定要使用哪个知识库,或者手动勾选要检索的知识库。

隐私与安全

ClawSky 本地知识库完全在你的设备上运行。文件内容不会被上传到任何远程服务器,所有向量化和检索操作都在本地完成。这确保了你的敏感信息、代码、文档等完全私有。

技术实现

  • 文档解析 —— 支持 PDF、DOCX、XLSX、PPTX、Markdown、纯文本多种格式的自动解析
  • 分词 —— 使用 Jieba 分词库进行中英文分词
  • 向量嵌入 —— 基于 BGE 模型的 ONNX 推理,完全离线运行
  • 存储 —— 使用 DuckDB 存储向量和文本数据,高效查询
  • 检索 —— 支持向量相似度搜索和全文关键词搜索

下一步