本地知识库
概述
本地知识库让你快速关联本地文件目录,通过向量化和全文检索技术,让 AI 能够理解和利用你的文件内容。所有操作均在本地执行,你的数据永远不离开你的设备。
核心特性
- 快速关联 —— 一键选择本地文件夹作为知识库
- 向量化 —— 自动向量化文件内容,支持语义搜索(基于 BGE 模型)
- 全文检索 —— 快速精确匹配关键词(使用 Jieba 分词)
- 本地执行 —— 所有操作在本地执行,数据隐私得到保护
- 智能上下文 —— AI 对话时自动检索相关知识作为上下文
- 多格式支持 —— 支持 PDF、Word、Excel、PowerPoint、Markdown、纯文本等
添加知识库
- 在 ClawSky 侧边栏点击 知识库
- 点击 + 添加知识库 按钮
- 选择本地文件夹
- 系统自动扫描、解析和向量化文件内容
在对话中使用
添加知识库后,在 AI 对话中发起提问时:
- 系统自动检索相关的知识库内容
- 将检索到的上下文发送给 AI
- AI 基于知识库内容生成更准确的回答
你也可以在对话界面明确指定要使用哪个知识库,或者手动勾选要检索的知识库。
隐私与安全
ClawSky 本地知识库完全在你的设备上运行。文件内容不会被上传到任何远程服务器,所有向量化和检索操作都在本地完成。这确保了你的敏感信息、代码、文档等完全私有。
技术实现
- 文档解析 —— 支持 PDF、DOCX、XLSX、PPTX、Markdown、纯文本多种格式的自动解析
- 分词 —— 使用 Jieba 分词库进行中英文分词
- 向量嵌入 —— 基于 BGE 模型的 ONNX 推理,完全离线运行
- 存储 —— 使用 DuckDB 存储向量和文本数据,高效查询
- 检索 —— 支持向量相似度搜索和全文关键词搜索
下一步
- 快速开始 —— 回到安装和配置指南