使用文档
知枢 RAG 智能知识平台使用手册,从安装部署到高级功能的完整指南。
01 · 安装与启动
桌面版安装
- 从下载页面获取最新的 Windows 安装包(
知枢 Setup x.x.x.exe) - 双击运行安装程序,选择安装路径
- 安装完成后从桌面或开始菜单启动「知枢」
- 首次启动会自动初始化数据库和默认管理员账号
提示:桌面版自带 Python 后端和 ChromaDB 向量数据库,无需额外安装任何依赖。
首次使用
启动后系统会自动创建默认管理员账号。首次登录请使用默认账号登录,然后立即修改密码。
新用户引导:首次登录后会自动跳转到使用指南页面,按照页面上的步骤完成模型配置和知识库创建即可开始使用。
02 · 配置 AI 模型
知枢需要配置至少一个 LLM 模型和一个 Embedding 模型才能正常工作。
LLM 模型(对话生成)
LLM 模型用于生成对话回复。支持以下模型和提供商:
| 模型 | 提供商 | 推荐场景 |
|---|---|---|
| GPT-4o / GPT-4o-mini | OpenAI | 通用,质量高 |
| Claude Sonnet 4 / Opus | Anthropic | 长文本,推理能力强 |
| DeepSeek-V3 | DeepSeek | 性价比高 |
| Qwen / 通义千问 | 阿里云 | 中文能力强 |
| Llama / Qwen(本地) | Ollama | 完全离线,数据不出本机 |
Embedding 模型(向量化)
Embedding 模型用于将文档和查询转换为向量,用于语义检索。
| 模型 | 提供商 | 说明 |
|---|---|---|
| embedding-3 | 智谱 AI | 中文效果好,推荐 |
| BGE-M3 | SiliconFlow | 多语言,免费额度 |
| text-embedding-3-small | OpenAI | 性价比高 |
配置步骤
- 进入「模型管理」页面
- 点击「添加模型」
- 选择模型类型(LLM / Embedding / Reranker)
- 选择提供商,填写 API 地址和 API Key
- 点击「测试连接」验证配置
- 保存后将模型设为默认(如需要)
03 · 创建知识库
新建知识库
- 进入「知识库」页面,点击「新建知识库」
- 填写名称和描述
- 选择 Embedding 模型(建议使用默认模型)
- 配置分块策略:
- 固定长度(推荐):按字数切分,默认 500 字
- 段落分割:按段落自然分割
- 递归分割:逐级尝试不同分隔符
- 标题分割:按标题结构切分
上传文档
进入知识库的文档管理页面,可以通过以下方式添加文档:
- 文件上传:点击上传按钮或直接拖拽文件到页面
- 网页抓取:输入 URL 自动抓取网页内容
- 数据库同步:连接数据库,将表数据同步为知识片段
支持的文件格式
验证效果
文档处理完成后,进入「检索测试」页面,输入问题测试检索效果。可以调整 top_k、分数阈值等参数。
04 · 开始对话
对话界面
进入「智能对话」页面,左侧是对话列表,右侧是对话区域。
- 选择知识库(在工具栏中选择)
- 选择 LLM 模型
- 输入问题,按回车发送
对话模式
| 模式 | 说明 | 适用场景 |
|---|---|---|
| 自动 | 根据问题智能选择检索或 SQL | 通用场景 |
| 知识检索 | 基于文档语义检索回答 | 文档问答 |
| 数据库查询 | 自然语言转 SQL 查询 | 数据分析 |
| 混合模式 | 文档 + 数据库综合回答 | 复杂问题 |
| 智能体 | 可调用工具自主完成任务 | 复杂任务 |
| 多 Agent | 跨知识库协作回答 | 跨领域问题 |
上下文策略
| 策略 | 说明 | 适用场景 |
|---|---|---|
| 滑动窗口 | 保留最近 N 条消息,按 token 预算截断 | 默认,大多数场景 |
| 语义摘要 | 将旧对话用 LLM 压缩为摘要 | 超长对话 |
| 完整上下文 | 保留全部历史(大模型适用) | 需要完整上下文 |
对话功能
- 引用来源:AI 回答时显示引用的文档和分块,点击可展开查看
- 关联记忆:显示 AI 使用了哪些用户记忆来个性化回答
- 反馈:对 AI 回答点赞或点踩,帮助优化
- 撤回:2 分钟内可撤回发送的消息
- 导出:将对话导出为 Markdown 文件
05 · 高级功能
Agent 智能体
在「技能市场」安装工具技能后,对话时选择「智能体」模式。AI 可以调用工具完成复杂任务,如搜索网页、执行代码、操作数据库等。
Prompt 技能
在「技能市场 → Prompt 技能」中创建自定义模板:
- 使用
{{variable}}语法定义输入变量 - 支持文本、JSON、Markdown 输出格式
- 可发布到市场供其他用户使用
- 提供 6 种预置模板(翻译、摘要、代码审查等)快速创建
技能链
将多个技能串联成流水线,前一个技能的输出作为后一个的输入。适用于文档处理、数据转换等多步骤任务。
多 Agent 协作
在「多 Agent 协作」页面创建多个专业 Agent,为每个 Agent 分配不同的知识库。当用户提问时,系统自动将问题分派给相关 Agent 并汇总答案。
应用发布
将知识库封装为面向外部用户的 Web 应用:
- 进入「应用发布」页面
- 创建应用,选择知识库和 LLM 模型
- 配置欢迎语、推荐问题
- 发布后获得分享链接和嵌入代码
渠道接入
在「渠道管理」中配置消息渠道,自动接收和回复消息:
自动化任务
配置定时或事件驱动的自动化任务:
- 定时触发:按 Cron 表达式定时执行
- Webhook 触发:通过 HTTP 请求触发
- 通知动作:发送到指定渠道或 Webhook
- 链执行动作:触发技能链处理
06 · 管理与运维
用户管理(管理员)
- 查看所有用户列表,搜索、筛选
- 修改用户角色(管理员 / 普通用户)
- 禁用或删除用户
- 重置用户密码
- 查看用户 Token 消耗和操作日志
- 为用户配置模型
工作空间
- 创建工作空间,邀请成员加入
- 设置成员角色(管理员 / 成员 / 只读)
- 在工作空间内共享知识库和模型配置
- 生成邀请链接,设置有效期和使用次数
系统诊断
进入「系统诊断」页面,自动检测:
- LLM 模型连接状态
- Embedding 模型配置
- 数据库连接状态
- 向量数据库状态
- 知识库和文档统计
个人设置
- 账号安全:修改密码、启用 2FA 两步验证
- API Key 管理:创建和管理 API Key,用于外部集成
- 用户记忆:查看、编辑、删除 AI 提取的记忆
- 用量统计:查看个人 Token 消耗趋势
数据备份与恢复
- 创建备份:在「个人设置」页面点击「下载备份」,导出包含数据库、向量库和上传文件的完整备份包
- 恢复备份:在「个人设置」页面选择备份文件进行恢复,恢复后需重启应用
建议:定期备份重要数据,恢复前建议先创建一份当前数据的备份作为保险。