Skip to content

知识库管理

配置概述

知识库管理用于管理系统和用户的文件向量缓存,支持文件上传和向量化处理。通过向量化技术,用户可以基于文档内容进行语义搜索和智能问答,实现知识管理和检索功能。

主要功能

  • 系统知识库:永久保存文件,适合企业知识库、产品文档等重要内容
  • 用户知识库:文件自动过期(默认3天),支持用户个性化内容
  • 文件上传:支持多种格式,自动进行向量化处理
  • 向量管理:查看和管理文件的向量缓存状态

功能说明

系统知识库

特点

  • 文件永久保存,不会自动过期
  • 适合上传企业知识库、产品文档、技术手册等重要内容
  • 管理员可查看、删除和管理所有文件
  • 支持批量上传和管理

适用场景

  • 企业内部知识库
  • 产品和技术文档
  • 培训资料和手册
  • 政策和制度文件

用户知识库

特点

  • 文件自动过期(默认3天后删除)
  • 用户可上传个人文档进行对话
  • 管理员可查看和管理用户上传的文件
  • 节省存储空间,避免数据堆积

适用场景

  • 用户个人文档处理
  • 临时性内容分析
  • 用户专属知识库

文件上传

支持格式

  • 纯文本(.txt)
  • Markdown(.md)
  • PDF(.pdf)
  • Word 文档(.docx)
  • 网页内容(URL)

上传流程

  1. 点击"上传文件"按钮
  2. 选择要上传的文件或输入网页 URL
  3. 系统自动进行向量化处理
  4. 处理完成后即可用于对话和搜索

文件限制

  • 单文件大小限制受向量配置影响
  • 超过字符限制的文件会被截断
  • 向量处理需要一定时间,请耐心等待

向量状态管理

状态说明

  • 处理中:文件正在向量化,请等待
  • 已完成:向量化成功,可以正常使用
  • 失败:向量化失败,请检查文件格式或重新上传

管理操作

  • 查看文件详情和向量状态
  • 删除不需要的文件
  • 批量清理过期或无效的向量缓存

使用建议

系统知识库组织

  1. 分类管理:按部门、项目或主题组织文件
  2. 命名规范:使用清晰的文件命名,便于识别
  3. 定期维护:定期清理过时或重复的文档
  4. 版本控制:重要文档更新后,及时删除旧版本

文件上传建议

文档质量

  • 确保文档内容清晰、结构完整
  • 避免上传乱码或格式错误的文件
  • 大文件建议拆分成多个小文件

格式选择

  • 优先使用 PDF 或 Word 格式
  • 简单文本可使用 .txt 或 .md
  • 网页内容直接提供 URL 即可

上传时机

  • 批量上传建议分批进行,避免系统负载过高
  • 选择业务低峰期上传大量文件
  • 上传后耐心等待向量化完成

存储管理

系统知识库

  • 定期审查文件列表,删除无用文件
  • 监控存储空间使用情况
  • 建立文件更新和删除流程

用户知识库

  • 依靠自动过期机制管理
  • 可手动清理异常或违规内容
  • 定期查看用户上传统计

常见问题

Q:系统知识库和用户知识库有什么区别?

A

  • 系统知识库:管理员上传,文件永久保存,适合公共内容
  • 用户知识库:用户自己上传,文件3天后过期,适合个人内容

Q:文件上传后多久可以开始使用?

A:文件上传后需要经过向量化处理才能使用,处理时间取决于:

  • 文件大小和格式
  • 服务器性能和当前负载
  • 一般情况下,中小文件在几分钟内完成

Q:向量化失败怎么办?

A:请检查:

  1. 文件格式是否支持
  2. 文件是否损坏或格式错误
  3. 文件大小是否超过限制
  4. 向量配置是否正确
  5. 查看服务器日志获取详细错误信息

Q:如何批量上传文件?

A

  1. 点击"上传文件"按钮
  2. 在上传对话框中可以一次选择多个文件
  3. 系统会逐个进行向量化处理
  4. 建议分批上传,避免一次上传过多文件

Q:文件会占用多少存储空间?

A:存储空间占用包括:

  • 原始文件大小
  • 向量数据(通常是原文件大小的1-2倍)
  • 建议定期清理不需要的文件,释放存储空间

Q:能否更新已上传的文件?

A

  1. 当前不支持直接更新文件
  2. 需要先删除旧文件,再上传新版本
  3. 删除后,相关的向量数据也会被清理

Q:向量配置会影响知识库吗?

A:是的。向量配置决定了:

  • 文件是否可以成功向量化
  • 向量化的质量和精度
  • 检索和问答的效果
  • 建议先完成向量配置,再上传文件

Q:用户上传的文件内容安全吗?

A

  • 管理员可以查看所有用户上传的文件
  • 建议定期审核用户知识库内容
  • 可设置自动过期机制,避免长期存储
  • 敏感内容应及时删除

相关文档