向量配置

配置概述

向量配置用于设置文件向量化和搜索的相关参数，包括向量模型、切片策略、缓存有效期等。通过向量化技术，系统可以实现语义搜索和智能检索功能，提升用户使用体验。

主要功能：

向量化处理：将文件内容转换为向量表示，支持语义理解
智能检索：基于向量相似度进行内容搜索，而非简单的关键词匹配
切片策略：控制文件切分方式，优化检索准确度
缓存管理：避免重复向量化，节省 API 成本

配置项说明

向量模型配置

向量模型地址

说明：向量模型的 API 地址
格式：URL
必填：否
示例：https://api.openai.com/v1
提示：留空则使用系统默认配置

向量模型 Key

说明：访问向量模型的 API 密钥
格式：文本
必填：否
提示：请妥善保管密钥，避免泄露

向量模型名称

说明：使用的向量模型类型
选项：
- text-embedding-3-small：轻量级模型，速度快，成本低
- text-embedding-3-large：高精度模型，语义理解更准确
- text-embedding-ada-002：经典模型，兼容性好
必填：否
默认值：text-embedding-3-small
建议：一般场景使用 small 模型即可，对精度要求高的场景使用 large 模型

切片策略配置

向量分析阈值

说明：文件启用向量分析的字符数阈值
单位：字符
必填：否
默认值：1000
提示：文件字符数超过此值时启用向量分析

文件字符限制

说明：单个文件允许进行向量化的最大字符数
单位：字符
必填：否
默认值：100000
提示：超过此限制的文件将被截断或跳过向量化

切片最大 token 数

说明：将文件切分时，每个切片的最大 token 数量
单位：token
必填：否
默认值：512
建议：
- 较小的切片（256-512）：检索更精准，但切片数量多，查询成本高
- 较大的切片（1024-2048）：查询成本低，但可能包含过多无关信息

切片重叠 token 数

说明：相邻切片之间的重叠 token 数量
单位：token
必填：否
默认值：50
作用：避免重要信息在切片边界被截断
建议：通常设置为最大 token 数的 10%-20%

缓存配置

向量缓存有效期

说明：向量数据在数据库中的缓存天数
单位：天
必填：否
默认值：3
提示：超过有效期的缓存会被自动清理，节省存储空间

配置建议

模型选择建议

根据场景选择合适的向量模型：

text-embedding-3-small（推荐）：

适用场景：一般文档检索、问答系统
优势：速度快、成本低、效果好
适用范围：90% 的场景

text-embedding-3-large：

适用场景：高精度语义搜索、专业领域检索
优势：语义理解更准确
注意：成本较高

text-embedding-ada-002：

适用场景：兼容性要求高的场景
注意：旧版本模型，性能不如 3 系列

切片策略优化

短文档（< 2000 字）：

切片最大 token 数：512
切片重叠 token 数：50
特点：精准检索，适合问答场景

长文档（> 5000 字）：

切片最大 token 数：1024-2048
切片重叠 token 数：100-200
特点：减少切片数量，降低查询成本

专业文档（法律、医疗等）：

切片最大 token 数：256-512
切片重叠 token 数：50-100
特点：高精度要求，避免信息遗漏

缓存策略

高频更新内容（新闻、动态等）：

缓存有效期：1-3 天
特点：保证内容新鲜度

稳定内容（知识库、文档等）：

缓存有效期：7-30 天
特点：节省成本，提高检索速度

存储空间有限：

缓存有效期：1-3 天
定期清理：避免数据库膨胀

常见问题

Q：向量模型有什么作用？

A：向量模型将文本转换为数字向量，使计算机能够理解语义关系。例如：

关键词搜索只能匹配"苹果"这个词
向量搜索可以理解"苹果"、"iPhone"、"水果"之间的关联

Q：切片大小和重叠如何影响检索效果？

A：

切片太小：可能丢失上下文信息，导致检索不完整
切片太大：可能包含过多无关信息，降低检索精准度
重叠太小：关键信息可能在切片边界被截断
重叠太大：增加存储和查询成本

Q：如何优化检索准确度？

A：

调整切片大小，找到上下文完整度和精准度的平衡点
适当增加重叠 token 数，避免信息截断
使用 large 模型提升语义理解能力
设置合理的向量分析阈值，过滤无关内容

Q：向量缓存如何节省成本？

A：

相同文件只向量化一次，后续直接使用缓存
避免重复调用向量 API，节省费用
根据内容更新频率设置合理的缓存有效期

Q：支持哪些文件格式？

A：系统支持常见的文本格式，包括：

纯文本（.txt）
Markdown（.md）
PDF（.pdf）
Word 文档（.docx）
网页内容（HTML 抓取）

Q：向量分析失败怎么办？

A：请检查：

向量模型地址和密钥是否正确
文件格式是否支持
文件大小是否超过限制
查看服务器日志获取详细错误信息

Q：如何测试向量配置是否正常？

A：

保存配置后，上传一个测试文档
在知识库管理中查看文档是否成功向量化
使用语义搜索功能测试检索效果
检查向量缓存记录是否正常生成

相关文档

知识库管理 - 管理文档和知识库
模型管理 - 基础配置 - 模型向量配置