基础配置
模型基础配置用于设置AI模型的全局参数和各种专用模型的配置。通过合理配置,可以实现对话生成、图片识别、联网搜索、工具调用等多种AI能力。
配置概览
基础配置包含以下功能模块:
- 全局模型配置: 系统默认的AI模型设置
- 深度思考配置: 专用深度推理模型
- 工具调用配置: 支持函数调用的模型
- 图片解析配置: 图像识别和分析模型
- 联网配置: 网络搜索和联网能力
- 其他配置: Temperature、输入长度限制等高级设置
配置项说明
全局模型配置
全局地址
- 功能说明: 系统默认的AI模型API地址
- 用途:
- 对话标题生成
- 提问建议生成
- 提示词翻译
- 其他内置AI操作
- 作为未配置模型时的备用地址
- 格式要求:
- 必须是有效的HTTP/HTTPS URL
- 系统会自动在地址末尾添加
/v1(如果未指定版本) - 示例:
https://api.openai.com实际调用为https://api.openai.com/v1
- 推荐服务商:
- OpenAI官方:
https://api.openai.com - LightAI API聚合:
https://api.lightai.io - 阿里云百炼:
https://dashscope.aliyuncs.com/compatible-mode
- OpenAI官方:
全局 Key
- 功能说明: 全局模型的API密钥
- 安全建议:
- 妥善保管,不要泄露
- 定期更换密钥
- 使用具有适当权限的密钥
- 不要在代码中硬编码
- 用途: 当具体模型未配置Key时,使用此全局Key
全局模型
- 功能说明: 系统默认使用的模型名称
- 用途: 后台静默操作,如标题生成、建议生成等
- 示例:
- OpenAI:
gpt-4o-mini - DeepSeek:
deepseek-chat - Claude:
claude-3-haiku
- OpenAI:
- 建议: 选择性价比高、速度快的轻量级模型
深度思考配置
深度思考模型用于需要复杂推理和思考的场景,如数学计算、逻辑推理、复杂问题分析等。
深度思考地址
- 功能说明: 深度思考模型的API地址
- 预设选项:
- DeepSeek官方:
https://api.deepseek.com - 阿里云百炼:
https://dashscope.aliyuncs.com/compatible-mode - 腾讯云知识引擎:
https://api.lkeap.cloud.tencent.com - LightAI API:
https://api.lightai.io - 自定义: 手动输入其他地址
- DeepSeek官方:
- 注意: 需在具体模型设置中开启"深度思考模式"
深度思考 Key
- 功能说明: 深度思考模型的API密钥
- 获取方式:
- DeepSeek: 在控制台创建API Key
- 阿里云: 在百炼平台获取DashScope Key
- 其他平台: 参考对应平台的文档
深度思考模型
- 功能说明: 深度推理使用的模型名称
- 推荐模型:
deepseek-reasoner: DeepSeek推理模型deepseek-chat: DeepSeek对话模型(支持推理)- 其他支持长上下文推理的模型
- 应用场景:
- 复杂数学问题
- 逻辑推理任务
- 长链思考问题
- 需要多步推理的分析
工具调用配置
工具调用模型需要支持Function Calling功能,用于调用系统内置工具(如联网搜索、计算器等)。
工具调用地址
- 功能说明: 支持函数调用的模型API地址
- 要求: 模型必须支持OpenAI兼容的Function Calling接口
- 推荐: GPT-4o、Claude-3.5-Sonnet、DeepSeek-V3等
工具调用 Key
- 功能说明: 工具调用模型的API密钥
工具调用模型
- 功能说明: 用于执行工具调用的模型名称
- 推荐模型:
gpt-4o: OpenAI最新模型,工具调用能力强claude-3-5-sonnet-20241022: Anthropic模型deepseek-chat: DeepSeek支持工具调用
- 重要提示: 必须选择支持Function Calling的模型
图片解析配置
图片解析模型用于识别和分析用户上传的图片内容。
图片解析地址
- 功能说明: 图片识别模型的API地址
- 要求: 模型必须支持视觉能力(Vision)
- 推荐模型:
- GPT-4 Vision系列
- Claude 3.5 Sonnet(支持视觉)
- Gemini Pro Vision
- 通义千问VL
图片解析 Key
- 功能说明: 图片解析模型的API密钥
图片解析模型
- 功能说明: 用于图片分析的模型名称
- 推荐模型:
gpt-4-vision-preview: OpenAI视觉模型gpt-4o: 支持视觉的最新模型claude-3-5-sonnet-20241022: Claude视觉模型
- 功能:
- 识别图片中的文字(OCR)
- 理解图片内容
- 描述图片场景
- 分析图片中的数据
联网配置
联网插件允许AI模型通过搜索获取实时信息,增强问答能力。
联网搜索地址
- 功能说明: 联网搜索插件的API地址
- 预设选项:
- 智谱 web-search-pro:
https://open.bigmodel.cn/api/paas/v4/tools - 博查 web-search:
https://api.bochaai.com/v1/web-search - Tavily(1000次/月免费):
https://api.tavily.com/search - 自定义: 手动输入其他搜索服务地址
- 智谱 web-search-pro:
- 功能: 实时网络搜索,获取最新信息
联网搜索 Key
- 功能说明: 联网搜索服务的API密钥
- 获取方式:
- 智谱: 在bigmodel.cn控制台创建
- 博查: 在bochaai.com注册获取
- Tavily: 在app.tavily.com免费注册
- 支持: 多个Key可用英文逗号分隔
单次调用上限
- 功能说明: 单次对话中联网搜索的最大调用次数
- 范围: 1-10次
- 默认值: 5次
- 建议:
- 增加次数可获取更全面的信息
- 但会增加响应时间和API成本
- 一般情况5次已足够
其他配置
继承对话模型
- 功能说明: 新建对话时是否继承上次使用的模型
- 可选值:
- 开启: 新对话自动使用上一次选择的模型
- 关闭: 新对话使用默认模型
- 建议: 开启可以提升用户体验,避免重复选择
生成提问建议
- 功能说明: 是否在对话结束后自动生成相关问题建议
- 可选值:
- 开启: 每次对话后生成3-5个相关问题
- 关闭: 不生成建议
- 注意: 开启后会消耗额外的API调用量
Temperature
- 功能说明: 模型生成的随机性控制参数
- 范围: 0.0-2.0
- 默认值: 1.0
- 参数说明:
- 0.0: 输出确定,重复性高
- 0.7: 适中的随机性(推荐)
- 1.0: 较高随机性(默认)
- 1.5-2.0: 高创造性,输出更多样
- 建议:
- 创意写作: 1.0-1.5
- 事实问答: 0.3-0.7
- 编程任务: 0.2-0.5
- 一般情况: 保持默认1.0
输入框字符上限
- 功能说明: 用户输入框的字符数限制
- 范围: 1000-100000
- 默认值: 20000
- 作用: 防止过长输入导致系统错误或超时
- 建议:
- 一般情况: 20000已足够
- 长文本分析: 可提高到50000
- 注意输入长度会影响API费用和响应速度
全局头部预设
- 功能说明: 所有对话都会携带的系统预设提示词
- 用途:
- 定义AI的角色和行为
- 设置回复风格和语气
- 添加安全限制和规则
- 统一所有对话的行为模式
- 示例:
你是一个专业、友好、乐于助人的AI助手。请用简洁明了的语言回答问题, 保持客观中立,不产生有害内容。如果遇到不确定的问题,请诚实告知。 - 建议:
- 简洁明了,避免过长
- 聚焦于角色定位和行为规范
- 不要包含场景化的指令
- 长度建议控制在500字以内
配置建议
API服务商选择
OpenAI官方
- 优点: 质量最高,功能最全
- 缺点: 需要国际支付,价格较高
- 适合: 对质量要求高的场景
LightAI API聚合
- 优点: 一站式接入多种模型,价格透明,无需绑定
- 缺点: 需要注册第三方服务
- 适合: 需要灵活切换模型的场景
国内服务商(阿里云、腾讯云等)
- 优点: 国内访问快,支付方便
- 缺点: 模型质量可能略低
- 适合: 国内业务,对速度要求高的场景
模型选择建议
全局模型(用于轻量任务)
- 推荐使用:
gpt-4o-mini、claude-3-haiku、deepseek-chat - 特点: 速度快、成本低、适合简单任务
深度思考模型
- 推荐使用:
deepseek-reasoner、claude-3-opus - 特点: 推理能力强、适合复杂问题
工具调用模型
- 推荐使用:
gpt-4o、claude-3-5-sonnet - 特点: Function Calling支持好
图片解析模型
- 推荐使用:
gpt-4o、claude-3-5-sonnet - 特点: 视觉理解能力强
成本优化建议
分级使用模型
- 简单任务用轻量模型(gpt-4o-mini)
- 复杂任务用强力模型(gpt-4o)
- 可以大幅降低成本
合理设置调用上限
- 联网搜索默认5次足够
- 避免不必要的重复调用
- 监控API使用量
关闭不必要的功能
- 如果不需要提问建议,可以关闭
- 减少后台静默调用
安全建议
密钥管理
- 不要将密钥提交到代码仓库
- 定期更换API密钥
- 使用具有最小权限的密钥
访问控制
- 全局头部预设中添加安全规则
- 限制模型输出有害内容
- 设置内容过滤规则
监控和限流
- 监控API调用量
- 设置合理的速率限制
- 防止滥用和意外消耗
常见问题
Q: 全局模型和具体模型的模型有什么区别? A: 区别说明:
- 全局模型: 系统默认使用,用于后台任务(标题生成等)
- 具体模型: 用户在对话中选择的模型
- 如果具体模型未配置地址/Key,会使用全局配置
Q: 为什么要配置多个不同的模型? A: 原因:
- 不同任务需要不同能力的模型
- 成本优化:简单任务用便宜模型,复杂任务用强力模型
- 专用功能:图片解析、工具调用等需要特殊能力的模型
Q: 深度思考模型什么时候使用? A: 使用场景:
- 需要在模型设置中开启"深度思考模式"
- 适合复杂数学、逻辑推理问题
- 一般对话不需要深度思考
Q: 工具调用模型必须配置吗? A:
- 如果需要使用联网搜索等工具功能,必须配置
- 如果不使用工具功能,可以不配置
- 模型必须支持Function Calling
Q: Temperature应该设置多少? A: 建议:
- 一般情况保持默认1.0
- 创意写作可以设置1.2-1.5
- 事实问答建议0.3-0.7
- 编程任务建议0.2-0.5
Q: 如何获取各个服务商的API Key? A: 获取方式:
- OpenAI: platform.openai.com
- DeepSeek: platform.deepseek.com
- 阿里云百炼: dashscope.aliyuncs.com
- LightAI: api.lightai.io
- 注册后在控制台创建API Key
Q: 全局头部预设会影响所有对话吗? A: 是的。
- 所有对话都会携带此预设
- 用于统一AI的角色和行为
- 建议保持简洁,避免过长
Q: 联网搜索支持哪些服务商? A: 当前支持:
- 智谱AI web-search-pro
- 博查AI web-search
- Tavily(1000次/月免费)
- 也支持自定义其他兼容OpenAI接口的搜索服务
Q: 如何降低API使用成本? A: 优化建议:
- 使用轻量模型处理简单任务
- 合理设置联网搜索调用上限
- 关闭不必要的提问建议功能
- 监控使用量,及时调整
Q: 图片解析模型可以识别什么内容? A: 能力范围:
- 识别图片中的文字(OCR)
- 理解图片场景和内容
- 描述图片中的物体
- 分析图表、截图等
- 取决于模型能力
Q: 配置错误会导致什么问题? A: 可能的问题:
- 模型无法调用,提示配置错误
- 功能不可用(如图片解析、联网搜索)
- 响应速度慢或超时
- 建议配置后测试各项功能
配置示例
示例1: 使用LightAI聚合服务
yaml
全局地址: https://api.lightai.io
全局 Key: sk-lightai-xxx
全局模型: gpt-4o-mini
深度思考地址: https://api.lightai.io
深度思考 Key: sk-lightai-xxx
深度思考模型: deepseek-reasoner
工具调用地址: https://api.lightai.io
工具调用 Key: sk-lightai-xxx
工具调用模型: gpt-4o
图片解析地址: https://api.lightai.io
图片解析 Key: sk-lightai-xxx
图片解析模型: gpt-4o示例2: 使用DeepSeek
yaml
全局地址: https://api.deepseek.com
全局 Key: sk-deepseek-xxx
全局模型: deepseek-chat
深度思考地址: https://api.deepseek.com
深度思考 Key: sk-deepseek-xxx
深度思考模型: deepseek-reasoner
工具调用地址: https://api.deepseek.com
工具调用 Key: sk-deepseek-xxx
工具调用模型: deepseek-chat相关文档
- 模型设置文档 - 如何添加和管理具体模型
- 其他配置文档 - 高级配置选项
- OpenAI API文档
- DeepSeek文档