Skip to content

违规检测记录

功能概述

违规检测记录用于查看和管理所有触发敏感词过滤的违规记录,包括用户信息、违规内容、敏感词类型、检测时间等。管理员可以查看违规详情、分析违规趋势、优化敏感词库。

主要功能

  • 记录查询:支持按用户、违规类型等多条件查询
  • 详情查看:查看完整的违规内容和上下文
  • 违规分析:统计违规类型和频次
  • 记录管理:删除误报或过期记录

违规类型

按来源分类

用户输入违规

  • 说明:用户发送的消息包含敏感词
  • 处理:消息被拦截,用户收到提示
  • 记录:保存用户输入的违规内容

AI 回复违规

  • 说明:AI 回复的消息包含敏感词
  • 处理:消息被拦截,提示用户稍后重试
  • 记录:保存 AI 生成的违规内容

按敏感词类型分类

百度云敏感词

  • 来源:百度云内容审核API
  • 类型:涉政、涉黄、暴恐、广告等
  • 优先级:高于自定义敏感词
  • 准确率:较高,误报率低

自定义敏感词

  • 来源:系统自定义敏感词库
  • 类型:根据业务需求自定义
  • 优先级:低于百度云敏感词
  • 准确率:取决于词库质量

查询功能

查询条件

用户名称

  • 类型:下拉选择
  • 说明:查看特定用户的违规记录
  • 用途:分析个别用户的违规行为

违规类型

  • 类型:下拉选择
  • 选项
    • 用户输入
    • AI回复
    • 全部类型
  • 作用:筛选特定类型的违规

查询操作

  • 查询按钮:根据设置的条件查询
  • 重置按钮:清空条件并刷新列表

违规记录字段说明

基本信息

用户信息

  • 格式用户名(昵称)
  • 说明:触发违规的用户
  • 点击:可跳转到用户详情页

违规类型

  • 说明:违规消息的来源
  • 选项:用户输入 / AI回复
  • 显示:标签形式

检测时间

  • 说明:违规被检测到的时间
  • 格式:YYYY-MM-DD HH:mm:ss
  • 时区:上海时区

违规内容

违规消息

  • 说明:包含敏感词的完整消息
  • 显示
    • 列表中显示简短摘要
    • 详情页显示完整内容
  • 格式:支持 Markdown 渲染

匹配的敏感词

  • 说明:命中的敏感词列表
  • 格式:多个敏感词用逗号分隔
  • 用途:分析哪些敏感词最容易触发

敏感词来源

  • 说明:标识来自哪个敏感词库
  • 选项
    • 百度云敏感词
    • 自定义敏感词
  • 显示:标签形式

处理信息

处理状态

  • 说明:违规记录的处理状态
  • 类型
    • 未处理:新产生的违规记录
    • 已处理:已审核或处理的记录
  • 操作:可手动更改状态

备注信息

  • 说明:对违规记录的补充说明
  • 用途:记录处理原因或备注
  • 格式:文本输入

使用建议

违规分析

  1. 高频敏感词

    • 统计出现频率最高的敏感词
    • 优化敏感词库配置
    • 调整检测策略
  2. 违规趋势

    • 按时间统计违规数量
    • 识别违规高发时段
    • 分析违规变化趋势
  3. 用户分析

    • 识别频繁违规的用户
    • 分析用户违规原因
    • 必要时进行用户教育

误报处理

  1. 查看详情

    • 点击"查看详情"查看完整内容
    • 判断是否为误报
    • 分析误报原因
  2. 调整词库

    • 将误报词从词库移除
    • 或添加白名单机制
    • 测试验证调整效果
  3. 用户反馈

    • 及时处理用户申诉
    • 告知处理结果
    • 持续优化检测规则

常见问题

Q:如何判断是否为误报?

A

  1. 查看完整的违规内容和上下文
  2. 分析敏感词匹配是否合理
  3. 考虑使用场景和语境
  4. 结合用户反馈综合判断

Q:违规记录可以删除吗?

A

  • 可以删除误报或过期的记录
  • 删除操作不可恢复,请谨慎
  • 建议保留一定时间的记录用于分析
  • 定期清理过期记录

Q:如何减少误报率?

A

  1. 优化敏感词库,移除过于宽泛的词
  2. 调整匹配算法,考虑上下文
  3. 增加白名单机制
  4. 使用百度云等第三方服务提高准确率

Q:违规记录保存多久?

A

  • 默认永久保存
  • 可根据需要定期清理
  • 建议保留最近3-6个月的记录
  • 重要记录可导出备份

Q:如何导出违规记录?

A

  • 当前版本可能不支持直接导出
  • 可以使用浏览器的打印功能
  • 或联系技术人员从数据库导出
  • 后续版本可能增加导出功能

相关文档