jumdata

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

敏感词过滤-文本审核-敏感词审核-违禁词审核-敏感词检测-违禁词检测

前言

对文本中的违禁词、色情低俗、恶意推广、辱骂攻击、低质灌水等内容进行智能识别与广告法合规校验,适用于用户评论过滤、注册信息筛查、公开发布文章内容审核等场景。

热门使用场景

  1. 社区 UGC 内容智能审核
    针对用户评论、留言、发帖等互动内容进行实时敏感词过滤,精准识别违禁信息、辱骂攻击、低俗灌水及恶意推广内容,维护社区交流环境合规有序。

  2. 用户注册与昵称合规筛查
    对用户账号昵称、个性签名、注册资料等信息进行自动校验,拦截含违规敏感词、恶意引导及广告法违禁表述的内容,保障平台账号体系规范安全。

  3. 自媒体与文章内容合规检测
    面向公众号推文、资讯稿件、营销文案等文本内容,全面检测广告法违禁词、低俗色情、恶意推广等违规信息,降低内容发布合规风险。

API介绍

请求参数

名称 类型 必须 说明
text String 审核的文本

详见此处

返回示例

{
  "code": 200, // 返回码,详见返回码说明
  "msg": "成功",  // 返回对应的描述
  "taskNo": "40525341889422111006",  // 本次请求号
  "charge": true,  // 计费标志
  "data": {
    "result": "2", //  审核结果类型,可取值1、2、3、4,分别代表1:合规,2:不合规,3:疑似,4:审核失败
    "resultMsg": "不合规", // result对应的描述
    "resultItems": [ // 不合规项,合规时不返回
      {
        "nonComplianceType": 2, // 详见不合规类型
        "msg": "存在文本色情不合规", // 不合规描述
        "hits": [{ // 命中的词
          "probability": 0.972112, // 不合规项置信度,范围:0至1,数字越大,可能性越高
          "words": [  // 送检文本命中词库的关键词。
            ""
          ],
          "wordHitPositions": [ // 送检文本命中词库的详细信息,为Object的列表,keyword、positions、label三个字段。
            {
              "positions": [
                [
                  4,
                  6
                ]
              ],
              "label": "100400", // 关键词命中的细分标签,详见label字段描述。
              "keyword": "" // 命中的词
            }
          ],
          "modelHitPositions": [ // 送检文本命中模型的详细信息,包含位置信息及置信度信息。
            // 位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”;
            // 置信度信息:命中模型对应的置信度分数
            [
              0,
              4,
              0.9721
            ]
          ]
        }]
      },
      {
        "nonComplianceType": 4,
        "msg": "存在恶意推广不合规",
        "hits": [{
          "probability": 0.96125,
          "modelHitPositions": [
            [
              0,
              4,
              0.9616
            ]
          ]
        }]
      },
      ...
    ]
  }
}
posted on 2026-04-16 15:41  Jumdata  阅读(2)  评论(0)    收藏  举报