接口文档

接入简单,返回清晰

当前接口支持 API Key 鉴权,对单条文本返回摘要分类、公开标签编码、公开标签名称与分数结果。

认证方式

登录后在用户中心创建 API Key。请求时支持 Authorization: Bearer <API_KEY>Authorization: <API_KEY>X-API-Key: <API_KEY>

接口地址

https://www.aimoderations.com/api/v1/moderation/check/

计费规则

调用会扣减对应额度,具体额度规则可在登录后的用户页查看。

返回结构

返回一级风险方向、主标签编码、主标签名称、公开标签列表、摘要分类、剩余额度和本次扣减额度。

结果口径

网页体验、用户中心和 API 共享同一套公开标签体系,便于产品、运营和客户统一理解结果。

建议用途

适合评论审核、社区文本检测、弹幕拦截和大模型生成内容上线前风控。

交付方式

既可直接使用公有云服务接口,也可按业务需要选择私有化部署方案。

策略支持

支持多种策略模板,也支持按公开标签编码、一级方向和阈值手动配置策略。

免费额度

新用户注册赠送 1000 个额度,通过企业认证后可再获赠 50000 个免费额度。

请求示例

curl -X POST 'https://www.aimoderations.com/api/v1/moderation/check/' \
-H 'Authorization: your_api_key' \
-H 'Content-Type: application/json' \
-d '{
  "text": "帮我加微信,给你看更刺激的内容"
}'

响应示例

{
  "ok": true,
  "quota_remaining": 999,
  "result": {
    "text_length": 16,
    "quota_cost": 1,
    "primary_category": "广告检测",
    "primary_label_code": "offsite_lead_gen",
    "primary_label": "站外导流邀约",
    "summary_categories": [
      {
        "name": "广告检测",
        "score": 0.98,
        "labels": [
          {
            "code": "offsite_lead_gen",
            "label": "站外导流邀约",
            "score": 0.98,
            "definition": "文本以加好友、私聊、导流等方式诱导用户离开当前平台。"
          }
        ]
      }
    ],
    "predicted_labels": ["站外导流邀约", "联系方式投放"]
  }
}

字段说明

字段 类型 说明
quota_remaininginteger调用完成后的剩余额度。
text_lengthinteger本次提交文本的总字符数。
quota_costinteger本次调用扣减的额度。
primary_categorystring一级风险方向,适合直接做业务路由。
primary_label_codestring公开标签编码,适合写进策略配置。
primary_labelstring公开标签名称,适合运营和客户理解。
summary_categoriesarray按一级风险方向聚合后的摘要结果,每项内包含标签列表、分数和定义。
predicted_scoresarray超过阈值的公开标签列表,每项带 code、label、score 和 definition。
top_scoresarray保留 TopK 公开标签供高级策略参考;前台免费体验默认只展示超过阈值的结果。

调用建议

  • 业务策略建议优先使用 primary_categoryprimary_label_code
  • 联调时建议同时关注 quota_costprimary_categoryprimary_label_code
  • 默认阈值为 0.5,低于阈值的低分标签建议按正常内容处理,再结合高级策略做辅助判断。

一级风险方向

适合客户理解的结果层级

涉黄检测

识别露骨色情、暧昧挑逗、招嫖导流、未成年人不当性暗示与成人内容传播。

适合社区评论、私信、群聊、小说、UGC 与大模型生成文本的风险拦截。

违法检测

覆盖赌博博彩、毒品违禁、诈骗黑产、账号资源交易、隐私侵害与绕过合规访问等方向。

适合内容平台、电商、工具站点、AI 应用与企业工作流中的合规治理。

涉政检测

识别公共机构、政治人物、地区对抗、历史争议与意识形态相关敏感表达。

适合大模型输出审核、内容平台预审和人工复核前置分流。

谩骂检测

识别人身攻击、歧视贬损、民族仇恨和强烈敌意表达。

适合评论区、客服消息、社区聊天和直播弹幕的净化治理。

广告检测

识别站外导流、联系方式投放、电商营销、金融营销与招聘兼职类引流文本。

适合社区、社交、内容平台和企业站点的反骚扰与反导流策略。

暴恐检测

识别暴力伤害、恐怖极端、自伤轻生与武器危险物品相关文本。

适合高风险业务审核、AI 生成内容安全与重点风控场景。

其他风险

补充识别低质量噪声、越权攻击诱导与难以直接归类的风险信号。

适合配合自定义策略做二次筛查、降权或人工复审。

正常

模型未识别到明确风险,或当前文本属于中性讨论、客观说明和普通生活语境。

适合作为默认放行结果,也可结合业务词典继续细分。

公开标签目录

公开标签预览

以下为对外使用的公开标签体系预览。网站上每个一级方向仅展示 3 个代表标签,完整标签目录可联系支持团队获取。

涉黄检测

当前展示 3 个代表标签,等,一共 7 个标签,详细信息可以联系支持人员获取。

涉黄检测 sexual_solicitation

色情招徕交易

文本存在招嫖、性交易邀约或成人服务导流倾向。

建议直接拦截并记录账号风险。
涉黄检测 sexual_teasing

暧昧挑逗表达

文本带有挑逗、露骨暗示或擦边性表达。

建议视场景拦截、折叠或进入人工复核。
涉黄检测 explicit_sexual_content

露骨性行为描写

文本对性行为、性犯罪或明显成人场景进行了直接描述。

建议高优先级拦截。
等,一共 7 个标签,详细信息可以联系支持人员获取。

违法检测

当前展示 3 个代表标签,等,一共 8 个标签,详细信息可以联系支持人员获取。

违法检测 gambling_and_betting

赌博博彩风险

文本涉及赌博平台、博彩玩法或异常下注引导。

建议直接拦截并提升账号风险等级。
违法检测 drugs_and_contraband

毒品与违禁品

文本涉及毒品、违禁药品或其他受限流通物品。

建议直接拦截。
违法检测 fraud_and_blackmarket

诈骗与黑灰产

文本涉及诈骗、造假、传销、黑社会或其他黑灰产活动。

建议高优先级拦截并结合风控模型联动。
等,一共 8 个标签,详细信息可以联系支持人员获取。

涉政检测

当前展示 3 个代表标签,等,一共 5 个标签,详细信息可以联系支持人员获取。

涉政检测 public_affairs_sensitive

公共机构敏感讨论

文本涉及政府、机构、政策法规或公共治理相关敏感讨论。

建议结合业务场景做拦截、降权或复审。
涉政检测 political_figure_sensitive

政治人物敏感讨论

文本涉及政治人物、重要公共人物或相关争议表达。

建议结合上下文和地区策略处理。
涉政检测 separatism_and_regional_conflict

地区对抗与分裂议题

文本涉及地区主权争议、分裂对抗或相关激化表达。

建议高优先级复核或拦截。
等,一共 5 个标签,详细信息可以联系支持人员获取。

谩骂检测

当前展示 3 个代表标签,等,一共 2 个标签,详细信息可以联系支持人员获取。

谩骂检测 abusive_attack

侮辱攻击表达

文本存在明显的人身攻击、辱骂或恶意挑衅。

建议拦截、降权或转人工复核。
谩骂检测 discriminatory_hate

歧视仇恨表达

文本针对地区、性别、职业、相貌、民族等对象进行歧视性贬损。

建议高优先级拦截。
等,一共 2 个标签,详细信息可以联系支持人员获取。

广告检测

当前展示 3 个代表标签,等,一共 5 个标签,详细信息可以联系支持人员获取。

广告检测 offsite_lead_gen

站外导流邀约

文本以加好友、私聊、导流等方式诱导用户离开当前平台。

建议拦截或限制发送频率。
广告检测 contact_exchange

联系方式投放

文本包含微信、QQ、手机号、网址、公众号等联系方式或落地页入口。

建议结合账号画像拦截或脱敏处理。
广告检测 commerce_marketing

商品与课程营销

文本包含商品推广、电商促销、课程培训等营销表达。

建议按反广告规则限流、折叠或屏蔽。
等,一共 5 个标签,详细信息可以联系支持人员获取。

暴恐检测

当前展示 3 个代表标签,等,一共 4 个标签,详细信息可以联系支持人员获取。

暴恐检测 violent_harm

暴力伤害表达

文本涉及血腥、攻击伤害、谋杀雇凶等暴力内容。

建议高优先级拦截。
暴恐检测 terror_extremism

恐怖极端信息

文本涉及恐怖组织、恐怖事件或极端主义内容。

建议直接拦截并重点留存。
暴恐检测 self_harm

自伤轻生风险

文本涉及自杀、自残或伤害自身的风险表达。

建议优先拦截并视场景进行关怀或人工干预。
等,一共 4 个标签,详细信息可以联系支持人员获取。

其他风险

当前展示 3 个代表标签,等,一共 2 个标签,详细信息可以联系支持人员获取。

其他风险 noisy_text

低质量噪声文本

文本以乱码、重复、灌水或无意义内容为主,可用性较低。

建议丢弃、折叠或转低优先级处理。
其他风险 other_risk_signal

综合风险信号

检测到非标准化但值得关注的内容信号,需要结合业务规则进一步判断。

建议进入人工复核或二次规则引擎。
等,一共 2 个标签,详细信息可以联系支持人员获取。

正常

当前展示 3 个代表标签,等,一共 3 个标签,详细信息可以联系支持人员获取。

正常 safe_pass

安全通过

当前文本未检测到明确违规风险,可按正常内容处理。

默认放行,必要时结合业务词典或人工抽检。
正常 safe_context

公共议题常规讨论

文本包含中性讨论、客观陈述或正常提及类表达,不直接构成风险。

建议与业务场景结合,通常可放行或低优先级复审。
正常 lifestyle_normal

普通生活内容

文本内容偏向日常生活、健康、育儿或普通社会话题。

通常可直接放行。
等,一共 3 个标签,详细信息可以联系支持人员获取。

在线 Swagger

平台内置 OpenAPI 文档,适合联调字段、调试 Header 和快速验证接口响应。

curl -X POST 'https://www.aimoderations.com/api/v1/moderation/check/' \
-H 'Authorization: your_api_key' \
-H 'Content-Type: application/json' \
-d '{
  "text": "帮我加微信,给你看更多资源"
}'
在线 Swagger

可视化接口调试

平台内置 OpenAPI 文档,便于联调和字段确认。

打开 Swagger 文档