审核能力

六大方向,覆盖主流文本风险

平台提供标准能力、策略模板和人工可配置策略,既能快速接入,也能逐步细化到企业自己的业务规则;同时支持中文与英文文本审核。

涉黄检测

识别露骨色情、暧昧挑逗、招嫖导流、未成年人不当性暗示与成人内容传播。

适合社区评论、私信、群聊、小说、UGC 与大模型生成文本的风险拦截。

违法检测

覆盖赌博博彩、毒品违禁、诈骗黑产、账号资源交易、隐私侵害与绕过合规访问等方向。

适合内容平台、电商、工具站点、AI 应用与企业工作流中的合规治理。

涉政检测

识别公共机构、政治人物、地区对抗、历史争议与意识形态相关敏感表达。

适合大模型输出审核、内容平台预审和人工复核前置分流。

谩骂检测

识别人身攻击、歧视贬损、民族仇恨和强烈敌意表达。

适合评论区、客服消息、社区聊天和直播弹幕的净化治理。

广告检测

识别站外导流、联系方式投放、电商营销、金融营销与招聘兼职类引流文本。

适合社区、社交、内容平台和企业站点的反骚扰与反导流策略。

暴恐检测

识别暴力伤害、恐怖极端、自伤轻生与武器危险物品相关文本。

适合高风险业务审核、AI 生成内容安全与重点风控场景。

双语能力

模型同时支持中文与英文文本审核

支持中文社媒、社区评论、客服对话、弹幕、资讯评论等文本场景,也支持英文内容审核与统一结果输出,便于跨地区业务共用同一套审核策略与接口。

中文内容审核

覆盖中文互联网常见表达、口语缩写、变体写法与业务场景文本,适合社区、内容平台和大模型应用接入。

英文内容审核

支持英文风险文本识别,可用于出海业务、国际化社区和英文生成内容审核,减少多语言接入成本。

统一输出口径

无论输入中文还是英文,接口都返回统一的公开标签、分类和分数字段,方便前台、风控策略和运营系统复用。

策略能力

提供多种策略支持,也可以手动配置策略

多种策略模板

支持按业务目标配置放行、拦截、降权、复审、告警等多种策略模板,适合不同平台和审核场景。

手动配置策略

可基于一级风险方向、公开标签编码、分数阈值和来源渠道手动配置策略规则,方便逐步精细化运营。

企业认证赠送额度

新用户默认赠送 1000 个额度,通过企业认证后可再获赠 50000 个免费额度,便于正式评估与接入。

使用方式

支持公有云服务与私有化部署

公有云服务

提供文本审核的云端服务接口,可直接调用 API 或使用 HTTP SDK 对文本内容进行审核,支持高并发承载,服务可用性目标 99.9999%。

私有化部署

将审核模型软件包部署至企业的本地服务器,在局域网/内网中实现文本审核功能,保障企业的数据私密性;一键部署,安全便捷。

结果体系

公开标签预览、定义和业务建议一并返回

涉黄检测

面向业务的标签定义、处置建议和典型识别范围。当前展示 3 个代表标签,等,一共 7 个标签,详细信息可以联系支持人员获取。

涉黄检测 sexual_solicitation

色情招徕交易

文本存在招嫖、性交易邀约或成人服务导流倾向。

建议直接拦截并记录账号风险。
涉黄检测 sexual_teasing

暧昧挑逗表达

文本带有挑逗、露骨暗示或擦边性表达。

建议视场景拦截、折叠或进入人工复核。
涉黄检测 explicit_sexual_content

露骨性行为描写

文本对性行为、性犯罪或明显成人场景进行了直接描述。

建议高优先级拦截。
等,一共 7 个标签,详细信息可以联系支持人员获取。

违法检测

面向业务的标签定义、处置建议和典型识别范围。当前展示 3 个代表标签,等,一共 8 个标签,详细信息可以联系支持人员获取。

违法检测 gambling_and_betting

赌博博彩风险

文本涉及赌博平台、博彩玩法或异常下注引导。

建议直接拦截并提升账号风险等级。
违法检测 drugs_and_contraband

毒品与违禁品

文本涉及毒品、违禁药品或其他受限流通物品。

建议直接拦截。
违法检测 fraud_and_blackmarket

诈骗与黑灰产

文本涉及诈骗、造假、传销、黑社会或其他黑灰产活动。

建议高优先级拦截并结合风控模型联动。
等,一共 8 个标签,详细信息可以联系支持人员获取。

涉政检测

面向业务的标签定义、处置建议和典型识别范围。当前展示 3 个代表标签,等,一共 5 个标签,详细信息可以联系支持人员获取。

涉政检测 public_affairs_sensitive

公共机构敏感讨论

文本涉及政府、机构、政策法规或公共治理相关敏感讨论。

建议结合业务场景做拦截、降权或复审。
涉政检测 political_figure_sensitive

政治人物敏感讨论

文本涉及政治人物、重要公共人物或相关争议表达。

建议结合上下文和地区策略处理。
涉政检测 separatism_and_regional_conflict

地区对抗与分裂议题

文本涉及地区主权争议、分裂对抗或相关激化表达。

建议高优先级复核或拦截。
等,一共 5 个标签,详细信息可以联系支持人员获取。

谩骂检测

面向业务的标签定义、处置建议和典型识别范围。当前展示 3 个代表标签,等,一共 2 个标签,详细信息可以联系支持人员获取。

谩骂检测 abusive_attack

侮辱攻击表达

文本存在明显的人身攻击、辱骂或恶意挑衅。

建议拦截、降权或转人工复核。
谩骂检测 discriminatory_hate

歧视仇恨表达

文本针对地区、性别、职业、相貌、民族等对象进行歧视性贬损。

建议高优先级拦截。
等,一共 2 个标签,详细信息可以联系支持人员获取。

广告检测

面向业务的标签定义、处置建议和典型识别范围。当前展示 3 个代表标签,等,一共 5 个标签,详细信息可以联系支持人员获取。

广告检测 offsite_lead_gen

站外导流邀约

文本以加好友、私聊、导流等方式诱导用户离开当前平台。

建议拦截或限制发送频率。
广告检测 contact_exchange

联系方式投放

文本包含微信、QQ、手机号、网址、公众号等联系方式或落地页入口。

建议结合账号画像拦截或脱敏处理。
广告检测 commerce_marketing

商品与课程营销

文本包含商品推广、电商促销、课程培训等营销表达。

建议按反广告规则限流、折叠或屏蔽。
等,一共 5 个标签,详细信息可以联系支持人员获取。

暴恐检测

面向业务的标签定义、处置建议和典型识别范围。当前展示 3 个代表标签,等,一共 4 个标签,详细信息可以联系支持人员获取。

暴恐检测 violent_harm

暴力伤害表达

文本涉及血腥、攻击伤害、谋杀雇凶等暴力内容。

建议高优先级拦截。
暴恐检测 terror_extremism

恐怖极端信息

文本涉及恐怖组织、恐怖事件或极端主义内容。

建议直接拦截并重点留存。
暴恐检测 self_harm

自伤轻生风险

文本涉及自杀、自残或伤害自身的风险表达。

建议优先拦截并视场景进行关怀或人工干预。
等,一共 4 个标签,详细信息可以联系支持人员获取。

其他风险

面向业务的标签定义、处置建议和典型识别范围。当前展示 3 个代表标签,等,一共 2 个标签,详细信息可以联系支持人员获取。

其他风险 noisy_text

低质量噪声文本

文本以乱码、重复、灌水或无意义内容为主,可用性较低。

建议丢弃、折叠或转低优先级处理。
其他风险 other_risk_signal

综合风险信号

检测到非标准化但值得关注的内容信号,需要结合业务规则进一步判断。

建议进入人工复核或二次规则引擎。
等,一共 2 个标签,详细信息可以联系支持人员获取。

正常

面向业务的标签定义、处置建议和典型识别范围。当前展示 3 个代表标签,等,一共 3 个标签,详细信息可以联系支持人员获取。

正常 safe_pass

安全通过

当前文本未检测到明确违规风险,可按正常内容处理。

默认放行,必要时结合业务词典或人工抽检。
正常 safe_context

公共议题常规讨论

文本包含中性讨论、客观陈述或正常提及类表达,不直接构成风险。

建议与业务场景结合,通常可放行或低优先级复审。
正常 lifestyle_normal

普通生活内容

文本内容偏向日常生活、健康、育儿或普通社会话题。

通常可直接放行。
等,一共 3 个标签,详细信息可以联系支持人员获取。

落地价值

从试用到生产,路径清晰

审核结果可直接落策略

返回一级风险方向、公开标签编码、分数和摘要分类,方便做拦截、降权、复审和人工升级。

前台与接口结果一致

网页体验、用户中心和 API 使用同一套结果口径,便于从试用验证平滑切到正式接入。

管理后台可看运营数据

后台可查看总注册量、今日注册量、总访问量、今日访问量、检测趋势和用户剩余额度。

支持中英文双语

网站前台、产品说明、接口文档和主要用户页面支持中英文切换,便于面向不同地区客户统一交付。

典型场景

覆盖主流内容审核与大模型风控需求

大模型生成内容检测

对 AI 生成文本做上线前审核,识别有毒有害、诱导违法、攻击性或敏感政治风险内容。

社区文本检测

适用于帖子、评论、私信、群聊等社区场景,快速识别涉黄、涉政、广告和辱骂文本。

弹幕文本检测

在直播和视频弹幕中识别高风险词句,支撑实时拦截、提示或人工复核流程。