内容安全审核规范
生效日期:2025年5月25日
说明:本规范适用于所有使用本平台API服务的用户。本平台作为AI模型聚合服务提供方,有义务对平台上的内容进行安全管理,防止利用AI生成违法违规内容。
一、禁止生成的内容类型
1. 政治敏感类
- 危害国家安全、泄露国家秘密的内容
- 煽动颠覆国家政权、推翻社会主义制度的内容
- 破坏国家统一和民族团结的内容
- 歪曲、否定中国共产党历史和中华人民共和国历史的内容
- 涉及恐怖主义、极端主义的内容
2. 违法违规类
- 宣扬、教唆赌博、毒品、暴力、犯罪的内容
- 制作、传播计算机病毒、恶意程序的技术指导
- 非法获取、破解、入侵计算机系统的技术指导
- 制造武器、爆炸物、毒品等违禁品的指导信息
- 伪造证件、票据、印章等违法指导
3. 色情低俗类
- 露骨的色情描写、色情互动、色情角色扮演
- 涉及未成年人的任何色情或不当内容(零容忍)
- 低俗、淫秽的图文或音视频生成
- 性暗示广告、色情引流
4. 侵权类
- 未经授权生成他人的肖像、声音(深度伪造)
- 抄袭、剽窃他人享有著作权的作品
- 批量生成仿冒他人品牌或产品的内容
- 生成虚假新闻、谣言等信息
5. 欺诈与恶意类
- 网络诈骗话术、钓鱼邮件生成
- 虚假广告、传销话术
- 垃圾信息批量生成(垃圾邮件、骚扰短信等)
- 恶意诋毁、诽谤他人的内容
零容忍红线:涉及未成年人色情、恐怖主义、危害国家安全的内容,一经发现立即永久封禁账户,并依法向公安机关报告。
二、审核机制
1. 事前预防
- 关键词过滤:对用户输入的提示词(Prompt)进行敏感词扫描,命中高危关键词的请求将被拦截。
- 频率限制:异常高频调用触发自动限流和人工审查。
- 模型安全设置:优先使用各上游模型提供商内置的安全过滤功能。
2. 事中监控
- 实时日志:记录所有API调用的时间、用户、模型、Token消耗。
- 抽样审查:对高风险模型的调用进行内容抽样检查。
- 异常行为检测:识别批量生成、脚本化调用等异常模式。
3. 事后处置
- 违规确认:发现疑似违规内容后,人工复核确认。
- 分级处罚:
- 一级(轻微违规):警告通知,要求整改
- 二级(一般违规):暂停API使用权限7天
- 三级(严重违规):永久封禁账户,清退余额
- 特级(违法犯罪):封禁+证据保全+公安报告
- 申诉渠道:用户可通过客服邮箱提交申诉,3个工作日内回复。
三、用户合规义务
- 用户对使用本平台API生成的所有内容承担法律责任。
- 用户不得通过提示词工程(Prompt Engineering)绕过内容安全限制。
- 用户如发现模型生成了不合规内容,应立即停止使用并通知本平台。
- 面向C端用户提供服务的应用开发者,应在应用层增加额外的内容审核措施。
四、日志留存
- API调用日志(不含请求/响应内容体):保留不少于90天,用于计费统计和安全审计。
- 涉及安全事件的日志:保留不少于6个月,用于事件调查和证据保全。
- 日常API请求/响应内容:不作为日志长期存储,仅实时传输处理。
注意:本平台与上游模型提供商(如OpenAI、Google、阿里云等)的接口传输过程中,您的提示词会被发送至相应模型提供商的服务器。请勿在提示词中包含个人敏感信息(如身份证号、银行卡号、密码等)。