内容安全审核规范

生效日期：2025年5月25日

说明：本规范适用于所有使用本平台API服务的用户。本平台作为AI模型聚合服务提供方，有义务对平台上的内容进行安全管理，防止利用AI生成违法违规内容。

一、禁止生成的内容类型

1. 政治敏感类

危害国家安全、泄露国家秘密的内容
煽动颠覆国家政权、推翻社会主义制度的内容
破坏国家统一和民族团结的内容
歪曲、否定中国共产党历史和中华人民共和国历史的内容
涉及恐怖主义、极端主义的内容

2. 违法违规类

宣扬、教唆赌博、毒品、暴力、犯罪的内容
制作、传播计算机病毒、恶意程序的技术指导
非法获取、破解、入侵计算机系统的技术指导
制造武器、爆炸物、毒品等违禁品的指导信息
伪造证件、票据、印章等违法指导

3. 色情低俗类

露骨的色情描写、色情互动、色情角色扮演
涉及未成年人的任何色情或不当内容（零容忍）
低俗、淫秽的图文或音视频生成
性暗示广告、色情引流

4. 侵权类

未经授权生成他人的肖像、声音（深度伪造）
抄袭、剽窃他人享有著作权的作品
批量生成仿冒他人品牌或产品的内容
生成虚假新闻、谣言等信息

5. 欺诈与恶意类

网络诈骗话术、钓鱼邮件生成
虚假广告、传销话术
垃圾信息批量生成（垃圾邮件、骚扰短信等）
恶意诋毁、诽谤他人的内容

零容忍红线：涉及未成年人色情、恐怖主义、危害国家安全的内容，一经发现立即永久封禁账户，并依法向公安机关报告。

二、审核机制

1. 事前预防

关键词过滤：对用户输入的提示词（Prompt）进行敏感词扫描，命中高危关键词的请求将被拦截。
频率限制：异常高频调用触发自动限流和人工审查。
模型安全设置：优先使用各上游模型提供商内置的安全过滤功能。

2. 事中监控

实时日志：记录所有API调用的时间、用户、模型、Token消耗。
抽样审查：对高风险模型的调用进行内容抽样检查。
异常行为检测：识别批量生成、脚本化调用等异常模式。

3. 事后处置

违规确认：发现疑似违规内容后，人工复核确认。
分级处罚：

一级（轻微违规）：警告通知，要求整改
二级（一般违规）：暂停API使用权限7天
三级（严重违规）：永久封禁账户，清退余额
特级（违法犯罪）：封禁+证据保全+公安报告

申诉渠道：用户可通过客服邮箱提交申诉，3个工作日内回复。

三、用户合规义务

用户对使用本平台API生成的所有内容承担法律责任。
用户不得通过提示词工程（Prompt Engineering）绕过内容安全限制。
用户如发现模型生成了不合规内容，应立即停止使用并通知本平台。
面向C端用户提供服务的应用开发者，应在应用层增加额外的内容审核措施。

四、日志留存

API调用日志（不含请求/响应内容体）：保留不少于90天，用于计费统计和安全审计。
涉及安全事件的日志：保留不少于6个月，用于事件调查和证据保全。
日常API请求/响应内容：不作为日志长期存储，仅实时传输处理。

注意：本平台与上游模型提供商（如OpenAI、Google、阿里云等）的接口传输过程中，您的提示词会被发送至相应模型提供商的服务器。请勿在提示词中包含个人敏感信息（如身份证号、银行卡号、密码等）。