大模型备案全网最详细说明【附流程+学习材料】
每次写文章之初,还是希望再次强调下,谨慎甄别行业里面那些说自己可以帮别的公司做大模型备案的,很多办证的代办公司基本没有那个实力可以帮别人做大模型备案,很多办证的代办公司最后接了客户订单还是会找到我们,这类人群只会两边套路,一方面问客户多要价,另一方面打压给我们的订单价,没有实力,只赚差价,实际连成功案例都拿不出,行业搅屎棍,各位要做备案的企业,务必擦亮双眼!!!
一、大模型备案的定义与政策背景
大模型备案是依据《生成式人工智能服务管理暂行办法》(以下简称《暂行办法》)建立的监管制度,旨在对具有舆论属性或社会动员能力的生成式人工智能(AIGC)服务进行安全评估与合规审查。其核心目标在于平衡技术创新与社会风险,防范数据泄露、算法偏见、内容安全等问题。自2023年8月《暂行办法》实施到2025年3月,全国累计通过的大模型备案家数为346家,算上4、5月份部分省份公布的通过大模型备案的,超过400家,从通过家数、通过时间上来看,大模型备案相较于算法备案都是要难很多,周期也要久很多。
政策特点:
-
全球首部AIGC专项法规:中国成为首个出台生成式AI管理办法的国家,采取“备案制”而非“审核制”,既降低准入门槛,又通过动态监管保障安全。
-
分类分级监管:仅对直接面向公众且具有舆论影响力的服务实施备案,技术开发接口(API)调用则采用登记制,体现差异化治理。
二、备案主体与核心条件
适用对象:
-
平台运营方:负责商业开发与市场推广的企业(如百度、商汤)。
-
技术支持方:提供算法研发的技术机构(如科研院所)。
备案三要件:
-
合法申请主体:需为境内注册实体,外资企业需符合外商投资准入要求。
-
算法备案前置:完成《互联网信息服务算法推荐管理规定》要求的算法备案。
-
内容合规性:模型输出需符合国家法律法规及意识形态安全要求。
三、大模型备案/登记流程与材料要求
核心流程(以典型省级流程为例):
-
备案申请:向属地网信部门提交申请,获取备案表并接受初步问询。
-
材料准备与自测:
-
技术文档:包括模型架构、训练框架、算力资源配置等。
-
安全评估报告:涵盖语料合法性审查(如数据来源证明、标注规则)、生成内容安全测试(如拦截关键词列表、评估测试题集)。
-
服务协议:明确用户隐私保护、内容过滤机制及应急响应措施。
-
-
审核与测试:
-
省级初审:材料完整性、语料合规性审查。
-
中央终审:技术性能与安全性测试(如生成内容抽样合格率≥95%,非法内容拒答率≥98%)。
-
-
备案公示与运营:获得备案编号后需在服务界面公示,并接受定期抽查。
关键材料清单:
td {white-space:nowrap;border:0.5pt solid #dee0e3;font-size:10pt;font-style:normal;font-weight:normal;vertical-align:middle;word-break:normal;word-wrap:normal;}材料类型 | 内容要点 | 重要性评级 |
大模型基本情况 | 模型名称、功能、适用人群、服务范围 | 核心 |
语料来源证明 | 数据采集协议、版权合法性文件 | 核心 |
安全自评估报告 | 语料安全、生成内容风险、应急管理措施 | 核心 |
拦截关键词列表 | 涵盖违法、敏感、歧视性词汇 | 高 |
多模态评估测试题集 | 文本、图像、视频等生成内容安全测试案例 | 高 |
四、技术要求与合规重点
-
数据安全:
-
全流程管理:从数据采集(需建立来源审批机制)到训练(使用数据安全沙箱),确保合规性。
-
语料清洗:去除有害内容,如艾瑞咨询统计显示,头部企业语料清洗比例高达30%。
-
-
算法透明度:
-
备案系统填报:需公开算法策略、风险防范机制,接受公众监督。
-
可解释性评估:需说明模型决策逻辑,减少“黑箱”操作。
-
-
生成内容控制:
-
多层过滤机制:结合提示词过滤、实时内容拦截与事后人工审核(如蚂鉴AI安全检测平台)。
-
显著标识:所有AI生成内容需标注“由AI生成”。
-
五、备案后的监管与违规后果
常态化监管措施:
-
定期检查:网信部门每年至少一次现场审查,重点核查语料更新记录与生成内容日志。
-
动态更新:重大更新(如新增多模态功能)需再次安全评估。
违规处罚:
-
行政处罚:警告、限期整改、罚款,严重者暂停服务。
-
刑事风险:若生成内容涉及违法犯罪,责任人可能承担刑事责任。
-
商业影响:未备案产品无法上架应用商店,已上架产品面临下架风险,导致用户流失与融资受阻。
六、典型案例与行业影响
备案企业分析:
-
首批(2023年8月) :百度文心一言、商汤SENSECHAT等8款模型,标志监管框架落地。
-
第四批(2024年2月) :小米“小爱助手”、第四范式“式说”等14款模型,首次出现单一企业双模型备案,加速商业化竞争。
行业影响:
-
数据飞轮效应:备案企业可合法获取用户反馈数据,优化模型性能。
-
市场集中度提升:头部企业凭借合规能力抢占先机,中小开发者面临更高门槛。
-
垂直领域突破:如京东“言犀”(零售)、云知声“山海”(医疗)等垂直模型通过备案,推动行业解决方案落地。
七、备案建议
-
提前规划备案周期:从材料准备到获批平均需4-7个月,建议联合法务与技术团队同步推进。
-
选择合规服务商:优先采用已备案大模型的API,降低独立备案成本。
-
建立内部监控体系:配备内容安全团队,定期更新关键词库与测试案例。
附录大模型备案材料源文件
*图示:提交至网信办过审版本材料
*图示:安全评估测试题、拦截词