【注册指导】人工智能医疗器械注册审查指导原则 - 阅读笔记
1. 适用范围
第二类、第三类人工智能独立软件和含有人工智能软件组件的医疗器械(包括体外诊断医疗器械)。
2. 主要概念
2.1 人工智能医疗器械
基于医疗器械数据,采用人工智能技术实现其预期用途(即医疗用途)的医疗器械。
2.1.1 医疗器械数据
1. 医学影像设备产生的——X射线\CT\MRI\超声\内窥镜\光学等图像
2. 医用电子设备产生的——心电\脑电\血压\无创血糖\心音等波形数据
3. 体外诊断设备产生的——病理图像\显微图像\有创血糖波形数据等
4. 通用设备产生的用于医疗用途的——数码皮肤照片 etc.
2.1.2 人工智能
2.2 人工智能医疗器械类型
2.2.1 软件角度
1. 人工智能独立软件
2. 人工智能软件组件
2.2.2 用途角度
1. 辅助决策类(助手)
1. 辅助分诊——病灶特征识别
2. 辅助检测——病灶性质判定
3. 辅助诊断——用药指导
4. 辅助治疗——治疗计划制定
2. 非辅助决策类(工具)
1. 流程优化——成像流程简化、诊疗流程简化
2. 诊疗驱动——成像质量改善、成像速度提高、自动测量、自动分割、三维重建等
3. 以上两类从实时性角度均可细分为实时和非实时,前者风险高于后者。
2.2.3 功能角度
1. 处理
1. 前处理——采集信息形成数据(成像流程简化、成像质量改善、成像速度提高,etc.)
2. 后处理——基于数据生成诊疗信息或进行医疗干预(诊疗流程简化、自动测量、自动分割、三围重建、病灶特征识别、病灶性质判定、用药指导、治疗计划制定,etc.)
2. 控制
控制/驱动医疗器械硬件运行的功能(闭环控制、机械臂运动控制,etc.)
3. 安全
保证医疗器械安全性的功能(风险预警、急停控制)
2.2.4 算法角度
1. 学习策略角度
1. 有监督学习
2. 无监督学习
2. 学习方法角度
1. 基于模型(统计模型、规则推理)
2. 基于数据(大数据方法)
3. 可解释性角度
1. 白盒算法——特征提取需要人工干预,可解释性较好
2. 黑盒算法——自动完成特征提取
2.3 算法更新
1. 算法驱动型——通常属于重大软件更新,应申请变更注册
算法、算法结构、算法流程、算法编程框架、输入输出数据类型发生变化。
弃用原有数据而采用全新训练数据进行算法训练,亦属于算法驱动型更新。
2. 数据驱动型——原则上,性能评估结果若与上次相比存在统计学差异,则属于重大软件更新
仅由训练数据量增加而发生的算法更新
软件版本命名规则原则上应覆盖算法驱动型更新和数据驱动型更新
3. 基本原则
核心词汇:预期用途、使用场景、核心功能
- 基于算法特性
- 风险导向
- 全生命周期质控
4. 人工智能医疗器械生存周期过程
4.1 需求分析
4.2 数据收集
1. 数据采集——**原始数据库**
1. 设备质控
1. 设备兼容性:名称、型号、制造商、性能指标
2. 采集特征:方式、协议、参数、精度
2. 过程质控
1. 人员管理:采集、审核人员的选拔、培训、考核
2. 采集流程:人员职责、采集步骤、结果审核
3. 采集质量评估:评估人员、评估方法、评估指标、通过准则、结果记录
3. 数据脱敏——脱敏数据汇总形成原始数据库
2. 数据整理——**基础数据库**
1. 基于原始数据库考虑数据清洗、数据预处理
2. 整理后形成基础数据库,需明确样本类型、样本量、样本分布
3. 数据标注——**标注数据库**
1. 建立数据标注操作规范
2. 明确标注资源管理
1. 人员管理
2. 基础设施管理
3. 标注过程质控
1. 人员职责(人员资质、数量、职责分工)
2. 标注规则(临床指南、专家共识、专家评议、文献分析)
3. 标注流程(标注对象、标注形式、标注轮次、标注步骤、结果审核)
4. 分歧处理(仲裁人员、仲裁方式)
5. 可追溯性(数据、操作)
4. 标注质量评估
1. 评估人员
2. 评估方法
3. 评估指标
4. 通过准则
5. 记录评估结果
4. 数据集构建——**基于标注数据库构建训练集、调优集和测试集**
1. 训练集:用于算法训练,原则上需保证样本分布具有均衡性
2. 调优集(即AI领域验证集):用于算法超参数调优,原则上需保证样本分布符合真实情况
3. 测试集:用于算法性能评估,原则上需保证样本分布符合真实情况
4. 以上三个数据子集中的样本应两两无交集并通过查重予以验证
5. 为解决样本分布不满足预期的问题,可对训练集、调优集小样本数据进行扩增。原则上不得对测试集进行数据扩增,对抗测试除外。
6. 数据经扩增后形成扩增数据库,需列表对比扩增数据库与标注数据库在样本量、样本分布等差异,以证实扩增数据库样本量的充分性以及样本分布的合理性。
4.3 算法设计
1. 算法选择
2. 算法训练
1. 评估指标
2. 训练方式
3. 训练目标
4. 调优方式
5. 训练数据量-评估指标曲线,用于证实算法训练的充分性和有效性
3. 算法性能评估
1. 基于测试集,综合考虑假阴性与假阳性、重复性与再现性、鲁棒性\健壮性、实时性,以**证实算法性能满足算法设计目标**
2. 开展算法性能影响因素分析:采集设备、采集参数、疾病构成、病变特征,基于分析结果**明确产品使用限制和必要警示提示信息**。
3. 压力测试、对抗测试等
4.4 验证与确认
1. 软件验证
2. 软件确认
4.5 更新控制
考虑引入回滚机制
5. 技术考量
- 注册单元与质检单元
- 网络安全与数据安全
- 移动计算与云计算
- 人因与可用性
- 压力测试
- 对抗测试
- 第三方数据库
- 白盒算法
- 集成学习
- 迁移学习
- 强化学习
- 联邦学习
- 生成对抗网络
- 持续学习/自适应学习
- 人工智能算法编程框架
- 人工智能芯片
6. 算法研究资料
6.1 算法研究报告
1. 算法基本信息:名称、类型、结构、输入输出、流程图、算法框架、运行环境;算法选用依据
2. 算法风险管理:明确安全性级别;提供风险控制措施
3. 算法需求规范
4. 数据质控
1. 数据来源合规性声明
2. 数据采集相关文档
3. 数据整理概况
4. 数据标注相关文档
5. 数据扩增情况说明
6. 若数据来自公开数据集,提供公开数据集的基本信息和使用情况
5. 算法训练
6. 算法验证与确认
7. 算法可追溯性分析,说明各环节逻辑关联
8. 结论,简述综合评价结果,明确适用范围和必要限制
6.2 算法更新研究报告
明确算法更新情况
7. 注册申报资料补充说明
7.1 产品注册
1. 申请表信息
2. 算法研究资料,软件安全性级别中等、严重等级&全新类型需要,成熟类型无需。安全性级别轻微的,无需
3. 用户培训方案
软件安全性为严重级别、预期由患者使用或在基层医疗机构使用的产品,原则上需提供。
4. 说明书

浙公网安备 33010602011771号