一区23分超简单CT影像组学:肺病早筛的新利器
是一种高异质性的慢性炎症性疾病,以持续气流受限为特征。在我国,40岁以上人群COPD患病率达13.7%,但知晓率不足1%,大量患者因漏诊延误治疗。
肺功能检查(PFT,pulmonary function test )是诊断COPD的金标准,但普及率仅6.7%;而胸部CT因肺癌筛查等需求已广泛应用。能否通过CT影像实现COPD的精准识别?
PFT:即FEV1/FVC 即 “第一秒呼出量占总肺活量的比例”,是判断气流受限的关键指标。
- 健康成年人该比值通常≥0.7(70%),提示气道通畅,肺排空功能正常。
- 若 FEV1/FVC<0.7,且排除哮喘等可逆性因素后,可诊断为持续性气流受限,是 COPD 的标志性特征(体现气道阻塞或肺弹性减退导致的呼气困难)。
数据来源
本研究为回顾性队列研究,数据来源于5家医疗机构的2785例患者,具体纳入标准包括:
- 同时完成肺功能检查(PFT)和胸部CT;
- 两次检查间隔≤2周;
- 具备薄层(<2mm)CT图像。
排除标准涵盖合并其他 thoracic疾病(肺炎、肺结节>6mm等)、恶性肿瘤及图像 artifact 严重者。
数据集分配:
- 训练集(1200例)与内部验证集(514例):来自4家医院(同济医院、浙江省人民医院等),按7:3随机划分;
- 外部验证集(1071例):独立来源于海军军医大学第二附属医院,用于验证模型普适性。
临床信息包括年龄、性别、身高、吸烟状态等,均从电子病历系统提取。
模型构建
1. 数据处理
- 全肺自动分割:采用开源
U-net
模型(R231)自动分割左右肺并合并为全肺感兴趣区(ROI)。通过20例随机样本验证,自动分割与人工分割的Dice系数达0.97±0.06,一致性优异。
-
影像预处理:
-
重采样:将图像插值为1mm×1mm×1mm的标准化体素;
-
灰度离散化:将连续灰度值转换为离散整数,消除设备差异;
-
滤波去噪:通过log和小波滤波提取高低频特征,减少图像数字化噪声。
体素(Voxel):3D 图像的基本单位。体素是三维医学影像(如 CT)中的 “像素”,类似立方体,其尺寸(长 × 宽 × 高)由 CT 扫描参数决定。比如某台设备可能扫描出 0.8mm×0.8mm×2mm 的体素(平面分辨率高,但层厚较厚),另一台可能是 1.2mm×1.2mm×1mm(层厚薄,但平面分辨率低)。
2. 特征提取与筛选:从1218到18的精准压缩
- 特征提取:使用PyRadiomics工具包提取1218个全肺影像组学特征,涵盖一阶统计量、灰度共生矩阵、灰度游程矩阵等6类特征。
- 特征筛选三步法:
- 冗余去除:通过Pearson相关分析,剔除相关系数>0.9的特征,保留283个;
- 相关性优化:采用最大冗余最小相关性(
mRMR
)算法,平衡特征重要性与冗余度; - 正则化选择:通过
LASSO
逻辑回归(十折交叉验证)确定最优惩罚参数(λ=0.00057),最终筛选出18个非零系数特征,构建影像组学评分(Radscore),计算公式为特征与对应系数的线性组合。
3. 模型构建:三类模型的对比与整合
- 影像组学模型:仅基于18个筛选后的特征构建。
- 临床模型:通过单因素+多因素logistic回归,筛选出年龄、性别、身高、吸烟状态4个独立预测因子构建。
- 联合模型:整合Radscore与上述临床因子,并转化为可视化列线图(Nomogram),通过积分系统直观输出COPD风险概率。
三、模型结果:多维度验证性能优异
1. 区分能力(AUC)
模型 | 训练集(95%CI) | 内部验证集(95%CI) | 外部验证集(95%CI) |
影像组学模型 | 0.888(0.869-0.906) | 0.874(0.844-0.904) | 0.846(0.822-0.870) |
临床模型 | 0.732(0.703-0.761) | 0.714(0.669-0.759) | 0.777(0.746-0.806) |
联合模型 | 0.893(0.875-0.911) | 0.873(0.843-0.903) | 0.853(0.830-0.877) |
注:影像组学模型与联合模型显著优于临床模型,P<0.001(_DeLong检验_
)
2. 临床实用性
- 校准度:联合模型的校准曲线与实际值高度吻合(Hosmer-Lemeshow检验,P=0.972/0.149/0.06);
- 决策获益:决策曲线分析(DCA)显示,联合模型在阈值概率>10%时,净获益显著高于临床模型,更适合临床决策。
3. 两个典型病例
基于全肺 CT 影像组学列线图评估 COPD 风险的实际应用过程
左侧:非 COPD 患者案例
- a 图:45 岁女性的薄层胸部 CT 图像(横轴位),无明显肺气肿等异常表现。
- b 图:肺密度分析图,显示双肺均无肺气肿区域(无红色标注),提示肺结构基本正常。
- c 图:列线图评分结果。患者身高 152cm、不吸烟、影像组学评分(Radscore)为 - 2.08,结合年龄等因素,列线图总分为 44.8 分,对应 COPD 发病概率约 8.0%。肺功能检查显示 FEV1/FVC=0.8(≥0.7),符合非 COPD 诊断标准。
右侧:COPD 患者案例
- d 图:82 岁女性的薄层胸部 CT 图像(横轴位),可见弥漫性肺结构异常。
- e 图:肺密度分析图,双肺大部分区域被红色标注,提示广泛散在肺气肿改变。
- f 图:列线图评分结果。患者身高 152cm、不吸烟、Radscore 为 3.17,列线图总分为 48.2 分,对应 COPD 发病概率约 96.9%。肺功能检查显示 FEV1/FVC=0.6(<0.7),符合 COPD 诊断标准。