报告名称:AR(Active Area Reverse)fin cut工艺参数与表征指标数据分析报告
版本:V1.0
日期:2025-09-05
编制人:李晓睿
审核人:[姓名/部门]
1. 数据收集报告
1.1 数据来源
- 来源:AR(AA Reverse)fin cut工艺实验(设备型号:Lam Flex® 刻蚀平台,名称:[补充实际设备名称],时间段:2025.1-2025.6);
- 数据类型:包含工艺配方数据(Recipe)与表征指标数据(Spec),具体为C1292-G1-AR-R10、C1292-G1-AR-R18等系列Recipe数据文件;
- 收集方式:工艺参数(如压力、功率、气体流量)由生产系统Recipe模块自动记录,经工艺员手动导出;表征指标(如TCD、Depth)由KLA-Tencor的CD-SEM、TEM设备检测获取。
1.2 数据量统计
- 样本量:原始Recipe样本40条,经筛选清洗后有效样本38条(剔除2条关键指标缺失严重样本);
- 字段数:原始工艺参数字段56个,筛选后保留核心有效字段35个;表征指标字段5个(TCD、Depth、SiNSWA、SOCremain、Maskremain);
- 数据权限与合规性:数据属N8产线内部工艺研发数据,访问权限仅限项目相关成员,符合公司数据安全规范。
1.3 未获取数据说明
- 部分Recipe存在个别表征指标缺失:SOCremain缺失1条(40条样本中39条有效)、SiNSWA缺失2条(40条样本中38条有效),原因是检测设备临时校准或样本抽检遗漏;
- 影响评估:缺失数据量占比≤5%,且为随机缺失,通过填充默认值或插值处理后,对建模影响较小,不会扭曲核心工艺规律。
2. 数据描述报告
2.1 整体概况
- 数据覆盖范围:涵盖SiArc、SOC、DEP、ME1-ME3、SRFdown1-SRFdown2、DEP1-DEP2等12个核心刻蚀步骤的工艺参数,及5个关键表征指标;
- 核心参数范围(原始数据):
- 工艺时间:SiArc#ProcessTime 55-90s、SOC#ProcessTime 45-190s、DEP#ProcessTime 0-15s、ME1#ProcessTime 7-28s、DEP1#ProcessTime 0-6s、ME2#ProcessTime 0-45s、SRFdown1#ProcessTime 0-3s、ME3#ProcessTime 0-57s、SRFdown2#ProcessTime 0-3s、DEP2#ProcessTime 0-10s;
- 压力:SOC#Pressure 5-8mT、DEP#Pressure 0-80mT、DEP1#Pressure 0-80mT、ME2#Pressure 0-60mT、SRFdown1#Pressure 0-60mT、ME3#Pressure 0-60mT、SRFdown2#Pressure 0-60mT;
- 射频功率:DEP#SRFPower 0-800W、ME3#SRFPower 300-1400W(其余功率参数参考历史工艺范围);
- 气体流量:SiArc#CF4 0-50sccm、SiArc#CHF3 80-120sccm(其余气体参数参考历史工艺范围);
- 核心指标范围(原始数据):
- TCD:17.58-38.44nm(目标区间21-22nm);
- Depth:142.9-1686.2A(目标区间1100-1300A);
- SiNSWA:0-88°(有效数据85.85-88°,目标区间86-89°);
- SOCremain:0-842A(目标区间0-500A);
- Maskremain:2201.8-2833.7A(目标区间2201.8-2833.7A)。
2.2 字段详情表
| 字段名 |
数据类型 |
业务含义 |
示例值 |
统计范围 |
是否关键字段 |
| SiArc#ProcessTime |
整数 |
SiArc步骤工艺时间 |
70s |
55-90s |
是 |
| SOC#ProcessTime |
整数 |
SOC步骤工艺时间 |
150s |
45-190s |
是 |
| DEP#ProcessTime |
整数 |
DEP步骤工艺时间 |
5s |
0-15s |
是 |
| ME1#ProcessTime |
整数 |
ME1步骤工艺时间 |
7s |
7-28s |
是 |
| DEP1#ProcessTime |
整数 |
DEP1步骤工艺时间 |
6s |
0-6s |
是 |
| ME2#ProcessTime |
整数 |
ME2步骤工艺时间 |
30s |
0-45s |
是 |
| SRFdown1#ProcessTime |
整数 |
SRFdown1步骤工艺时间 |
3s |
0-3s |
是 |
| ME3#ProcessTime |
整数 |
ME3步骤工艺时间 |
38s |
0-57s |
是 |
| SRFdown2#ProcessTime |
整数 |
SRFdown2步骤工艺时间 |
3s |
0-3s |
是 |
| DEP2#ProcessTime |
整数 |
DEP2步骤工艺时间 |
6s |
0-10s |
是 |
| SOC#Pressure(mT) |
整数 |
SOC步骤反应腔压力 |
5mT |
5-8mT |
是 |
| DEP#Pressure(mT) |
整数 |
DEP步骤反应腔压力 |
80mT |
0-80mT |
是 |
| DEP1#Pressure(mT) |
整数 |
DEP1步骤反应腔压力 |
80mT |
0-80mT |
是 |
| ME2#Pressure(mT) |
整数 |
ME2步骤反应腔压力 |
60mT |
0-60mT |
是 |
| SRFdown1#Pressure(mT) |
整数 |
SRFdown1步骤反应腔压力 |
60mT |
0-60mT |
是 |
| ME3#Pressure(mT) |
整数 |
ME3步骤反应腔压力 |
60mT |
0-60mT |
是 |
| SRFdown2#Pressure(mT) |
整数 |
SRFdown2步骤反应腔压力 |
60mT |
0-60mT |
是 |
| TCD(nm) |
浮点数 |
顶部关键尺寸 |
22.83nm |
17.58-38.44nm |
是 |
| Depth(A) |
浮点数 |
鳍片深度 |
1113.15A |
142.9-1686.2A |
是 |
| SiNSWA(°) |
浮点数 |
鳍片侧壁角度 |
86.6° |
85.85-88° |
是 |
| SOCremain(A) |
浮点数 |
SOC层残留厚度 |
721.8A |
0-842A |
是 |
| Maskremain(A) |
浮点数 |
掩模残留厚度 |
2579.55A |
2201.8-2833.7A |
是 |
2.3 数据分布概览
- 数值型字段(工艺参数):
- 工艺时间参数:SiArc#ProcessTime中位数70s、均值68.25s,75%样本集中在55-70s;SOC#ProcessTime中位数150s、均值143.35s,75%样本集中在150-167.5s;DEP#ProcessTime 75%样本为0s,仅25%样本有实际刻蚀时间(0-15s),符合“部分工艺选择性启用”逻辑;
- 压力参数:SOC#Pressure 75%样本为5mT,仅少数样本达8mT;DEP1#Pressure、ME2#Pressure、SRFdown1#Pressure中位数均为60-80mT,分布集中;
- 稀疏特征:DEP#ProcessTime、DEP2#ProcessTime等参数零值占比≥75%,符合“不用即为0”的业务特性。
- 目标变量(表征指标):
- TCD:均值25.156nm,中位数22.83nm,标准差5.639nm,存在17.58nm(低值)、38.44nm(高值)等异常值;
- Depth:均值1111.33A,中位数1113.15A,标准差274.865A,分布跨度极大(142.9-1686.2A);
- SiNSWA:有效样本均值86.71°,中位数86.6°,标准差0.654°,分布均匀;
- Maskremain:均值2576.69A,中位数2579.55A,标准差111.434A,完全覆盖目标区间;
- SOCremain:均值676.30A,中位数721.8A,标准差161.674A,部分样本超出目标区间(0-500A)。
3. 数据探索报告
3.1 单变量分析(关键字段分布特征)
- TCD(nm):
- 分布特征:取值范围17.58-38.44nm,90%样本集中在19.57-35.78nm,存在明显双峰分布(17-22nm和29-38nm),主要因工艺参数调整幅度差异导致;
- 关键发现:10%以下样本(≤19.57nm)和10%以上样本(≥35.78nm)为异常值,需剔除后才能贴合目标区间(21-22nm)。
- Depth(A):
- 分布特征:取值范围142.9-1686.2A,中位数1113.15A,75%样本集中在1012.1-1268.78A,2.5%以下样本(≤153.76A)为极端低值异常;
- 关键发现:深度分布与ME3#ProcessTime、SRFdown2#ProcessTime强相关,长时工艺对应更大深度,异常低值样本为工艺未正常启动导致。
- SiArc#ProcessTime(s):
- 分布特征:取值范围55-90s,中位数70s,75%样本集中在55-70s,无异常值,分布集中性强;
- 关键发现:该参数为侧壁钝化核心步骤时间,分布集中说明工艺调整以小幅优化为主,无大幅波动。
- Maskremain(A):
- 分布特征:取值范围2201.8-2833.7A,中位数2579.55A,95%样本集中在2541.05-2612.33A,完全覆盖目标区间;
- 关键发现:掩模残留量分布均匀,说明掩模层沉积工艺稳定性好,对后续刻蚀的保护作用一致。
3.2 多变量分析(字段间相关性)
基于Pearson相关性分析,核心字段关联规律如下:
- Depth与工艺参数相关性:
- 与ME3#ProcessTime相关性0.535(中等正相关),工艺时间越长,刻蚀深度越大;
- 与SRFdown2#ProcessTime相关性0.635(强正相关),该步骤时间延长可显著提升深度;
- 与ME3#Pressure相关性0.640(强正相关),压力升高促进等离子体密度均匀性,提升刻蚀深度。
- TCD与工艺参数相关性:
- 与SiArc#CF4流量相关性-0.58(强负相关),CF4流量增加刻蚀能力增强,TCD减小;
- 与SiArc#CHF3流量相关性0.42(中等正相关),CHF3钝化作用增强,TCD增大。
- 指标间相关性:
- TCD与Maskremain相关性0.28(弱正相关),掩模残留量适中时TCD更稳定;
- SiNSWA与ME2#Pressure相关性0.32(弱正相关),压力稳定有助于侧壁角度保持垂直。
3.3 业务关联探索
- 工艺逻辑契合:SiArc#ProcessTime(钝化时间)延长→Maskremain增加→TCD增大,与“钝化层增厚抑制刻蚀”的物理机制一致;ME3#Pressure升高→等离子体分布均匀→Depth一致性提升,符合刻蚀工艺规律;
- 稀疏特征意义:DEP#ProcessTime、DEP2#ProcessTime等参数零值占比≥75%,对应工艺中“仅在特殊鳍片结构需求下启用”的场景,零值本身具有明确业务含义,无需强制填充;
- 参数调整规律:核心参数调整幅度集中在±10%以内(如SiArc#ProcessTime±5s、CF4流量±5sccm),符合先进工艺“精准微调”的研发特点,避免大幅调整导致良率波动。
3.4 初步分析(对建模有价值的结论)
- 异常值处理:TCD<20nm或>23nm、Depth<1000A或>1400A、SOCremain>500A的样本为无效工艺记录,必须剔除,否则会扭曲模型对参数-指标关系的学习;
- 缺失值处理:SOCremain(1条缺失)采用同工艺窗口中位数(721.8A)填充,SiNSWA(2条缺失)采用邻近样本线性插值填充,避免删除有效样本;
- 特征工程方向:需重点构建工艺时间、压力的交互特征(如ME3#ProcessTime×ME3#Pressure),及气体流量比特征(如CF4/CHF3),挖掘多参数协同影响规律;
- 建模重点:模型需优先保障“符号一致性”(如CF4流量增加→TCD减小的方向正确),再提升数值预测精度,契合工艺研发“先定方向、再优幅度”的需求。
4. 数据质量报告
4.1 质量问题清单(按严重程度排序)
| 问题类型 |
涉及字段 |
问题描述(数量/比例) |
影响评估 |
处理优先级 |
| 异常值 |
TCD、Depth |
TCD异常6条(15%)、Depth异常8条(20%) |
严重 |
1 |
| 异常值 |
SOCremain |
超出目标区间(>500A)12条(30.8%) |
严重 |
1 |
| 缺失值(随机) |
SOCremain、SiNSWA |
SOCremain缺失1条(2.5%)、SiNSWA缺失2条(5%) |
中 |
2 |
| 低方差字段 |
辅助监测字段 |
8个字段唯一值<2(如固定值压力参数) |
低 |
3 |
| 稀疏特征 |
DEP#ProcessTime等 |
5个字段零值占比≥75% |
低 |
3 |
4.2 数据一致性校验
- 工艺逻辑校验:所有脉冲模式为“CW”的样本,占空比均为100%,无逻辑矛盾;同一Recipe下各步骤参数无冲突(如功率为0时气体流量均为0);
- 参数范围校验:核心参数均在设备硬件允许范围内(如压力≤80mT、工艺时间≤190s),无超出量程的异常值;
- 指标合理性校验:Maskremain、SiNSWA(有效样本)无物理上不可能的数值,TCD、Depth异常值均为工艺参数设置极端导致,非检测误差。
4.3 完整性评估
- 参数完整性:核心工艺参数(时间、压力、功率、气体流量)无系统性缺失,覆盖刻蚀全流程12个关键步骤,能满足建模对输入特征的需求;
- 指标完整性:5个核心表征指标中,Maskremain无缺失,其余指标缺失率≤5%,无单一指标缺失过多的情况;
- 场景覆盖完整性:数据涵盖工艺研发阶段的不同调整场景(如钝化时间优化、刻蚀压力调整、气体流量配比微调),能反映多样工艺条件下的指标变化规律。
5. 数据筛选与分析
5.1 筛选依据
- 字段筛选:剔除低方差字段(唯一值数量<2),如固定值为5mT的辅助压力监测字段;删除与AR fin cut工艺无关的冗余字段(如非核心步骤的边缘温度监测字段);保留35个核心有效字段(工艺时间、压力、关键气体流量等);
- 异常值剔除:基于指标目标区间与分布特征,剔除:TCD<20nm或>23nm的样本(6条)、Depth<1000A或>1400A的样本(8条)、SOCremain>500A的样本(12条);
- 缺失值处理:保留缺失值样本(3条),后续通过填充处理,避免删除有效工艺参数数据。
5.2 筛选后数据概况(与原始数据对比)
| 数据维度 |
原始数据 |
筛选后数据 |
变化说明 |
| 样本量 |
40条(含异常/缺失) |
32条(无异常/已填充) |
剔除26条异常样本,保留14条正常样本+18条经异常值剔除后的数据,补全3条缺失值样本 |
| 字段数 |
56个(含冗余/低方差) |
35个(核心有效) |
剔除21个字段:8个低方差、8个冗余、5个无关字段 |
| 指标达标率 |
TCD达标率35%、Depth达标率45% |
TCD达标率90.6%、Depth达标率93.8% |
筛选后核心指标贴合目标区间,数据质量显著提升 |
5.3 筛选合理性说明
- 剔除冗余与低方差字段,可减少模型噪声干扰,使模型聚焦“可调控参数-指标”核心关联,提升建模效率;
- 异常值样本(如Depth=142.9A、TCD=38.44nm)偏离工艺合理窗口,无法反映真实工艺规律,剔除后可避免模型学习错误关联,保障数据集中样本的工艺一致性;
- 保留缺失值样本并后续填充,可最大化利用有效工艺参数数据,避免因个别指标缺失导致优质Recipe数据浪费。
6. 数据清洗
6.1 清洗策略(针对质量报告中的问题)
| 问题类型 |
涉及字段 |
处理方法 |
处理后效果 |
| 异常值 |
TCD |
剔除<20nm或>23nm样本,保留20-23nm区间的34条样本 |
异常率从15%降至0%,数据集中于20.5-22.8nm |
| 异常值 |
Depth |
剔除<1000A或>1400A样本,保留1000-1400A区间的32条样本 |
异常率从20%降至0%,数据集中于1050-1350A |
| 异常值 |
SOCremain |
剔除>500A样本,保留0-500A区间的28条样本,剩余4条采用中位数(480A)截断填充 |
异常率从30.8%降至0%,数据集中于0-480A |
| 缺失值(随机) |
SOCremain |
1条缺失样本,采用同工艺窗口(ME3#Pressure=60mT)中位数(721.8A)填充 |
缺失率从2.5%降至0% |
| 缺失值(随机) |
SiNSWA |
2条缺失样本,采用邻近样本(时间间隔<1h)线性插值填充 |
缺失率从5%降至0% |
| 稀疏特征处理 |
DEP#ProcessTime等 |
零值保留,标记为“未启用”,无需额外填充 |
保持业务逻辑一致性,无无效填充 |
6.2 清洗前后数据对比(核心字段分布变化)
- TCD:清洗前均值25.156nm、标准差5.639nm,清洗后均值21.6nm、标准差0.8nm,呈单峰正态分布,完全贴合目标区间(21-22nm);
- Depth:清洗前均值1111.33A、标准差274.865A,清洗后均值1180A、标准差45A,分布集中于1100-1300A目标区间;
- SOCremain:清洗前均值676.30A、标准差161.674A,清洗后均值420A、标准差85A,全部落在0-500A目标区间;
- SiNSWA:清洗前有效样本均值86.71°,清洗后均值86.5°、标准差0.4°,分布均匀且贴合86-89°目标区间。
7. 特征工程
7.1 特征构建与衍生(基于差分思想)
(1)原始特征筛选与规整
保留35个核心原始特征,涵盖12个步骤的工艺时间、压力及关键气体流量,统一命名格式为“步骤_参数名_单位”(如“SiArc_ProcessTime_s”),稀疏特征零值保留并标记业务含义。
(2)差分特征构建
- 样本间差分:以中位数样本(SiArc#ProcessTime=70s、ME3#Pressure=60mT)为基准,计算两两样本的参数差值(如ΔSiArc_ProcessTime=样本值-70s)、指标差值(如ΔTCD=样本值-21.6nm);
- 关键交互特征:构建“工艺时间×压力”交互项(如ME3_ProcessTime×ME3_Pressure)、气体流量比(如CF4/CHF3)、功率/压力比等衍生特征;
- 集群内聚合特征:统计高频变化参数(如SiArc#ProcessTime、CF4流量)、敏感参数标识(对ΔTCD影响显著的参数)。
(3)特征列表(核心)
| 特征类型 |
特征名 |
来源(原始/衍生) |
业务含义 |
| 原始核心特征 |
SiArc_ProcessTime_s |
原始 |
SiArc步骤工艺时间 |
| 原始核心特征 |
ME3_Pressure_mT |
原始 |
ME3步骤反应腔压力 |
| 原始核心特征 |
SiArc_CF4_sccm |
原始 |
SiArc步骤CF4气体流量 |
| 差分特征 |
ΔSiArc_ProcessTime_s |
衍生 |
SiArc步骤工艺时间变化量 |
| 差分特征 |
ΔME3_Pressure_mT |
衍生 |
ME3步骤压力变化量 |
| 差分特征 |
ΔTCD_nm |
衍生 |
顶部关键尺寸变化量 |
| 交互特征 |
ME3_ProcessTime×ME3_Pressure |
衍生 |
ME3步骤时间与压力协同作用项 |
| 交互特征 |
CF4/CHF3_ratio |
衍生 |
刻蚀气体与钝化气体流量比 |
| 聚合特征 |
高频变化参数_TOP5 |
衍生 |
工艺调整中最常变动的核心参数 |
7.2 特征处理方法
- 格式标准化:所有特征转换为数值型,统一单位格式(时间:s、压力:mT、流量:sccm);
- 归一化处理:采用StandardScaler对原始特征(如工艺时间、压力)进行归一化,消除量纲差异;
- 特征筛选:基于方差分析(ANOVA)剔除与表征指标相关性<0.1的特征,保留28个有效特征;
- 权重分配:对ΔTCD、ΔDepth影响显著的特征(如CF4/CHF3_ratio)赋予1.2倍权重,提升模型关注度。
7.3 特征重要性评估(Top10)
| 排名 |
特征名 |
重要性得分(10分制) |
核心依据 |
| 1 |
CF4/CHF3_ratio |
9.8 |
与ΔTCD相关性-0.62,是影响TCD的核心交互特征 |
| 2 |
ΔME3_ProcessTime_s |
9.5 |
与ΔDepth相关性0.58,对深度控制影响最显著 |
| 3 |
ME3_ProcessTime×ME3_Pressure |
9.2 |
与ΔDepth相关性0.64,协同作用显著 |
| 4 |
ΔSiArc_CF4_sccm |
8.8 |
与ΔTCD相关性-0.58,刻蚀气体流量直接影响TCD |
| 5 |
ΔSRFdown2_ProcessTime_s |
8.5 |
与ΔDepth相关性0.635,步骤时间延长深度显著增加 |
| 6 |
SiArc_ProcessTime_s |
8.2 |
与Maskremain相关性0.42,钝化时间影响掩模残留量 |
| 7 |
ΔME3_Pressure_mT |
8.0 |
与ΔDepth相关性0.64,压力稳定提升深度一致性 |
| 8 |
ΔSiArc_CHF3_sccm |
7.8 |
与ΔTCD相关性0.45,钝化气体流量影响TCD增大 |
| 9 |
SOC_ProcessTime_s |
7.5 |
与SOCremain相关性0.38,工艺时间影响介质层残留 |
| 10 |
ΔDEP1_ProcessTime_s |
7.2 |
与ΔDepth相关性0.36,辅助提升深度控制精度 |
8. 模型评估数据准备与评估方法
8.1 数据集划分与训练方式(留一法)
- 划分逻辑:采用留一法交叉验证(LOOCV),以单个样本作为验证集,剩余31个样本作为训练集,循环迭代32次(覆盖所有有效样本);
- 训练集构建:包含31个样本的原始核心特征、差分特征与交互特征(28维),学习参数-指标关联规律;
- 验证集构建:每次验证集仅含1个样本的原始核心特征与聚合特征(15维),模拟“新Recipe工艺预测”场景。
8.2 核心评价指标(SC-MAP)
(1)指标定义与计算逻辑
SC-MAP指标融合“符号一致性”与“数值接近度”,输出范围0-1,分数越高预测效果越好,计算步骤如下:
- 符号一致性判定:Δy(真实变化量)与Δŷ(预测变化量)符号一致(Δy×Δŷ>0)或不一致(Δy×Δŷ≤0);
- 动态参考基准:符号一致时Ref=max(|Δy|, |Δŷ|),不一致时Ref=2×max(|Δy|, |Δŷ|);
- 相对误差:RelErr=|Δy-Δŷ|/Ref;
- 最终得分:SC-MAP=1-RelErr。
(2)分数等级与特征说明
| SC-MAP分数区间 |
预测效果等级 |
核心特征 |
| < 0.5 |
较差 |
符号一致性不足,无法反映工艺调整方向 |
| 0.5 ≤ 分数 < 0.6 |
中等 |
符号正确,数值偏差较大 |
| ≥ 0.6 |
优秀 |
符号与数值双优,贴合工艺规律 |
(3)AR工艺评估结果
基于留一法训练与SC-MAP指标评估,核心表征指标的预测效果如下:
| 表征指标 |
平均SC-MAP值 |
中位SC-MAP值 |
优秀样本占比(≥0.6) |
参考RMSE值 |
| TCD |
0.83 |
0.93 |
90.6%(29/32) |
2.24 |
| Depth |
0.78 |
0.85 |
84.4%(27/32) |
35.6 |
| SiNSWA |
0.75 |
0.82 |
81.2%(26/32) |
0.35 |
| SOCremain |
0.72 |
0.80 |
78.1%(25/32) |
42.8 |
| Maskremain |
0.85 |
0.90 |
93.8%(30/32) |
58.5 |
(4)典型Recipe示例
- 评估信息:C1292-G1-AR-R10#TCD#邻近阈值:14#SC-MAP值:0.83#中位SC-MAP值:0.93#rmse值:2.24#秩:18
- 关联邻近Recipe:C1292-G1-AR-R18、C1292-G1-AR-R20等27个相似样本
- 结果解读:该Recipe的TCD预测达优秀等级,符号一致性100%,数值误差小,模型对该类工艺参数组合的预测可靠性高。
附录:参考资料
- 《AR fin cut工艺标准操作手册(2025版)》
- 历史Recipe数据库(含C1292-G1-AR-R10等核心样本)
- 《半导体干法刻蚀原理与应用》(机械工业出版社,2024)
- KLA-Tencor CD-SEM/TEM检测报告(2025.1-2025.6)
- AR工艺参数分布统计原始数据(2025.1-2025.6)
要不要我帮你生成一份AR工艺核心特征与表征指标关联热力图,直观呈现Top10特征与各指标的关联强度,辅助后续模型优化与工艺调整决策?