数据收集与描述分析报告（28HK P1LEC CIP18工艺·核心Spec版）

1. 数据收集报告

1.1 数据来源

来源：28HK P1LEC CIP18 等离子体工艺实验（设备型号：北方华创P1LEC CIP18，时间段：2025.1-2025.10）；
数据类型：包含工艺配方数据（Recipe）与核心表征指标数据（Spec），具体为28HK-P1LEC-CIP18-BCD-R01、28HK-P1LEC-CIP18-TCD-R15等系列Recipe数据文件；
收集方式：工艺参数（如压力、气体流量、射频功率）由设备控制系统自动记录，经工艺员导出；表征指标（BCD、HKBCD、MCD、SWA、TCD）由OCD（光学临界尺寸）设备检测获取。

1.2 数据量统计

样本量：原始Recipe样本42条，考虑模型抗干扰性，纳入所有样本建模；
字段数：原始工艺参数字段约48个，工艺结果字段5个（BCD、HKBCD、MCD、SWA、TCD）；
数据权限与合规性：数据属第二刻蚀事业部工艺研发数据，访问权限仅限项目相关成员，符合公司数据安全规范。

1.3 未获取数据说明

所有样本工艺参数与核心表征指标（BCD、HKBCD、MCD、SWA、TCD）均无缺失，原因是工艺实验为专项研发，数据采集流程规范；
影响评估：数据完整度100%，无需特殊处理，可直接用于建模分析。

2. 数据描述报告

2.1 整体概况

数据覆盖范围：涵盖多晶硅刻蚀、栅极介质加工等核心工艺模块的参数，及5个关键表征指标（多晶硅与高k层的关键尺寸、侧壁角度）。

2.2 工艺参数详情表

字段名	业务含义	示例值	统计范围
Strip#Pressure	Strip步骤反应腔压力	10mT	10-10mT
Strip#Time	Strip步骤工艺时间	40s	40-60s
ME#Pressure	ME步骤反应腔压力	3.5mT	3-5mT
ME#O2	ME步骤O₂气体流量	4sccm	3-6sccm
ME#CF4	ME步骤CF₄气体流量	70sccm	40-84sccm
ME#N2	ME步骤N₂气体流量	10sccm	10-20sccm

表征指标

结合28HK制程研发需求及Spec区间，定义如下关键指标：

指标	定义	目标区间	检测手段
BCD	多晶硅底部关键尺寸（nm）	32-36	OCD
HKBCD	高k层底部关键尺寸（nm）	32-38	OCD
MCD	多晶硅中间关键尺寸（nm）	31-34	OCD
SWA	多晶硅侧壁角度（°）	88-89.5	OCD
TCD	多晶硅顶部关键尺寸（nm）	34-37	OCD

目标优先级

指标	权重	优先级原因
BCD	3	直接决定多晶硅栅极的电流导通能力与漏电特性，是晶体管性能的核心约束
TCD	3	顶部关键尺寸与侧壁角度协同影响栅极形貌，对器件开关速度与可靠性起关键作用
SWA	2	保障多晶硅栅极侧壁垂直度，避免短路与漏电风险，权重次之但为基础约束
HKBCD	1	高k层关键尺寸需匹配多晶硅栅极，为系统适配性指标，为辅助约束
MCD	1	中间关键尺寸是BCD与TCD的过渡指标，反映刻蚀均匀性，为辅助约束

2.3 数据分布概览

数值型字段（工艺参数）：

压力参数：Strip#Pressure固定为10mT（无波动）；ME#Pressure中位数3.5mT，75%样本集中在3-3.5mT，分布稳定；
时间参数：Strip#Time中位数40s，75%样本集中在40-45s，无极端波动；
气体流量参数：ME#O₂中位数4sccm，75%样本集中在3-5sccm；ME#CF₄中位数70sccm，分布跨度较大（40-84sccm）；ME#N₂固定为10mT（无波动）。

目标变量（表征指标）：

SWA：均值88.69°，中位数88.45°，标准差0.44°，分布集中且接近目标区间（88-89.5°）；
BCD：均值33.29nm，中位数33.25nm，标准差1.13nm，目标区间内分布占比约80%；
MCD：均值32.87nm，中位数32.85nm，标准差0.77nm，分布均匀；
HKBCD：均值34.69nm，中位数34.58nm，标准差1.51nm，存在少量高值异常（如38.69nm）；
TCD：均值35.45nm，中位数35.41nm，标准差0.52nm，目标区间内分布占比约90%；

3. 数据探索报告

3.1 单变量分析（关键字段分布特征）

SWA（°）：
- 分布特征：取值范围87.56-89.51°，90%样本集中在88.18-89.03°，无明显异常分布，说明侧壁角度工艺稳定性较好；
- 关键发现：所有样本均在目标区间（88-89.5°）内，工艺对侧壁角度的控制能力达标。
BCD（nm）：
- 分布特征：取值范围31.24-36.08nm，中位数33.25nm，75%样本集中在32.48-34.63nm，存在10%样本（≥34.63nm）接近目标区间上限；
- 关键发现：需关注高值样本的参数关联，避免BCD超出Spec上限影响器件性能。
ME#CF4（sccm）：
- 分布特征：取值范围40-84sccm，中位数70sccm，75%样本集中在60-73.7sccm，分布跨度大，反映CF₄流量是工艺主要调控参数之一；
- 关键发现：CF₄流量的大幅调整直接影响多晶硅刻蚀速率与CD均匀性，是建模需重点关注的参数。
TCD（nm）：
- 分布特征：取值范围34.55-37.1nm，中位数35.41nm，95%样本集中在35.04-35.94nm，分布高度集中；
- 关键发现：TCD工艺稳定性极佳，需分析其与其他参数的强关联机制，提炼通用调控规律。

3.2 多变量分析

基于相关性矩阵，核心字段强关联规律如下：

表征指标间强相关性：
- BCD与MCD相关性0.9693（极强正相关），说明多晶硅底部与中间关键尺寸变化趋势高度一致；
- BCD与HKBCD相关性0.9215（极强正相关），多晶硅底部关键尺寸与高k层底部关键尺寸协同性显著；
- SWA与BCD相关性-0.9004（极强负相关），多晶硅底部关键尺寸增大时，侧壁角度呈减小趋势；
- SWA与MCD相关性-0.7672（强负相关），多晶硅中间关键尺寸增大时，侧壁角度呈减小趋势；
工艺参数与表征指标强相关性：
- ME#Pressure与BCD相关性0.4762（中等正相关），ME步骤压力升高提升等离子体密度均匀性，BCD增大；
- ME#Pressure与HKBCD相关性0.3924（弱正相关），ME步骤压力对高k层底部关键尺寸有正向影响；
- ME#O2与BCD相关性-0.6414（强负相关），ME步骤O₂流量增加增强氧化刻蚀，BCD减小；
- ME#O2与MCD相关性-0.5985（强负相关），ME步骤O₂流量增加对多晶硅中间关键尺寸刻蚀作用显著；
- ME#CF4与TCD相关性-0.5183（强负相关），ME步骤CF₄流量增加对多晶硅顶部关键尺寸刻蚀作用显著；

3.3 全样本base的Hamming距离分布

所有42个base的汉明距离中位数集中为8-15，其中30个base的中位数集中在10-12，占比71.4%，说明大部分base的参数组合相似度分布较为集中，工艺调整以小幅优化为主。

3.4 业务关联探索

工艺逻辑契合：ME#CF4流量增加→多晶硅刻蚀速率提升→BCD与TCD减小，与“化学刻蚀主导多晶硅去除”的物理机制一致；ME#Pressure升高→等离子体分布更均匀→BCD与TCD一致性提升，符合等离子体工艺规律；
参数调整规律：核心参数（ME#CF4、ME#O2）调整幅度集中在±20%以内（如CF4流量±10sccm、O2流量±1sccm），体现28HK工艺“精准微调”的研发特点，避免大幅调整导致良率波动。

3.5 初步分析

数据无需缺失值处理，可直接用于建模；
建模重点：模型需优先保障“符号一致性”（如CF4流量增加→BCD减小的方向正确），再提升数值预测精度，契合工艺研发“先定趋势、再优幅度”的需求。

4. 数据质量报告

4.1 质量问题清单

问题类型	涉及字段	问题描述（数量/比例）	影响评估	处理优先级
低方差字段	Strip#Pressure、ME#N2	唯一值数量=1（固定值）	低	3
无缺失值与异常值	所有字段	数据完整且无物理异常	无	-

4.2 数据一致性校验

工艺逻辑校验：同一Recipe下各步骤参数无冲突（如功率与气体流量的协同匹配）；
参数范围校验：核心参数均在设备硬件允许范围内（如ME#Pressure≤5mT、ME#CF4≤100sccm），无超出量程的异常值；
指标合理性校验：所有表征指标均在物理合理区间内，无检测误差或工艺异常导致的不合理数值。

4.3 完整性评估

参数完整性：核心工艺参数（压力、气体流量、工艺时间）无缺失，覆盖多晶硅刻蚀与栅极介质加工全流程，满足建模对输入特征的需求；
指标完整性：5个核心表征指标完整度100%，无指标缺失；
场景覆盖完整性：数据涵盖工艺研发阶段的不同调整场景（如CF4流量优化、O2流量配比微调、压力稳定性验证），能反映多样工艺条件下的指标变化规律。

5. 数据筛选与分析

5.1 筛选依据

字段筛选：剔除低方差字段（Strip#Pressure、ME#N2），保留与核心Spec（BCD、TCD等）强相关的工艺参数字段（如ME#CF4、ME#O2、ME#Pressure等）；
无缺失值与异常值，无需额外样本筛选。

5.2 筛选合理性说明

剔除低方差字段可减少模型噪声，使模型聚焦“强关联工艺参数-核心Spec”的核心关联，提升建模效率；
保留所有样本可最大化利用工艺数据，完整反映28HK P1LEC CIP18工艺的参数-核心指标强关联规律。

模型评价与下一步工作分析报告（28HK P1LEC CIP18工艺）

1. 评价结果

1.1 核心产出

多组base（BCD、HKBCD等）的local推优模型及自验证报告（含一致性率、置信区间）；
每个base的group local范围定义报告（阈值、local最优目标、样本清单）；
3组典型参数伴随效应分析报告（如ME#CF4与BCD）；
交互式工具（支持local范围可视化、自验证方向对比、推优规则查询）。

1.2 评价结果

评价维度	指标	目标值	实际结果
局部预测精度	多base的平均SC-MAP得分	≥0.65	0.72
局部预测精度	平均BCD RMSE（nm）	≤0.5	0.35
阈值有效性	达标base比例（SC-MAP≥0.65）	≥50%	60%（多数base达标）
规则一致性	参数影响规则与经验一致性率	≥80%	85%（核心特征的回归系数方向与工艺师经验一致）
自验证一致性率	-	≥75%	85%

1.3 典型案例验证

案例1：base R70#BCD的自验证（R70→local最优目标R30）

local范围定义：
最优阈值=9，local范围含8条样本，local最优目标为R30（综合得分优，高于R70的表现）；
真实距离（R70→R30）：
ΔME#CF4减少、ΔME#O2增加、ΔME#Pressure调整；
自验证过程：
a. 遮住R30数据，用local范围其他7条样本训练推优模型；
b. 模型输出Top 5推优组合趋势性：ΔME#CF4减少、ΔME#O2增加、ΔME#Pressure调整；
一致性判定：
核心参数的调整方向均与真实距离一致；
可视化验证：
平行坐标图中参数变化趋势与真实调整方向完全契合。

案例2：base R140#HKBCD的自验证（R140→local最优目标R30）

local范围定义：
最优阈值=6，local范围含7条样本，local最优目标为R30（得分优，高于R140的表现）；
真实距离（R140→R30）：
ΔME#CF4调整、ΔME#O2调整、ΔME#Pressure调整；
自验证过程：
a. 遮住R30数据，用local范围6条样本训练模型；
b. 模型推优方向：ΔME#CF4调整、ΔME#O2调整、ΔME#Pressure调整；
一致性判定：
核心参数方向均与真实距离一致；
可视化验证：
平行坐标图中参数变化轨迹与真实调整路径高度重合。

案例3：ME#CF4系数差异分析（对BCD的影响）
现象：ME#CF4对BCD的回归系数在不同base下差异显著，如某base中系数为-0.08，另一base中为-0.05。

伴随效应挖掘：
- 系数为-0.08的场景：ME#CF4调整时，伴随ME#O2正向调整（Δ=+1sccm，氧化刻蚀增强）、ME#Pressure正向调整（Δ=+0.5mT，等离子体密度均匀性提升）。其中ME#O2对BCD的刻蚀增强影响占比70%，模型将部分影响分摊给ME#CF4，导致系数绝对值较大。
- 系数为-0.05的场景：ME#CF4调整时，伴随ME#O2少量正向调整（Δ=+0.5sccm，氧化刻蚀增幅有限）、ME#Pressure稳定。此时ME#CF4自身的刻蚀影响占比60%，模型系数绝对值相对较小。
原因总结：
ME#CF4的系数绝对值由伴随参数（如ME#O2、ME#Pressure）的调整幅度与影响权重决定，不同base下伴随参数的协同作用差异导致系数波动。

案例4：BCD提升有限的参数组合分析
现象：在最优recipe推优中，其他指标提升显著，但BCD提升有限，与工艺师期望存在偏差。

原因分析：
- 参数组合偏向性：当前推优的参数组合（如ME#CF4、ME#O2等）以其他指标为核心设计逻辑，对BCD的影响呈现“抵消性”（如某参数提升同时轻微增大BCD，与另一参数的减小效应部分抵消），导致BCD提升有限。
- 得分函数偏差：BCD与其他指标权重相同条件下，因其他指标提升空间更大，模型优先保证其达标，减少了对BCD的提升投入。
解决方案：
- 挖掘“BCD优先”参数组合：筛选如“微调ME#CF4与ME#O2流量比例+控制工艺时间”的组合，在保证其他指标的同时，最大化BCD改善空间。
- 动态调整得分函数曲率：针对目标Recipe，将BCD权重从默认值提升，引导模型优先提升BCD，对齐工艺师期望。

2. 模型确认

2.1 回顾挖掘过程

核心建模逻辑搭建：基于差分的数据样本，采用“全样本保留作为base+每个base动态阈值优化+稳健性系数校准”的建模方式，多组base模型实现高稳健性预测；
关键里程碑：
- 数据处理：全样本保留，无缺失值，生成多组base的完整差分数据集（含各类工艺场景）；
- 阈值优化：多组base的动态阈值均通过SC-MAP与RMSE综合确定，达标率较高；
- 模型训练：通过留一法采样实现稳健性优化，系数置信区间覆盖率满足业务需求；
- 业务落地：跨base组合达标率较好，工艺师认可率较高；
成功因素：
- 全样本保留覆盖28HK P1LEC CIP18工艺的多样场景，无规律遗漏；
- 动态阈值适配每个base的独特性，提升模型精度；
- 稳健性优化有效抵消异常点影响，增强规则可靠性；
- 多元线性模型解释性强，符合工艺师对等离子体工艺参数-指标关联的认知。

2.2 过程总结

自验证逻辑契合28HK工艺研发需求：通过“蒙住local最优目标→推优→对比真实距离”，精准验证模型推优能力；
技术价值：构建“local范围定义→稳健性建模→自验证→伴随效应解释”的完整框架，为28HK P1LEC CIP18工艺研发提供可复用的推优方案；
待优化点：
部分base的得分函数需进一步对齐工艺师对多晶硅与栅极介质指标的优先级期望。

3. 确定下一步工作内容

工作清单：
- 样本扩充：收集更多28HK P1LEC CIP18工艺样本，重点补充极端base的相似工艺数据，缩小参数置信区间跨度；
- 模型迭代：优化极端base的动态阈值算法与稳健性采样策略，结合等离子体工艺物理机制（如离子轰击与化学反应的协同）约束系数范围，进一步提升规则可靠性；
- 工具升级：增加“base集群推荐+置信区间重叠分析”功能，自动识别阈值相似且参数置信区间重叠度高的base集群，提升组合挖掘效率。

模型算法与训练分析报告（28HK P1LEC CIP18工艺）

1. 算法确定

1.1 算法选择（全base+动态阈值+稳健性驱动）

核心算法：每个base独立的多元线性差分拟合算法（带稳健性优化），模型公式为：$\Delta 指标 = w_1\Delta 参数_1 + w_2\Delta 参数_2 + ... + w_n\Delta 参数_n$（无截距项，$w$为经稳健性校准的系数）；
稳健性优化核心逻辑：通过留一法重复采样，迭代排除单个样本训练模型，生成多组系数分布，取中位数作为最终系数，计算置信区间（20%、80%分位数），提升模型抗异常值干扰能力；
算法优势：
- 全base覆盖（如BCD、HKBCD、MCD、SWA、TCD等base），无样本浪费，适配28HK P1LEC CIP18工艺的多指标场景；
- 动态阈值适配每个base的独特性（如不同base的汉明距离分布差异），模型精度更高；
- 稳健性优化抵消异常点影响，系数更可靠，规则带置信区间更具参考价值；
- 系数解释性强，符合工艺师“参数调整→指标变化”的认知逻辑（如ME#CF4流量变化对BCD的线性影响）。

1.2 核心评价指标

SC-MAP指标定义与计算逻辑
- SC-MAP指标融合“符号一致性”与“数值接近度”，输出范围0-1，分数越高预测效果越好，计算步骤如下：
- 符号一致性判定：Δy（真实指标变化量）与Δŷ（预测指标变化量）符号一致（Δy×Δŷ>0）或不一致（Δy×Δŷ≤0）；
- 动态参考基准：符号一致时Ref=max(|Δy|, |Δŷ|)，不一致时Ref=2×max(|Δy|, |Δŷ|)；
- 相对误差：RelErr=|Δy-Δŷ|/Ref；
- 最终得分：SC-MAP=1-RelErr。
分数等级与特征说明

SC-MAP分数区间	预测效果等级	核心特征
< 0.5	较差	符号一致性不足，无法反映工艺调整方向
0.5 ≤ 分数 < 0.6	中等	符号正确，数值偏差较大
≥ 0.6	优秀	符号与数值双优，贴合28HK工艺规律

1.3 参数设定

模型模块	设定参数	验证结果（以base R70及BCD指标为例）
多元线性回归	拟合截距fit_intercept=False	rmse=0.26，SC-MAP=0.72
动态阈值扩充范围	M±5（默认），不达标时扩展至M±7	最优阈值=9，邻近样本8条
综合性能权重	SC-MAP权重0.6，RMSE权重0.4	最优阈值综合得分=0.70

1.4 检验设计

差分有效性检验：对比原始数据与差分数据的模型SC-MAP与RMSE，统计达标率（SC-MAP≥0.7、BCD RMSE≤0.5nm）；
动态阈值优化有效性检验：对比每个base的最优阈值与固定阈值（百分位数）的模型性能；统计最优阈值的平均SC-MAP较固定阈值提升率，平均RMSE降低率，验证动态阈值优化的必要性；
推优有效性检验：选取3组已知优质Recipe作为目标，验证模型从base Recipe到目标Recipe的参数调整方向一致性（如ME#CF4流量调整方向与工艺经验的匹配度）。

2. 模型训练

2.1 数据划分（留一法交叉验证）

划分方式：针对每个base的邻近样本差分数据集，采用留一法交叉验证，将数据集分为训练集（k-1条）与验证集（1条），迭代k次（k为邻近样本数）；
训练集：k-1条差分数据（Δ参数、Δ指标）；
验证集：1条差分数据的Δ参数，用于测试模型预测Δ指标的精度。

2.2 训练流程

base初始化：选择1条Recipe作为当前base（如R0#BCD、R70#SWA等），提取其参数与指标基准值；
差分数据构建：计算该base与其他样本的Δ参数、Δ指标，生成原始差分数据集；
动态阈值计算：计算汉明距离中位数M，生成候选阈值集（M±2）；
阈值优化：对每个候选阈值筛选邻近样本，训练模型并计算SC-MAP与RMSE，确定最优阈值；
训练数据确定：基于最优阈值筛选邻近样本差分数据，标准化Δ参数；
模型训练：训练多元线性模型，输出“Δ参数→Δ指标”系数；
模型验证：留一法交叉验证，计算平均SC-MAP与RMSE，达标则保留模型，未达标则扩大阈值范围重新优化；
规则提取：基于模型系数，提取Top 5参数的“单位变化→指标变化”规则；
循环迭代：重复步骤1-8，完成所有base（BCD、HKBCD、MCD、SWA、TCD）的模型训练。

2.3 模型调优（稳健性核心优化）

系数校准：通过留一法重复采样生成系数分布，用中位数替代普通最小二乘系数，抵消单个异常样本对系数的偏移影响（如极端ME#O2流量样本的干扰）；
置信区间校验：对每个参数的置信区间，若区间跨度过大（如ΔBCD的置信区间>±0.5nm），回溯邻近样本数据，检查是否存在系统性线性关联薄弱问题，必要时扩大阈值范围补充样本；
跨base一致性校验：对核心参数（如ME#CF4），统计其在所有base中的系数分布及置信区间重叠度，输出“跨base平均影响幅度+综合置信区间”，辅助工艺师快速参考（如“ME#CF4跨base平均影响：每+1sccm，BCD-0.08nm [95%CI: -0.10~-0.06nm]”）。

2.4 模型训练细节

数据预处理（全样本保留，无剔除）
- 缺失值处理：所有base的工艺参数与表征指标无缺失，无需插值或填充；
- 数据格式统一：将所有base的工艺参数（如压力、气体流量）、表征指标（SWA、BCD、MCD等）转换为数值型，确保Δ参数与Δ指标计算无误；
- 无样本剔除：保留所有样本作为base，后续通过稳健性优化处理异常点影响。
差分数据构建（针对每个base独立执行）
- 提取当前base的工艺参数（如Strip#Pressure、ME#CF4等）与表征指标（如BCD、SWA等），作为基准值；
- 提取其他样本的对应参数与指标，逐一计算“Δ参数”与“Δ指标”；
- 整理差分数据，形成该base的原始差分数据集（无筛选，保留所有）。
动态阈值计算与优化
- 步骤1：计算当前base与其他样本的汉明距离（基于工艺参数的组合相似度）；
- 步骤2：对汉明距离排序，取中位数M（如base R70#BCD的M=9）；
- 步骤3：按“M-2、M-1、M、M+1、M+2”生成候选阈值集；
- 对每个候选阈值，筛选汉明距离≤该阈值的差分数据作为邻近样本差分数据集；
- 基于邻近样本差分数据集训练带稳健性优化的多元线性模型，计算SC-MAP得分与RMSE（如BCD、SWA）；
- 定义综合性能得分=0.6×SC-MAP + 0.4×(1-RMSE/最大RMSE)，选择综合得分最高的候选阈值作为最终阈值；
- 若所有候选阈值的SC-MAP<0.7，扩大扩充范围（M±3），重新生成候选阈值集重复优化。

3. 模型评估

3.1 评价结果汇总

评价维度	指标	目标值	实际结果
局部预测精度	所有base的平均SC-MAP得分	≥0.7	0.72
局部预测精度	平均BCD RMSE（nm）	≤0.5	0.35
阈值有效性	达标base比例（SC-MAP≥0.7）	≥80%	85%（多数base达标）

数据收集与描述分析报告（28HK P1LEC CIP18工艺）

1. 数据收集报告

1.1 数据来源

来源：28HK P1LEC CIP18 等离子体工艺实验（设备型号：北方华创P1LEC CIP18，时间段：2025.1-2025.10）；
数据类型：包含工艺配方数据（Recipe）与表征指标数据（Spec），具体为28HK-P1LEC-CIP18-R01、28HK-P1LEC-CIP18-R15等系列Recipe数据文件；
收集方式：工艺参数（如压力、气体流量、射频功率）由设备控制系统自动记录，经工艺员导出；表征指标（如SWA、BCD、MCD、TCD）由OCD（光学临界尺寸）设备检测获取。

1.2 数据量统计

样本量：原始Recipe样本42条，考虑模型抗干扰性，纳入所有样本建模；
字段数：原始工艺参数字段约48个，工艺结果字段8个（SWA、BCD、MCD、HKBCD、TCD、OX_H、SiN_H、Poly_H）；
数据权限与合规性：数据属第二刻蚀事业部工艺研发数据，访问权限仅限项目相关成员，符合公司数据安全规范。

1.3 未获取数据说明

所有样本工艺参数与表征指标均无缺失，原因是工艺实验为专项研发，数据采集流程规范；
影响评估：数据完整度100%，无需特殊处理，可直接用于建模分析。

2. 数据描述报告

2.1 整体概况

数据覆盖范围：涵盖Poly刻蚀、OX刻蚀、SiN沉积等核心工艺模块的参数，及8个关键表征指标（多晶硅与栅极介质的尺寸、厚度、形貌）。

2.2 工艺参数详情表

字段名	业务含义	示例值	统计范围
Strip#Pressure	Strip步骤反应腔压力	10mT	10-10mT
Strip#Time	Strip步骤工艺时间	40s	40-60s
ME#Pressure	ME步骤反应腔压力	3.5mT	3-5mT
ME#O2	ME步骤O₂气体流量	4sccm	3-6sccm
ME#CF4	ME步骤CF₄气体流量	70sccm	40-84sccm
ME#N2	ME步骤N₂气体流量	10sccm	10-20sccm

表征指标

结合28HK制程研发需求及Spec区间，定义如下关键指标：

指标	定义	目标区间	检测手段
SWA	多晶硅侧壁角度（°）	88-89.5	OCD
BCD	多晶硅底部关键尺寸（nm）	32-36	OCD
MCD	多晶硅中间关键尺寸（nm）	31-34	OCD
HKBCD	高k层底部关键尺寸（nm）	32-38	OCD
TCD	多晶硅顶部关键尺寸（nm）	34-37	OCD
OX_H	氧化层厚度（nm）	52-56	OCD
SiN_H	氮化硅厚度（nm）	20-23	OCD
Poly_H	多晶硅高度（nm）	56-58	OCD

目标优先级

指标	权重	优先级原因
BCD	3	直接决定多晶硅栅极的电流导通能力与漏电特性，是晶体管性能的核心约束
TCD	3	顶部关键尺寸与侧壁角度协同影响栅极形貌，对器件开关速度与可靠性起关键作用
SWA	2	保障多晶硅栅极侧壁垂直度，避免短路与漏电风险，权重次之但为基础约束
OX_H	1	氧化层厚度需控制在合理区间，影响栅极电容特性，为辅助约束
SiN_H	1	氮化硅厚度需满足工艺窗口，为后续工艺提供保护层，为辅助约束
MCD	1	中间关键尺寸是BCD与TCD的过渡指标，反映刻蚀均匀性，为辅助约束
HKBCD	1	高k层关键尺寸需匹配多晶硅栅极，为系统适配性指标，为辅助约束
Poly_H	1	多晶硅高度需与介质层厚度协同，为结构适配性指标，为辅助约束

2.3 数据分布概览

数值型字段（工艺参数）：

压力参数：Strip#Pressure固定为10mT（无波动）；ME#Pressure中位数3.5mT，75%样本集中在3-3.5mT，分布稳定；
时间参数：Strip#Time中位数40s，75%样本集中在40-45s，无极端波动；
气体流量参数：ME#O₂中位数4sccm，75%样本集中在3-5sccm；ME#CF₄中位数70sccm，分布跨度较大（40-84sccm）；ME#N₂固定为10mT（无波动）。

目标变量（表征指标）：

SWA：均值88.69°，中位数88.45°，标准差0.44°，分布集中且接近目标区间（88-89.5°）；
BCD：均值33.29nm，中位数33.25nm，标准差1.13nm，目标区间内分布占比约80%；
MCD：均值32.87nm，中位数32.85nm，标准差0.77nm，分布均匀；
HKBCD：均值34.69nm，中位数34.58nm，标准差1.51nm，存在少量高值异常（如38.69nm）；
TCD：均值35.45nm，中位数35.41nm，标准差0.52nm，目标区间内分布占比约90%；

3. 数据探索报告

3.1 单变量分析（关键字段分布特征）

SWA（°）：
- 分布特征：取值范围87.56-89.51°，90%样本集中在88.18-89.03°，无明显异常分布，说明侧壁角度工艺稳定性较好；
- 关键发现：所有样本均在目标区间（88-89.5°）内，工艺对侧壁角度的控制能力达标。
BCD（nm）：
- 分布特征：取值范围31.24-36.08nm，中位数33.25nm，75%样本集中在32.48-34.63nm，存在10%样本（≥34.63nm）接近目标区间上限；
- 关键发现：需关注高值样本的参数关联，避免BCD超出Spec上限影响器件性能。
ME#CF4（sccm）：
- 分布特征：取值范围40-84sccm，中位数70sccm，75%样本集中在60-73.7sccm，分布跨度大，反映CF₄流量是工艺主要调控参数之一；
- 关键发现：CF₄流量的大幅调整直接影响多晶硅刻蚀速率与CD均匀性，是建模需重点关注的参数。
TCD（nm）：
- 分布特征：取值范围34.55-37.1nm，中位数35.41nm，95%样本集中在35.04-35.94nm，分布高度集中；
- 关键发现：TCD工艺稳定性极佳，需分析其与其他参数的强关联机制，提炼通用调控规律。

3.2 多变量分析

基于Pearson相关性分析，核心字段关联规律如下：

BCD与工艺参数相关性：
- 与ME#CF4流量相关性-0.62（强负相关），CF₄流量增加刻蚀能力增强，BCD减小；
- 与ME#Pressure相关性0.55（中等正相关），压力升高提升等离子体密度均匀性，BCD增大。
TCD与工艺参数相关性：
- 与ME#O2流量相关性-0.48（中等负相关），O₂流量增加增强氧化刻蚀，TCD减小；
- 与ME#CF4流量相关性-0.51（中等负相关），CF₄流量增加对TCD的刻蚀作用显著。
指标间相关性：
- BCD与TCD相关性0.78（强正相关），多晶硅栅极的底部与顶部关键尺寸变化趋势一致；
- SWA与ME#Pressure相关性0.35（弱正相关），压力稳定有助于侧壁角度保持垂直。

3.3 全样本base的Hamming距离分布

所有42个base的汉明距离中位数集中为8-15，其中30个base的中位数集中在10-12，占比71.4%，说明大部分base的参数组合相似度分布较为集中，工艺调整以小幅优化为主。

3.4 业务关联探索

工艺逻辑契合：ME#CF4流量增加→多晶硅刻蚀速率提升→BCD与TCD减小，与“化学刻蚀主导多晶硅去除”的物理机制一致；ME#Pressure升高→等离子体分布更均匀→BCD与TCD一致性提升，符合等离子体工艺规律；
参数调整规律：核心参数（ME#CF4、ME#O2）调整幅度集中在±20%以内（如CF4流量±10sccm、O2流量±1sccm），体现28HK工艺“精准微调”的研发特点，避免大幅调整导致良率波动。

3.5 初步分析

数据无需缺失值处理，可直接用于建模；
建模重点：模型需优先保障“符号一致性”（如CF4流量增加→BCD减小的方向正确），再提升数值预测精度，契合工艺研发“先定趋势、再优幅度”的需求。

4. 数据质量报告

4.1 质量问题清单

问题类型	涉及字段	问题描述（数量/比例）	影响评估	处理优先级
低方差字段	Strip#Pressure、ME#N2	唯一值数量=1（固定值）	低	3
无缺失值与异常值	所有字段	数据完整且无物理异常	无	-

4.2 数据一致性校验

工艺逻辑校验：同一Recipe下各步骤参数无冲突（如功率与气体流量的协同匹配）；
参数范围校验：核心参数均在设备硬件允许范围内（如ME#Pressure≤5mT、ME#CF4≤100sccm），无超出量程的异常值；
指标合理性校验：所有表征指标均在物理合理区间内，无检测误差或工艺异常导致的不合理数值。

4.3 完整性评估

参数完整性：核心工艺参数（压力、气体流量、工艺时间）无缺失，覆盖多晶硅刻蚀与栅极介质加工全流程，满足建模对输入特征的需求；
指标完整性：8个核心表征指标完整度100%，无指标缺失；
场景覆盖完整性：数据涵盖工艺研发阶段的不同调整场景（如CF4流量优化、O2流量配比微调、压力稳定性验证），能反映多样工艺条件下的指标变化规律。

5. 数据筛选与分析

5.1 筛选依据

字段筛选：剔除低方差字段（Strip#Pressure、ME#N2），保留46个核心有效字段（气体流量、压力、工艺时间等）；
无缺失值与异常值，无需额外样本筛选。

5.2 筛选合理性说明

剔除低方差字段可减少模型噪声，使模型聚焦“可调控参数-指标”的核心关联，提升建模效率；
保留所有样本可最大化利用工艺数据，完整反映28HK P1LEC CIP18工艺的参数-指标关联规律。

[二刻BU--G0-P2工艺] 业务需求与数据目标报告

版本：V1.0
日期：2025-11-09
编制人：[易志伟/数字智能部]
审核人：[张迪/数字智能部]

引言

1.1 背景与业务场景

工艺类型：28HK P1LEC CIP18 等离子体工艺（多晶硅与栅极介质层加工，属于高密度等离子体刻蚀/沉积大类）
工艺名称：28HK P1LEC CIP18 inline OCD 工艺
工艺用途：28nm HKMG（高k金属栅）制程中多晶硅（Poly）与栅极介质层（OX、SiN等）的关键尺寸（CD）、厚度（H）及形貌（SWA）的精准控制，是实现晶体管性能（开关速度、功耗、良率）的核心干法工艺。当前产线面临以下核心痛点：
- 参数协同性难题：多工艺模块（Poly刻蚀、OX刻蚀、SiN沉积等）的射频功率、气体流量、压力等参数存在强耦合，例如Poly BCD（多晶硅底部关键尺寸）对Poly SWA（侧壁角度）的交叉影响率达15%，传统经验调参难以平衡多指标（CD、H、SWA）需求；
- 表征精度要求极致化：随着制程对器件性能的严苛要求，Poly TCD（顶部关键尺寸）控制精度需从±2nm提升至±1nm，Poly SWA需稳定在88°±0.5°，而现有工艺能力的良率达标率不足80%；
- 均匀性管控严格：晶圆径向与面内的参数分布（如OX_H厚度的中心-边缘差异）需控制在1.5nm以内，均匀性波动超过2nm会导致器件阈值电压漂移，进而影响芯片功能良率；
- 工艺难度大：属于多材料复合加工工艺，涉及多晶硅、氧化层、氮化硅的选择性刻蚀与沉积平衡。例如Poly刻蚀需兼顾CD均匀性与SWA垂直度，OX刻蚀需保障对Si衬底的高选择性，各工艺步骤的参数切换需精准同步，否则会产生界面缺陷或残留；
相关方（业务方等）
- 二刻工艺工程师--于凡（二刻BU，拥有多年等离子体刻蚀工艺开发经验，主导过28HK及更先进制程的Poly与栅极介质工艺优化）；
- 数字智能部易志伟（负责AI模型开发与数据驱动的工艺优化）。

1.2 报告目的与范围

明确核心目标
构建“工艺参数-多表征指标”的端到端量化模型，聚焦28HK P1LEC CIP18工艺研发阶段的分析需求，提炼参数影响趋势、明确参数优先级、挖掘优质参数组合模式，为工艺优化提供数据支撑，缩短研发周期。
界定项目边界
本报告聚焦28HK P1LEC CIP18工艺研发阶段的参数分析与组合挖掘，覆盖多晶硅（Poly）、栅极介质（OX、SiN）的关键尺寸、厚度、形貌等核心表征指标。

业务目标

2.1 核心目标与具体目标

核心目标：
建立基于工艺数据的回归预测模型，挖掘工艺参数对表征指标的影响Trend、量化参数优先级、挖掘优质参数组合模式，辅助工艺工程师优化28HK P1LEC CIP18工艺，缩短研发周期。
具体目标：
- 建立多变量回归模型，实现Poly BCD预测误差≤1nm、OX_H预测误差≤1nm、Poly SWA预测误差≤0.5°、SiN_H预测误差≤1nm；
- 挖掘3-5组优质参数组合模式，输出“参数区间-指标表现”对应关系，且组合在相关验证中达标率≥80%；
- 解释参数影响Trend与工艺师经验的差异原因，提供可理解的参数调整逻辑；

2.2 业务产出与评价标准

成功指标
- 特征影响趋势一致性：模型输出的参数对核心指标（Poly BCD、OX_H）的影响趋势（正向/负向、线性/非线性），与工艺工程师经验的一致性率≥85%；
- 参数优先级合理性：模型识别的Top 8关键参数中，至少6个与工程师经验认定的核心参数重合，符合等离子体工艺物理机制（如射频功率对离子密度的影响、气体流量对刻蚀选择性的作用）；
- 组合模式推优准确性：模型挖掘的优质参数组合，指标达标率（满足各项目标区间）≥90%；
辅助指标
- 模型可解释性：通过参数敏感性图、特征相关性热力图等工具，清晰呈现单个参数及参数交互作用对指标的影响规律，工程师可直接用于工艺调整决策（如明确“提升ICP功率会同步增加Poly刻蚀速率与SWA垂直度”的量化关系）；
- 组合模式可复用性：挖掘的参数组合模式需明确适用的工艺窗口边界（如压力10-15mT、温度35-40℃），支持在28HK及相近制程（如14nm）研发中快速复用。

术语说明

术语	定义及核心思想
差分数据	以单个Recipe为base，与其他所有Recipe计算的“参数变化差值”（Δ参数=对比Recipe参数 - base参数）与“表征指标差异”（Δ指标=对比Recipe指标 - base指标）
动态阈值	每个base独立计算的邻近样本筛选阈值：先求汉明距离中位数，扩充后结合SC-MAP与RMSE确定最优值
稳健性优化	基于留一法重复采样的系数校准，输出带置信区间的规则，提升抗异常值干扰能力
参数伴随效应	单个参数对指标的影响受其他协同调整参数干扰，导致呈现非单一正负向规律，是模型与经验冲突的核心原因（如Poly BCD受ICP功率与Cl₂流量的共同作用，功率提升的同时降低流量可能使BCD无明显变化）
SC-MAP指标	融合符号一致性与数值接近度的增量预测评价指标，范围0-1，分数越高效果越好

需求风险分析

4.1 需求与假设约束

核心假设
- 工艺参数与表征指标间存在稳定的量化关系，且该关系在当前北方华创P1LEC CIP18设备状态、物料批次下具有可重复性。
- 历史工艺数据的采集精度（如射频功率、气体流量的实时监测，CD-SEM、OCD的表征精度）满足建模要求，无系统性偏差。
约束条件
- 工艺参数调整范围受限于设备硬件能力（如射频功率上限、气体流量量程）。
- 表征指标检测周期较长（如TEM离线表征），实时数据反馈存在延迟。

4.2 风险对策

潜在风险
- 数据不足：历史工艺Recipe数量有限，或关键参数（如不同气体的流量配比、射频偏置功率）的覆盖范围不足，导致模型泛化能力差。
- 业务目标模糊：工艺工程师对“最优”指标的定义存在歧义（如Poly BCD与SWA的权衡）。
应对措施
- 针对数据不足：通过构建差分数据，建立以每个recipe为基础的差分拟合模型，同时明确其“附近可调范围”，最大化利用有限数据的信息密度。
- 针对业务目标模糊：定期与工艺工程师对齐目标，明确各指标的优先级与量化阈值（如Poly BCD优先满足Spec限，再优化SWA）。

数据挖掘目标

技术目标：
- 构建基于差分数据的局部拟合模型，实现核心指标（Poly BCD、OX_H、Poly SWA、SiN_H）的精准预测；
- 开发自适应阈值选取框架，基于数据密度自动确定聚类邻域范围；
- 量化参数重要性及交互作用，输出 Top 10 关键参数及其权重（如ICP功率、Cl₂流量、O₂流量对Poly BCD的影响权重）；
- 开发交互式推优模块，支持参数调整方向可视化与动态寻优（如模拟“提升5% ICP功率+降低3sccm Cl₂流量”对Poly BCD与SWA的联合影响）。
模型评价指标：
- 预测精度： SC-MAP 平均得分≥0.75，Poly BCD RMSE≤0.5nm，OX_H RMSE≤0.5nm；
- 特征一致性：关键参数与经验重合率≥75%，Trend 一致性率≥85%；
- 推优有效性：推荐组合达标率≥80%，参数调整方向符合等离子体工艺逻辑（如离子轰击与化学反应的协同机制）；
- 工具可用性：交互式功能支持等高线图、响应面图可视化，操作便捷性≥90%。

模型计划

6.1 算法技术框架选取

Python+pandas+numpy+Scikit-learn+ skopt+networkx+ Matplotlib，文档中模型训练代码基于该框架开发。

6.2 算法计划方向

核心算法：diff-local 差分拟合算法；
阈值选取：hamming 距离中位数（初始邻域半径）+ DBScan 聚类（动态调整）；
模型优化：线性回归（基础场景）+ 神经网络（高精度需求场景，如Poly SWA的复杂非线性关系）；
推优算法：基于拉丁超立方+贝叶斯寻优算法。

发表于 2025-11-09 16:43 yizhiwei 阅读(1) 评论(0) 收藏举报

阿道夫

数据收集与描述分析报告（28HK P1LEC CIP18工艺·核心Spec版）

1. 数据收集报告

1.1 数据来源

1.2 数据量统计

1.3 未获取数据说明

2. 数据描述报告

2.1 整体概况

2.2 工艺参数详情表

表征指标

目标优先级

2.3 数据分布概览

数值型字段（工艺参数）：

目标变量（表征指标）：

3. 数据探索报告

3.1 单变量分析（关键字段分布特征）

3.2 多变量分析

3.3 全样本base的Hamming距离分布

3.4 业务关联探索

3.5 初步分析

4. 数据质量报告

4.1 质量问题清单

4.2 数据一致性校验

4.3 完整性评估

5. 数据筛选与分析

5.1 筛选依据

5.2 筛选合理性说明

模型评价与下一步工作分析报告（28HK P1LEC CIP18工艺）

1. 评价结果

1.1 核心产出

1.2 评价结果

1.3 典型案例验证

2. 模型确认

2.1 回顾挖掘过程

2.2 过程总结

3. 确定下一步工作内容

模型算法与训练分析报告（28HK P1LEC CIP18工艺）

1. 算法确定

1.1 算法选择（全base+动态阈值+稳健性驱动）

1.2 核心评价指标

1.3 参数设定

1.4 检验设计

2. 模型训练

2.1 数据划分（留一法交叉验证）

2.2 训练流程

2.3 模型调优（稳健性核心优化）

2.4 模型训练细节

3. 模型评估

3.1 评价结果汇总

数据收集与描述分析报告（28HK P1LEC CIP18工艺）

1. 数据收集报告

1.1 数据来源

1.2 数据量统计

1.3 未获取数据说明

2. 数据描述报告

2.1 整体概况

2.2 工艺参数详情表

表征指标

目标优先级

2.3 数据分布概览

数值型字段（工艺参数）：

目标变量（表征指标）：

3. 数据探索报告

3.1 单变量分析（关键字段分布特征）

3.2 多变量分析

3.3 全样本base的Hamming距离分布

3.4 业务关联探索

3.5 初步分析

4. 数据质量报告

4.1 质量问题清单

4.2 数据一致性校验

4.3 完整性评估

5. 数据筛选与分析

5.1 筛选依据

5.2 筛选合理性说明

[二刻BU--G0-P2工艺] 业务需求与数据目标报告

引言

1.1 背景与业务场景

1.2 报告目的与范围

业务目标