task5灵敏度分析
第三问:舞者能力指数权重灵敏度分析
一、分析目的
舞者能力指数由四个分量加权构成:
[
\text{舞者能力指数} = w_1 \times \text{晋级率} + w_2 \times \text{搭档平均排名(反向)} + w_3 \times \text{评分稳定性} + w_4 \times \text{决赛率}
]
主分析采用基准权重 (0.4, 0.3, 0.2, 0.1)。本灵敏度分析检验:当权重改变时,评委与粉丝影响方式的相同点/不同点是否仍然成立。
二、权重方案设计
| 方案 | 晋级率 | 搭档平均排名 | 评分稳定性 | 决赛率 | 说明 |
|---|---|---|---|---|---|
| 基准 | 0.4 | 0.3 | 0.2 | 0.1 | 主分析采用 |
| 方案 A | 0.5 | 0.25 | 0.15 | 0.1 | 更强调晋级率 |
| 方案 B | 0.35 | 0.35 | 0.2 | 0.1 | 晋级率与排名并重 |
| 方案 C | 0.3 | 0.3 | 0.3 | 0.1 | 三项均衡 |
三、各方案下 Ridge 系数对比
数据来源:task3_sensitivity_dancer_weights_results.csv(由 code/task3_sensitivity_dancer_weights.py 生成)。
3.1 舞者能力指数(pro_dancer_ability_index)
| 方案 | 评委模型系数 | 粉丝模型系数 | 符号一致 | 大小接近 |
|---|---|---|---|---|
| 基准 | 0.00624 | 0.00631 | ✓ 均为正 | ✓ |
| 方案 A | 0.00628 | 0.00644 | ✓ 均为正 | ✓ |
| 方案 B | 0.00640 | 0.00639 | ✓ 均为正 | ✓ |
| 方案 C | 0.00544 | 0.00541 | ✓ 均为正 | ✓ |
3.2 赛季编号(season_number)
| 方案 | 评委模型系数 | 粉丝模型系数 | 符号一致 |
|---|---|---|---|
| 基准 | -0.00823 | -0.00811 | ✓ 均为负 |
| 方案 A | -0.00832 | -0.00821 | ✓ 均为负 |
| 方案 B | -0.00819 | -0.00806 | ✓ 均为负 |
| 方案 C | -0.00817 | -0.00803 | ✓ 均为负 |
3.3 行业:TV_Personality、Other
| 方案 | ind5_TV(评委/粉丝) | ind5_Other(评委/粉丝) | 符号一致 |
|---|---|---|---|
| 基准 | -0.00289 / -0.00208 | -0.00351 / -0.00343 | ✓ 均为负 |
| 方案 A | -0.00293 / -0.00212 | -0.00346 / -0.00336 | ✓ 均为负 |
| 方案 B | -0.00285 / -0.00204 | -0.00352 / -0.00344 | ✓ 均为负 |
| 方案 C | -0.00292 / -0.00211 | -0.00362 / -0.00355 | ✓ 均为负 |
3.4 搜索热度(log_search_popularity)
| 方案 | 评委模型系数 | 粉丝模型系数 | 粉丝 > 评委 |
|---|---|---|---|
| 基准 | 0.00129 | 0.00203 | ✓ |
| 方案 A | 0.00123 | 0.00196 | ✓ |
| 方案 B | 0.00129 | 0.00204 | ✓ |
| 方案 C | 0.00145 | 0.00221 | ✓ |
3.5 性别(男性,gender_M)
| 方案 | 评委模型系数 | 粉丝模型系数 | 评委更负 |
|---|---|---|---|
| 基准 | -0.00225 | -0.00092 | ✓ |
| 方案 A | -0.00211 | -0.00077 | ✓ |
| 方案 B | -0.00229 | -0.00096 | ✓ |
| 方案 C | -0.00233 | -0.00102 | ✓ |
3.6 模型拟合(5 折 CV R²)
| 方案 | 评委 R² | 粉丝 R² |
|---|---|---|
| 基准 | 0.178 | 0.119 |
| 方案 A | 0.177 | 0.120 |
| 方案 B | 0.181 | 0.122 |
| 方案 C | 0.167 | 0.107 |
四、结论
4.1 相同点(稳健性)
在四种权重方案下,以下结论均成立:
- 舞者能力指数:评委与粉丝模型中系数均为正,且大小接近,说明专业舞者能力对评委分与粉丝票均有正向影响,且影响程度相似。
- 赛季编号:两模型中系数均为负,符号一致。
- 行业(TV_Personality、Other):两模型中系数均为负,符号一致。
4.2 不同点(稳健性)
在四种权重方案下,以下结论均成立:
- 搜索热度:粉丝模型中的系数始终大于评委模型,说明搜索热度对粉丝投票的影响强于对评委打分的影响。
- 性别(男性):评委模型中的系数始终更负,说明男性在评委打分下相对不利,而在粉丝投票下不利程度较轻。
4.3 综合结论
灵敏度分析表明:对舞者能力指数权重的选择(0.4/0.3/0.2/0.1 及其替代方案)不改变评委与粉丝影响方式的核心结论。即:
- 相同点(舞者能力、赛季、行业在两模型中符号一致且舞者能力均为正向、大小接近)稳健;
- 不同点(搜索热度在粉丝模型中更大、性别在评委模型中更负)稳健。
因此,主分析中关于「评委与粉丝影响方式的异同」的结论对舞者能力指数的权重设定不敏感,具有较好的稳健性。
五、运行说明
# 依赖:先运行 task3_pro_dancer_index.py、task3_build_features.py
python code/task3_sensitivity_dancer_weights.py
输出:output/task3_sensitivity_dancer_weights_results.csv(各方案下 Ridge 系数汇总)。

浙公网安备 33010602011771号