模型四
收到!完全理解。有时候“大道至简” (Simplicity is the ultimate sophistication) 才是数学建模的最高境界。过于复杂的遗传算法可能会让评委觉得你在炫技,而忽略了问题本质。
我们将模型四简化为:“基于 Z-Score 标准化的综合评价与模拟模型” (Z-Score Standardization & Simulation Model)。
这个模型的核心逻辑不再是“搜索最优参数”,而是“对比三种特定机制”。我们只需要证明:简单的 Z-Score 加法,就能完美解决复杂的公平性问题。
以下是简化后的详细建模步骤:
模型四:基于 Z-Score 标准化的综合评价与模拟模型
Model 4: Z-Score Standardization & Comparative Simulation
(1) 变量定义 (Variable Definition)
我们只定义最核心的变量,去掉所有复杂的动态权重系数。
符号 变量名称 类型 单位 约束 场景意义
\(S_{i,t}^{New}\) 新机制总分 连续 \(\sigma\) - 选手 \(i\) 在新规则下的最终得分。
\(Z_{i,t}^{Judge}\) 评委标准化分 连续 - \(\approx [-3, 3]\) \(Z = \frac{x - \mu}{\sigma}\)。消除评委打分的量纲和方差差异。
\(Z_{i,t}^{Fan}\) 粉丝标准化分 连续 - \(\approx [-3, 3]\) 消除粉丝投票的量纲和方差差异。
\(Rank_{Final}\) 最终排名 离散 - \(1 \dots N\) 依据总分 \(S\) 排序。
\(\rho\) 公平性指标 连续 - \([-1, 1]\) 最终排名与评委技术排名的 Spearman 相关系数。
\(\Delta\) 颠覆率 (Flip Rate) 连续 % \([0, 1]\) 新规则结果与旧规则结果不一致的比例(衡量改变了多少历史)。
(2) 假设条件 (Assumptions)
• 假设 1:标准正态分布假设 (Standard Normality)。
o 内容: 假设通过 Z-Score 变换后,评委分和粉丝票都近似服从 \(N(0, 1)\) 分布。
o 依据: 中心极限定理及统计学常用的标准化处理方法。
o 影响: 使得两者可以直接相加,无需担心“权重”被方差大的一方(粉丝)吞噬。
• 假设 2:评委代表“绝对技术真理” (Judges represent Merit)。
o 内容: 我们将“公平”定义为:结果不能过度偏离评委的技术判断。
o 依据: 这是一个舞蹈比赛,技术应当是基石。
(3) 公式推导 (Formula Derivation) —— 极简版
我们的目标是设计一个简单公式,替代复杂的 Percent 计算。
步骤 1:标准化 (Standardization)
针对模型二发现的“粉丝方差太大,评委方差太小”的问题,我们直接对两者进行标准化:
对于第 \(t\) 周的选手 \(i\):
注意: 这里对粉丝票 \(F\) 取了对数 \(\ln\),是为了处理长尾分布(网红效应),这也是一种简单的降维打击。
步骤 2:新计分公式 (The New Scoring Rule)
既然两者都变成了标准分,它们现在的“价值”是完全相等的。不需要加权,直接相加:
• 物理含义: 你的总分 = 你比平均评委分高几个标准差 + 你比平均粉丝票高几个标准差。
• 为什么有效: Bobby Bones 虽然粉丝票极高(比如 \(Z_{Fan} = +3.0\)),但他跳得极差(\(Z_{Judge} = -3.5\))。相加后 \(S = -0.5\),直接被中和掉,从而被淘汰。
步骤 3:评价指标 (Evaluation Metrics)
我们需要证明这个简单公式比现在的 Percent 制好。
• 指标 A(公平性): 计算新排名与评委排名的相关性。
• 指标 B(娱乐性/悬念):
保留一个简单的“底线机制”:
(4) 建模流程图 (Modeling Flowchart)
这个流程非常线性,容易执行和描述:
[阶段一:机制定义 (Rule Definition)]
定义三种对比模式:
- Baseline: 现行的 Percent Rule (模型二已证明有缺陷)。
- Competitor: 传统的 Rank Rule (太无聊)。
- Proposal: Z-Score Summation (我们提出的)。
[阶段二:历史重演 (Simulation)]
输入: 模型一生成的 estimated_fan_votes_full.csv。
处理:
• 对每一周的数据,分别应用上述三种规则计算排名。
• 重点检测 Season 27: 看看在 Z-Score 规则下,Bobby Bones 会在第几周被淘汰?(预期:第 6-7 周)。
[阶段三:性能打分 (Performance Scoring)]
计算 Fairness: 你的新规则是否让技术好的选手走得更远?
计算 Robustness: 你的新规则是否抵抗住了“刷票”?
[阶段四:结论 (Conclusion)]
输出: 推荐采用 Z-Score 计分法。
理由:
• 它最简单(不需要改变投票方式)。
• 它最数学(解决了方差失衡)。
• 它最有效(成功在反事实模拟中阻止了极端的“不公平夺冠”)。
💡 为什么这个“简单版”更好?
- 易于解释: 你只需要告诉评委:“以前的问题是粉丝票波动太大,把评委分淹没了。我们现在把它们拉到同一水平线上再相加。解决了。” —— 这比遗传算法更有说服力。
- 公式优美: \(S = Z_J + Z_F\)。这体现了数学的对称美。
- 针对性强: 它像手术刀一样,精准切掉了模型二发现的“毒瘤”(Variance Imbalance),没有多余的动作。

浙公网安备 33010602011771号