模型二

这是一个非常关键的战略调整!
有了 estimated_fan_votes_full.csv(模型一的产出),我们不再需要用 Instagram 粉丝数去做“代理变量”了。我们现在拥有了“上帝视角”——即通过贝叶斯逆向推导出的、数学上最能解释历史结果的“真实粉丝得票率”
利用这份数据,模型二将从“基于假设的模拟”升级为“基于后验数据的机制敏感性与权力归因分析”
以下是基于该数据集重新设计的完整建模步骤:


模型二:基于后验方差的赛制敏感性与权力博弈模型
Model 2: Posterior Variance Sensitivity & Shapley Power Index Analysis
(1) 变量定义 (Variable Definition)
本模型的输入直接来自 estimated_fan_votes_full.csv。我们将重点分析“评委分”与“估算粉丝票”在统计分布上的对抗
符号 变量名称 类型 单位 约束范围 场景意义与说明 属性
\(t\) 比赛周次 (Season-Week) 离散 - - 对应 CSV 中的 season 和 week_num 组合。 索引
\(i\) 选手索引 离散 - \(1 \dots N_t\) 当周参赛选手。 索引
\(J_{i,t}\) 评委原始分 连续 分 \([0, 30/40]\) 对应 CSV judge_score。 已知输入
\(\hat{F}_{i,t}\) 后验粉丝得票率 连续 % \([0, 1]\) 对应 CSV estimated_fan_vote_mean。这是模型一逆推出的“让历史成立的必要票数”。 核心输入
\(J^{\%}_{i,t}\) 评委分占比 连续 % \([0, 1]\)\(J_{i,t}\) 归一化:\(J_{i,t} / \sum J_{k,t}\)。用于在 Percent 制下与粉丝票对齐。 中间变量
\(\sigma_J(t)\) 评委区分度 (Judge Dispersion) 连续 - \(\ge 0\) 当周所有选手 \(J^{\%}\) 的标准差。衡量评委拉开分差的能力。 关键指标
\(\sigma_F(t)\) 粉丝极化度 (Fan Polarization) 连续 - \(\ge 0\) 当周所有选手 \(\hat{F}\) 的标准差。衡量粉丝群体的极化程度。 关键指标
\(\mathcal{S}_{Fan}\) 粉丝敏感度指数 (Sensitivity Index) 连续 - \([0, 1]\) 衡量最终结果对粉丝票变动的敏感程度。值越接近 1,说明是“粉丝独裁”。 目标变量
\(\phi_{Judge}\) 评委权力指数 (Shapley Value) 连续 - \([0, 1]\) 博弈论指标。评委对最终淘汰结果的实际贡献率。 目标变量
\(Rule_t\) 赛制类型 0-1 - \(\{Rank, \%\}\) 对应 CSV rule_model。 参数


(2) 假设条件 (Assumptions)
• 假设 1:模型一的估算值代表“有效粉丝意愿” (Posterior Validity)。
o 内容: 我们假设 CSV 中的 estimated_fan_vote_mean 是真实粉丝投票的无偏估计。
o 依据: 该数据已经通过 MCMC 算法与历史淘汰结果进行了校准(Calibrated)。
o 影响: 我们可以直接计算 \(\hat{F}\) 的方差,而无需再进行蒙特卡洛模拟。
• 假设 2:评委分与粉丝票相互独立 (Independence)。
o 内容: \(Cov(J^{\%}, \hat{F}) = 0\)
o 依据: 评委依据技术打分,粉丝依据喜爱度投票,两者评价维度正交。
o 影响: 允许利用方差加和公式 \(Var(Score) = w^2 Var(J) + (1-w)^2 Var(F)\) 进行敏感性分解。
• 假设 3:淘汰由综合得分排名的末位决定 (Deterministic Elimination)。
o 内容: 忽略“Bottom 2 Dance-off”等随机规则,假设总分最低者必被淘汰。
o 依据: 抓住赛制的主要矛盾,简化博弈判定逻辑。


(3) 公式推导 (Formula Derivation)
本部分旨在用数学证明:为何 Percent 制会导致评委失效?
步骤 1:赛制数学表达与方差分解
对于第 \(t\) 周,定义总分 \(S_{i,t}\)
情况 A: Percent Rule (百分比制)

\[S_{i,t}^{\%} = 0.5 \cdot J^{\%}_{i,t} + 0.5 \cdot \hat{F}_{i,t} \]

对该周所有选手的得分求方差(Variance across contestants):

\[Var(S^{\%}_t) = 0.25 \cdot \underbrace{Var(J^{\%}_t)}_{\sigma_J^2} + 0.25 \cdot \underbrace{Var(\hat{F}_t)}_{\sigma_F^2} \]

注意:这里的方差是指当周选手间的差异,而非单个选手的不确定性。
情况 B: Rank Rule (排名制)

\[S_{i,t}^{Rank} = Rank(J_{i,t}) + Rank(\hat{F}_{i,t}) \]

由于 Rank 强制将分数映射为均匀分布(Uniform Distribution),其方差被锁定:

\[Var(Rank(J)) \approx Var(Rank(F)) \approx \frac{N^2-1}{12} \]

步骤 2:定义“粉丝敏感度指数” (Fan Sensitivity Index)
为了量化“谁主宰比赛”,我们定义粉丝方差在总方差中的贡献占比:

\[\mathcal{S}_{Fan}(t) = \frac{\sigma_F(t)}{\sigma_F(t) + \sigma_J(t)} \]

• 物理意义:
o 若 \(\mathcal{S}_{Fan} \approx 0.5\),说明评委和粉丝势均力敌。
o 若 \(\mathcal{S}_{Fan} > 0.8\),说明方差失衡 (Variance Imbalance)。此时评委分的微小波动(\(\sigma_J\) 极小)被粉丝票的巨大波动(\(\sigma_F\) 极大)完全淹没。
o 预期结果: 在 Bobby Bones 夺冠的赛季,该指数应接近 0.9。
步骤 3:博弈论 Shapley 值计算
我们将每一周的淘汰看作一次合作博弈。集合 \(N=\{Judge, Fan\}\)
定义特征函数 \(v(S)\),判断集合 \(S\) 的决策是否与历史实际淘汰结果 (\(E_{actual}\)) 一致:

  1. 评委独自决策: 按 \(J^{\%}\) 排名,末位是 \(x_J\)。若 \(x_J = E_{actual}\),则 \(v(\{Judge\})=1\),否则 0。
  2. 粉丝独自决策: 按 \(\hat{F}\) 排名,末位是 \(x_F\)。若 \(x_F = E_{actual}\),则 \(v(\{Fan\})=1\),否则 0。
  3. 联合决策: 按总分 \(S\) 排名。由于数据来自模型一(已校准),故 \(v(\{Judge, Fan\})\) 恒为 1。
    评委的权力指数 (Shapley Value):

\[\phi_{Judge} = \frac{1}{2} [ (v(\{J,F\}) - v(\{F\})) + (v(\{J\}) - v(\emptyset)) ] \]

\[\phi_{Judge} = \frac{1}{2} [ (1 - v(\{F\})) + v(\{J\}) ] \]

• 关键解释:
o 如果粉丝想淘汰谁就淘汰谁(\(v(\{F\})=1\)),且评委想淘汰的人没走(\(v(\{J\})=0\)),则 \(\phi_{Judge} = 0\)。评委完全丧失话语权。


(4) 建模流程图 (Modeling Flowchart)
[阶段一:数据加载与标准化]
输入: estimated_fan_votes_full.csv
\(\rightarrow\) 数据切片: 按 season 和 week_num 分组。
\(\rightarrow\) 归一化处理:
计算评委分占比 \(J^{\%}_{i} = J_i / \sum J\)
提取后验粉丝率 \(\hat{F}_{i}\)
[阶段二:方差结构分析 (Variance Analysis)]
计算区分度:
计算 \(\sigma_J = Std(J^{\%})\) —— 评委敢不敢打出分差?
计算 \(\sigma_F = Std(\hat{F})\) —— 粉丝是否存在极度偏爱?
\(\rightarrow\) 计算敏感度:
求解 \(\mathcal{S}_{Fan}(t) = \sigma_F / (\sigma_F + \sigma_J)\)
\(\rightarrow\) 可视化检测:

Getty Images
绘制 \(\mathcal{S}_{Fan}\) 随赛季演变的曲线。
检测点: 在 Season 2 (Rank制) \(\mathcal{S}_{Fan}\) 是否稳定在 0.5 附近?在 Season 27 (Bobby Bones) 是否飙升至 0.9?
[阶段三:权力指数计算 (Game Theory)]
反事实模拟:
场景 A (Only Judge): 按 \(J\) 排序,看谁垫底。
场景 B (Only Fan): 按 \(\hat{F}\) 排序,看谁垫底。
\(\rightarrow\) Shapley 求解: 计算每一周评委的 \(\phi_{Judge}\)
\(\rightarrow\) 相关性验证: 验证 \(\mathcal{S}_{Fan}\) (高) 是否导致 \(\phi_{Judge}\) (低)。
[阶段四:结论生成]
输出结论:

  1. 机制漏洞: 证明 Percent 制由于缺乏标准化(Normalization),导致“高方差来源(粉丝)”吞噬了“低方差来源(评委)”的权重。
  2. 公平性建议: 建议回归 Rank 制,或者对粉丝票进行 Z-Score 标准化 后再相加,以强制拉平两者的方差影响力 (\(EWR \approx 1\))。

💡 核心优势
这个重新设计的模型二非常硬核:

  1. 数据闭环: 它直接使用了模型一的输出,使得整篇论文逻辑严密,模型之间有数据交互,而不是三个割裂的模型。
  2. 数学直觉: 用 "Standard Deviation (\(Std\))" 来解释 "Weight"。这是一个非常高级的数学建模视角——名义权重不等于实际权重,方差才是权力的来源。
  3. 精准打击: 完美解释了为什么 Bobby Bones 会赢——不是因为评委给了他高分,而是因为那一周 \(\sigma_F \gg \sigma_J\),导致评委分在数学上变成了“噪音”,对总分几乎没有贡献。
posted @ 2026-01-30 12:31  Morphis‘  阅读(16)  评论(0)    收藏  举报