模型二

这是一个非常关键的战略调整！
有了 estimated_fan_votes_full.csv（模型一的产出），我们不再需要用 Instagram 粉丝数去做“代理变量”了。我们现在拥有了“上帝视角”——即通过贝叶斯逆向推导出的、数学上最能解释历史结果的“真实粉丝得票率”。
利用这份数据，模型二将从“基于假设的模拟”升级为“基于后验数据的机制敏感性与权力归因分析”。
以下是基于该数据集重新设计的完整建模步骤：

模型二：基于后验方差的赛制敏感性与权力博弈模型
Model 2: Posterior Variance Sensitivity & Shapley Power Index Analysis
(1) 变量定义 (Variable Definition)
本模型的输入直接来自 estimated_fan_votes_full.csv。我们将重点分析“评委分”与“估算粉丝票”在统计分布上的对抗。
符号变量名称类型单位约束范围场景意义与说明属性
\(t\) 比赛周次 (Season-Week) 离散 - - 对应 CSV 中的 season 和 week_num 组合。索引
\(i\) 选手索引离散 - \(1 \dots N_t\) 当周参赛选手。索引
\(J_{i,t}\) 评委原始分连续分 \([0, 30/40]\) 对应 CSV judge_score。已知输入
\(\hat{F}_{i,t}\) 后验粉丝得票率连续 % \([0, 1]\) 对应 CSV estimated_fan_vote_mean。这是模型一逆推出的“让历史成立的必要票数”。核心输入
\(J^{\%}_{i,t}\) 评委分占比连续 % \([0, 1]\) 将 \(J_{i,t}\) 归一化：\(J_{i,t} / \sum J_{k,t}\)。用于在 Percent 制下与粉丝票对齐。中间变量
\(\sigma_J(t)\) 评委区分度 (Judge Dispersion) 连续 - \(\ge 0\) 当周所有选手 \(J^{\%}\) 的标准差。衡量评委拉开分差的能力。关键指标
\(\sigma_F(t)\) 粉丝极化度 (Fan Polarization) 连续 - \(\ge 0\) 当周所有选手 \(\hat{F}\) 的标准差。衡量粉丝群体的极化程度。关键指标
\(\mathcal{S}_{Fan}\) 粉丝敏感度指数 (Sensitivity Index) 连续 - \([0, 1]\) 衡量最终结果对粉丝票变动的敏感程度。值越接近 1，说明是“粉丝独裁”。目标变量
\(\phi_{Judge}\) 评委权力指数 (Shapley Value) 连续 - \([0, 1]\) 博弈论指标。评委对最终淘汰结果的实际贡献率。目标变量
\(Rule_t\) 赛制类型 0-1 - \(\{Rank, \%\}\) 对应 CSV rule_model。参数

(2) 假设条件 (Assumptions)
• 假设 1：模型一的估算值代表“有效粉丝意愿” (Posterior Validity)。
o 内容：我们假设 CSV 中的 estimated_fan_vote_mean 是真实粉丝投票的无偏估计。
o 依据：该数据已经通过 MCMC 算法与历史淘汰结果进行了校准（Calibrated）。
o 影响：我们可以直接计算 \(\hat{F}\) 的方差，而无需再进行蒙特卡洛模拟。
• 假设 2：评委分与粉丝票相互独立 (Independence)。
o 内容： \(Cov(J^{\%}, \hat{F}) = 0\)。
o 依据：评委依据技术打分，粉丝依据喜爱度投票，两者评价维度正交。
o 影响：允许利用方差加和公式 \(Var(Score) = w^2 Var(J) + (1-w)^2 Var(F)\) 进行敏感性分解。
• 假设 3：淘汰由综合得分排名的末位决定 (Deterministic Elimination)。
o 内容：忽略“Bottom 2 Dance-off”等随机规则，假设总分最低者必被淘汰。
o 依据：抓住赛制的主要矛盾，简化博弈判定逻辑。

(3) 公式推导 (Formula Derivation)
本部分旨在用数学证明：为何 Percent 制会导致评委失效？
步骤 1：赛制数学表达与方差分解
对于第 \(t\) 周，定义总分 \(S_{i,t}\)。
情况 A: Percent Rule (百分比制)

\[S_{i,t}^{\%} = 0.5 \cdot J^{\%}_{i,t} + 0.5 \cdot \hat{F}_{i,t} \]

对该周所有选手的得分求方差（Variance across contestants）：

\[Var(S^{\%}_t) = 0.25 \cdot \underbrace{Var(J^{\%}_t)}_{\sigma_J^2} + 0.25 \cdot \underbrace{Var(\hat{F}_t)}_{\sigma_F^2} \]

注意：这里的方差是指当周选手间的差异，而非单个选手的不确定性。
情况 B: Rank Rule (排名制)

\[S_{i,t}^{Rank} = Rank(J_{i,t}) + Rank(\hat{F}_{i,t}) \]

由于 Rank 强制将分数映射为均匀分布（Uniform Distribution），其方差被锁定：

\[Var(Rank(J)) \approx Var(Rank(F)) \approx \frac{N^2-1}{12} \]

步骤 2：定义“粉丝敏感度指数” (Fan Sensitivity Index)
为了量化“谁主宰比赛”，我们定义粉丝方差在总方差中的贡献占比：

\[\mathcal{S}_{Fan}(t) = \frac{\sigma_F(t)}{\sigma_F(t) + \sigma_J(t)} \]

• 物理意义：
o 若 \(\mathcal{S}_{Fan} \approx 0.5\)，说明评委和粉丝势均力敌。
o 若 \(\mathcal{S}_{Fan} > 0.8\)，说明方差失衡 (Variance Imbalance)。此时评委分的微小波动（\(\sigma_J\) 极小）被粉丝票的巨大波动（\(\sigma_F\) 极大）完全淹没。
o 预期结果：在 Bobby Bones 夺冠的赛季，该指数应接近 0.9。
步骤 3：博弈论 Shapley 值计算
我们将每一周的淘汰看作一次合作博弈。集合 \(N=\{Judge, Fan\}\)。
定义特征函数 \(v(S)\)，判断集合 \(S\) 的决策是否与历史实际淘汰结果 (\(E_{actual}\)) 一致：

评委独自决策：按 \(J^{\%}\) 排名，末位是 \(x_J\)。若 \(x_J = E_{actual}\)，则 \(v(\{Judge\})=1\)，否则 0。
粉丝独自决策：按 \(\hat{F}\) 排名，末位是 \(x_F\)。若 \(x_F = E_{actual}\)，则 \(v(\{Fan\})=1\)，否则 0。
联合决策：按总分 \(S\) 排名。由于数据来自模型一（已校准），故 \(v(\{Judge, Fan\})\) 恒为 1。
评委的权力指数 (Shapley Value)：

\[\phi_{Judge} = \frac{1}{2} [ (v(\{J,F\}) - v(\{F\})) + (v(\{J\}) - v(\emptyset)) ] \]

\[\phi_{Judge} = \frac{1}{2} [ (1 - v(\{F\})) + v(\{J\}) ] \]

• 关键解释：
o 如果粉丝想淘汰谁就淘汰谁（\(v(\{F\})=1\)），且评委想淘汰的人没走（\(v(\{J\})=0\)），则 \(\phi_{Judge} = 0\)。评委完全丧失话语权。

(4) 建模流程图 (Modeling Flowchart)
[阶段一：数据加载与标准化]
输入： estimated_fan_votes_full.csv
\(\rightarrow\) 数据切片：按 season 和 week_num 分组。
\(\rightarrow\) 归一化处理：
计算评委分占比 \(J^{\%}_{i} = J_i / \sum J\)。
提取后验粉丝率 \(\hat{F}_{i}\)。
[阶段二：方差结构分析 (Variance Analysis)]
计算区分度：
计算 \(\sigma_J = Std(J^{\%})\) —— 评委敢不敢打出分差？
计算 \(\sigma_F = Std(\hat{F})\) —— 粉丝是否存在极度偏爱？
\(\rightarrow\) 计算敏感度：
求解 \(\mathcal{S}_{Fan}(t) = \sigma_F / (\sigma_F + \sigma_J)\)。
\(\rightarrow\) 可视化检测：

Getty Images
绘制 \(\mathcal{S}_{Fan}\) 随赛季演变的曲线。
检测点：在 Season 2 (Rank制) \(\mathcal{S}_{Fan}\) 是否稳定在 0.5 附近？在 Season 27 (Bobby Bones) 是否飙升至 0.9？
[阶段三：权力指数计算 (Game Theory)]
反事实模拟：
场景 A (Only Judge): 按 \(J\) 排序，看谁垫底。
场景 B (Only Fan): 按 \(\hat{F}\) 排序，看谁垫底。
\(\rightarrow\) Shapley 求解：计算每一周评委的 \(\phi_{Judge}\)。
\(\rightarrow\) 相关性验证：验证 \(\mathcal{S}_{Fan}\) (高) 是否导致 \(\phi_{Judge}\) (低)。
[阶段四：结论生成]
输出结论：

机制漏洞：证明 Percent 制由于缺乏标准化（Normalization），导致“高方差来源（粉丝）”吞噬了“低方差来源（评委）”的权重。
公平性建议：建议回归 Rank 制，或者对粉丝票进行 Z-Score 标准化后再相加，以强制拉平两者的方差影响力 (\(EWR \approx 1\))。

💡 核心优势
这个重新设计的模型二非常硬核：

数据闭环：它直接使用了模型一的输出，使得整篇论文逻辑严密，模型之间有数据交互，而不是三个割裂的模型。
数学直觉：用 "Standard Deviation (\(Std\))" 来解释 "Weight"。这是一个非常高级的数学建模视角——名义权重不等于实际权重，方差才是权力的来源。
精准打击：完美解释了为什么 Bobby Bones 会赢——不是因为评委给了他高分，而是因为那一周 \(\sigma_F \gg \sigma_J\)，导致评委分在数学上变成了“噪音”，对总分几乎没有贡献。

posted @ 2026-01-30 12:31 Morphis‘ 阅读(16) 评论(0) 收藏举报

刷新页面返回顶部

Morphis

模型二

公告