柏拉图的洞穴与数据的阴影
柏拉图的洞穴与数据的阴影
原文:
towardsdatascience.com/platos-cave-and-the-shadows-of-data/
我希望它能让你感到愉快——并在过程中激发一些反思。
在柏拉图的《共和国》中,囚犯被锁在洞穴里。背后有一堆火在燃烧,在他们面前的墙上阴影闪烁。这些阴影是囚犯所见到的全部。他们把它们误认为是现实本身,没有意识到洞穴外面有一个充满光明和实质的真实世界。
这与处理数据有何不同?它常常感觉就像生活在那个洞穴里。我们的数据集是阴影——更深、更丰富的现实的投影。数字的行和列捕捉到生活的片段:一次购买、一份病历、点击网站、一场足球比赛……但那些点背后的生活体验——动机、背景、不确定性——仍然超出了我们的视野。
作为洞穴中的囚犯,把阴影当作本身是很诱人的。我们与他们之间的区别在于,我们有能力(和义务)意识到它们是阴影,并且它们不一定显示真相。
一个流失模型预测谁会离开一个平台。一个医学算法估计风险。一个预期进球模型用于确定每个得分机会的质量。所有这些都有用。但它们都不是现实。它们是阴影——部分、扭曲和不完整的。
问题不在于阴影的存在,而在于我们忘记了它们是阴影。
真正的危险在于我们忘记了这一点。当我们把模型与真相混淆,或者把预测误认为是理解时,我们就有可能将阴影变成教条。正如柏拉图洞穴中的囚犯相信墙壁讲述着整个故事一样,我们也可以被我们的结果和指标所蒙蔽。
然而,柏拉图的故事不仅是一个警告——它也是一个邀请。阴影,尽管不完美,揭示了某些真实的东西。它们承载着结构、模式和重要的信号。更明智行动的关键是以谦卑的态度接近它们。
我们的职责是提醒决策者和其他利益相关者,我们正在工作的这些数字和模型只是反映,而不是现实本身。因此,数据科学家的角色是帮助他人看到阴影背后的火焰,而不是揭示绝对真理。
柏拉图的洞穴至今仍在对我们说话。我们永远无法完全走出数据之外,因为现实总是比我们构建的表格和图表更丰富。然而,如果我们记住我们的数据集是阴影,我们就可以小心地与之合作。目标不是逃离洞穴,而是在其中明智地生活。
应对日常面对的这些影子的方式是通过斯多葛主义。这可能与柏拉图的哲学关系不大,但不同哲学流派与数据科学之间存在着许多联系。
斯多葛主义者将他们工作的一部分集中在管理不确定性上:他们提醒我们只关注我们所能控制的事情,并接受超出我们控制范围的事情。
我们面对的不确定性并不不同于洞穴中的囚犯:墙上的影子——不完整的数据集、不完美的模型、不可避免的确定性——在很大程度上超出了我们的控制范围。
然而,我们控制着如何解释它们,如何传达它们的局限性,以及如何负责任地使用它们来指导决策。
与数据一起工作可以被视为一种日常的斯多葛练习(如果做得好)。它训练耐心、韧性、谦卑和洞察力。有一个概念非常适合当今的背景:冷静的好奇心。这就是我们如何接近影子,尽可能提取洞察力,但永远不要将墙上的闪光误认为是全部真相。
为了结束这篇简短的论文,通过结合柏拉图和斯多葛主义者的教训,我们定义了数据科学的一些关键哲学方面:
-
我们认识到我们所看到的只是影子,而非完整的画面(柏拉图的洞穴)。
-
我们接受我们知识的局限性,并在这些限制内行动(斯多葛主义)。
与一些人的想法相反,影子并非敌人。如果我们知道如何解读它们,它们反而会成为我们的指南。

浙公网安备 33010602011771号