人类思维与机器学习模型
人类思维与机器学习模型
原文:
towardsdatascience.com/human-minds-vs-machine-learning-models-c66c809194b4/
免责声明:
-
这篇博客文章是由我的朋友,Dee Penco共同撰写的,她是一位认证的治疗师和顾问。
-
在过去的 2.5+年里,我和 Dee 花费了大量的时间和精力讨论和推理人类行为,这激发了我对心理学的热情。随着时间的推移,我们在心理学和 ML/AI 建模概念上相互交流了想法。
-
虽然我发现这两个领域之间存在相似之处,但我问 Dee 她能否解释人类是如何运作和做出决定的。我对通用人工智能(AGI)的兴起感到好奇,我的问题是:人类在生成输出时是否遵循与机器学习相同的步骤,模仿类似人类的决策是否可行?
-
让我非常高兴的是,Dee 决定和我一起写这篇帖子,分享人类与 ML 模型创建输出的双重视角。
-
在下面的文本中,我们有时将 AI 和 ML 作为术语互换使用,但我们理解它们并不相同,并且 ML 是 AI 的一个子集。
![_"如果你的思维是一个充满影响的旋转星系,一个机器学习模型更像是一个有明确轨道的太阳系。两者都在旋转和进化,只是在复杂性的不同尺度上。"_[照片由 Growtika 在 Unsplash 提供]](../Images/f6a9b50a2038c22e1e8e02c45f3b2aa1.png)
"如果你的思维是一个充满影响的旋转星系,一个机器学习模型更像是一个有明确轨道的太阳系。两者都在旋转和进化,只是在复杂性的不同尺度上。"[照片由Growtika在Unsplash提供]]
2024 年是认可机器学习和人工智能贡献的重要年份。
诺贝尔化学奖授予了蛋白质科学领域的进步:大卫·贝克因创造新型蛋白质,以及戴米斯·哈萨比斯和约翰·朱帕因开发一个解决 50 年预测蛋白质复杂结构的挑战的人工智能模型。
此外,约翰·霍普菲尔德和杰弗里·辛顿因他们在人工神经网络、类似大脑的模型上的工作而获得了诺贝尔物理学奖,这些模型能够识别模式并产生类似于人类决策过程的结果。
尽管人工智能越来越精确地模拟人类的问题解决和决策过程,但人类认知背后的机制仍需要完全理解。
人类(再)反应的心理涉及复杂相互关联的维度,由意识和潜意识因素的多层塑造。
— 那么,是什么让人类和 ML/AI 模型在生成输出时有所不同?
为了回答这个问题,让我们探索这两个世界——心理学和机器学习——并揭示塑造人类和人类创造的AI 模型产生输出的联系。
本文的目的是:
-
将高级专业心理学解释更接近技术读者,探讨影响人类决策的因素。
-
展示高级机器学习(ML)建模过程,并解释 ML 模型如何向非技术专业人士生成输出。
-
识别产生输出的两个过程——人类和机器——之间的差异和相似之处。
心理学方面:人类如何生成输出? | By Dee
在我开始撰写这一部分之前,我想强调,如果有一种方法可以让人们更简单地运作——或者至少像 AI 或 ML 模型一样简单,那么全世界每一位心理学家都会感到兴奋。
AI 和 ML 的专家可能对我的说法感到震惊,因为我暗示了“AI 和 ML 很简单”。
— 但那并不是我的意图。
我只想强调这些模型与人类复杂性相比有多简单。
当 Marina 在较高层次上解释机器学习建模的工作原理时,我忍不住想:
如果我们能够将人类简化为这种“简单”的方法,我们将治愈大多数心理问题,改善生活,并显著提高整体人口福祉。
想象一下,如果一个人能够接收输入(s),将它们传递给一些内部算法,这些算法能够确定输入的权重、重要性和质量,做出最可能的预测,并根据这个预测产生一个控制的输出——思想、情感或行为。
但与 ML 或 AI 不同,人类大脑以更加复杂的方式处理信息,受到众多相互关联因素的影响。
从这个点开始,我将停止对 AI 或 ML 模型内部发生的事情进行推测,解释“人类”建模流程。
为了说明这个概念,我将讨论几个影响人类决策的因素。
为了这个目的,我邀请你想象一个人是一个“预训练的黑色盒子模型”。换句话说,一个模型已经预先加载了知识模式,并在训练步骤中学习了权重。
这些模式和权重或因素因人而异,被称为:
-
(1)智力和智商
-
(2)情感世界和情商
-
(3)意识世界——模型迄今为止所学习的内容:价值观、经验、目的
-
(4) 无意识和潜意识世界 - 到目前为止“模型”所学习和压抑的内容 - 短期/长期记忆 + (再次)价值观、经验、目的
-
(5) 遗传倾向 - 我们天生具有的
-
(6) 环境 - 社会、文化、物理
-
(7) 生理需求 - 马斯洛需求层次(需求层次)
-
(8) 激素 + 生理状态 - 神经生物学、内分泌系统、唤醒
-
(9) 决策中心 - 我们内心的分离实体:本我、自我、超我
-
(10) 直觉创造力 – 可以被认为是上述分组变量的一部分或它们自己的独立实体(直觉、发散性思维、心流状态)
到目前为止,我们已经确定了每个人都会变化的 10 个因素。
我想强调的是,它们都是相互关联的,有时它们甚至可以“融合”在一起,以至于它们甚至可以复合。
此外,每一个都可以是更厚或更薄,并且可能包含“粒子”,或信息,这些信息可能是占主导地位或缺乏。
- 例如,激素因素可能有一个主导的激素(例如血清素,它影响情绪;应对压力的皮质醇;对于兴奋至关重要的多巴胺等)。智力因素可以是更高或更低。
现在想象一下,在人的内部有一个算法不断重新排列因素重要性的顺序,所以有时候可能会出现在前面,有时候在中间,有时候在后面。
- 让我们以生理需求 - 饥饿 为例。如果你把它放在最前面,它将决定哪些信息会达到第二、第三、第四等;输出将取决于这一点。**
换句话说,如果你在饥饿时做出决定,输出可能不会与你有饱腹感时相同。
📌 因素按照重要性排序,在特定时刻最重要的始终位于第一位,然后是第二位,依此类推。
我刚才简要描述的正是人类在特定情况下接收输入信息时的运作方式。
🙋🏽 ♀️ 再次回到开头思考,我解释了为什么全世界的心理学家都渴望一个更简单的人性体验吗?为什么我们这边的人如果像机器学习(ML)一样“复杂”会感到高兴?
- 考虑一下,如果心理因素是所有事情的基础,那么可以解决多少心理问题——以及如果我们能够像在机器学习建模中一样轻松地“调整”或“重置”我们的因素,那么我们周围的其他多少问题可以得到解决。
— 但,你能做些什么来更好地控制你的输出?
记住我上面提到的关于你因素“厚度”的部分吗?好吧,既然你因素的厚度和它们的顺序决定了你的输出(你感受到的情绪、你形成的思想,以及你对信息的反应),了解你可以绝对地增加一些这些因素的厚度以获得优势,并坚定地将它们放在第一位是有用的。
我再通过几个例子来简化这一点:你可能(并且希望)确保自己永远不会感到饥饿。你可以调节你的激素。在治疗中,你可以处理你的恐惧并努力消除它们。你可以调整潜意识中根深蒂固的信念,等等。👉🏼 我们(你)确实可以做到这一点,更多的人没有努力调整他们的因素真是太遗憾了。**
现在,我们就此打住。
直到某种形式的 AI 找到更有效的方法来做这件事,或者代替我们,我们仍将继续像现在这样做出某些决定,感受某些情绪,并采取具体行动。
机器学习方面:模型如何生成输出? | By Marina
当 Dee 谈到带有预训练模式的“人类黑箱”时,我不禁想到这与机器学习过程是多么相似。正如人类有多个相互关联的因素影响他们的决策一样,ML 模型也有它们自己的这种复杂性版本。
那么,什么是机器学习?
这是人工智能的一个子集,它允许机器从过去的数据(或历史数据)中学习,然后在新数据记录上**做出**预测或决策,而不需要为每个可能的情况明确编程**。
话已至此,一些更常见的机器学习“场景”包括:
-
预测或回归(例如,预测房价)
-
分类(例如,对猫和狗的图片进行标记)
-
聚类(例如,通过分析他们的购物习惯来找到客户群体)
-
异常 检测(例如,在欺诈分析中找到交易中的异常值)
或者,用我们人类的日常认知任务来举例说明这些场景,我们也会预测(例如,今天会下雨吗?),分类(例如,那是朋友还是陌生人?),以及检测****异常(例如,冰箱里变质的奶酪)。区别在于我们如何处理这些任务以及我们有哪些****输入或数据(例如,云的存在与晴朗的蓝天)。
因此,数据(及其质量)始终是产生上述场景中高质量模型结果的核心。
数据:核心“输入”
与人类类似,人类从各种来源收集多模态感官输入(例如,YouTube 的视频、收音机传来的音乐、Medium 的博客文章、Excel 表格中的财务记录等),ML 模型依赖于数据,这些数据可以是:
-
结构化(例如,电子表格中的行)
-
半结构化(JSON,XML 文件)
-
非结构化(图像、PDF 文档、自由文本、音频等)
因为数据为机器学习模型产生的每一个洞察力提供燃料,我们(数据专业人士)花费大量时间来准备它——通常占整个机器学习项目努力的 50-70%。
这个准备阶段让机器学习模型尝到了人类自然进行的“过滤和预处理”的味道。
我们寻找异常值,处理缺失值和重复值,移除不必要的输入(特征),或者创建新的特征。
除了上述列出的任务外,我们还可以“调整”数据输入。 ——还记得 Dee 提到的因素是“更厚”或“更薄”吗? ——在机器学习中,我们通过特征 工程和权重 分配实现类似的效果,尽管完全是数学方式。
总结来说,我们正在“组织”数据输入,以便模型可以从干净、高质量的数据中“学习”,从而产生更可靠的模型输出。
建模:训练和测试
虽然人类可以通过有意识的练习学习和调整他们的“因素权重”,正如 Dee 所描述的,但机器学习模型也有类似的结构化学习过程。
当我们的数据处于良好状态时,我们将其输入到机器学习算法中(如神经网络、决策树或集成方法)。
在典型的监督学习设置中,算法会看到标记有正确答案的示例(例如,一千张标记为“猫”或“狗”的图片)。
然后,它调整其内部权重——其“重要性因素”版本——以尽可能准确地匹配(预测)那些标签。换句话说,训练好的模型可能会分配一个概率分数,表示每个新图像是“猫”或“狗”的可能性,基于学习到的模式。
这就是机器学习比人类思维更“直接”的地方:模型的输出来自一个定义明确的加权和输入的总和过程,而人类则围绕多个因素——如激素、潜意识偏见或即时生理需求——进行操作,使得我们的内部过程远不如透明。
因此,模型构建的两个核心阶段是:
-
训练:模型被展示标记好的数据。它“学习”将输入(例如图像特征)与输出(正确的宠物标签)联系起来的模式。
-
测试:我们在新的、未见过的数据上评估模型,以衡量其泛化能力。如果它持续错误地标记某些图像,我们可能会调整参数或收集更多训练示例以提高生成输出的准确性。
由于这一切都回归到数据上,提到建模部分可能还有更多内容是相关的,尤其是如果我们有“不平衡 数据”。
例如:如果训练集有 5,000 张狗图片,但只有 1,000 张猫图片,模型可能会倾向于更频繁地预测狗——除非我们应用特殊 技术来解决“不平衡”。但这将是一个需要全新文章的故事。
提及这一点背后的想法是,对于每个可能的输出(例如“猫”或“狗”)的输入数据集中的示例数量会影响模型训练过程的复杂性和输出准确性。
持续调整和人为因素
然而,尽管看似简单,机器学习流程并不是"fire-and-forget"。
当模型的预测开始偏离轨道(可能是因为新数据改变了场景),我们重新训练和微调系统。
再次,幕后的数据专业人士需要决定如何清理或丰富数据以及重新调整模型参数以提高模型性能指标。
这就是机器学习中的“重新学习”。
这很重要,因为数据或模型中的偏差和错误可能会波及到有缺陷的输出,并产生现实生活中的后果。例如,一个基于有偏见的历史数据的信用评分模型可能会系统地降低某些人口群体的分数,导致贷款或金融机会的不公平拒绝。
从本质上讲,人类仍然驱动着训练机器改进的反馈循环,塑造着机器学习/人工智能模型如何演变和“表现”。
结论
!["当心理学家梦想着有一天能完全理解人类大脑的复杂性,或者数据专业人士梦想着有一天人工智能模型能达到通用人工智能,每个领域仍然保留着其独特的领域。然而,这两个领域之间的对话加深了我们对两者的理解。" [由作者使用 DALL-E 生成的图像]](../Images/e96f63898f4f067eddda4dbdb293ea0c.png)
"当心理学家梦想着有一天能完全理解人类大脑的复杂性,或者数据专业人士梦想着有一天人工智能模型能达到通用人工智能,每个领域仍然保留着其独特的领域。然而,这两个领域之间的对话加深了我们对两者的理解。" [由作者使用 DALL-E 生成的图像]
在这篇文章中,我们探讨了人类如何生成输出,受到至少十个主要交织因素的影响,以及机器学习模型如何通过数据驱动算法产生结果。
尽管机器和人类不通过相同的方式得出结果,但核心思想却惊人地相似。
-
对于人类,这个过程是直观的:我们接收和收集感官输入,并以各种形式存储它们。然后,我们的认知过程结合逻辑、情感、荷尔蒙、过去经验、即时外部输入等,产生行动或行为。正如 Dee 所展示的,这种独特的因素组合创造了我们人类同时具有可预测性和惊喜、理性和情感的能力。
-
对于机器学习或人工智能,其流程是基于数据的。我们提供结构化、半结构化或非结构化数据,存储、清理、标记或丰富它们,用机器学习/人工智能算法对它们进行建模,然后让开发出的模型生成预测、决策或推荐。然而,如上所示,即使是这个看似简单的流程也需要持续的人类监督和适应新场景。
关键区别在于人类心理过程的不可预测性,与机器学习/人工智能模型更可追踪、参数化的本质。
虽然我们大多数人都在思考未来会带来什么——当人工智能达到通用人工智能并可能用其“超人”能力取代我们的工作时会发生什么——Dee 分享了一个关于这个问题的有趣观点:
如果人工智能开始跟随我们的道路呢?—— 发展情感,用冲突或有害的数据充斥其记忆,以某种方式创造一个本我,并变得不可预测。
嗯…你没有料到这一点,对吧?—— 结果不一定是人工智能会超越我们。——也许我们会超越人工智能,这又提出了另一个问题:人类的特征(因素)是否必然进化……?因为也许那将是人工智能的未来。
在此之前,重要的是要认识到人类和机器模型在适当的输入和持续改进过程的意愿下,都可以学习、适应并随时间改变其输出。
我们可以通过选择更好的输入并优化处理方式来提高输出质量——无论是在咨询顾问的引导会议中,还是在机器学习/人工智能的数据和算法设计中。
✨ 感谢您阅读我们的文章!✨
为了获得新的心理学视角,请订阅 Dee 的 文章👇🏼

为了获取数据趋势和技巧,不要错过 Marina 的 文章👇🏼


浙公网安备 33010602011771号