读技术之外:社会联结中的人工智能07情感

读技术之外:社会联结中的人工智能07情感

1. 情感预测

1.1. 通过分析面部特征来准确评估一个人的内部感觉状态的说法,其前提是不稳定的

  • 1.1.1. 没有可靠的证据表明能够从某人的面部特征准确预测其情绪状态

1.2. 对于全世界的军队、企业、情报机构和警察部队来说,自动化情感识别的想法既引人注目又有利可图

  • 1.2.1. 承诺能够可靠地从敌人中过滤朋友,区分谎言和真相,并使用“科学仪器”查看内部世界

1.3. 科技公司已经抓取了含有大量人类表情的面部图像

  • 1.3.1. 数十亿张Instagram自拍、Pinterest肖像、TikTok视频和Flickr照片

  • 1.3.2. 大量图像使得许多事情成为可能,其中之一便是尝试使用机器学习工具,提取内部情绪状态的“隐藏真相”​

  • 1.3.3. 系统已经在塑造人类行为和社会机构的运作方式方面发挥了作用,尽管缺乏实质性的科学证据来证明它们确实有效

1.4. 情感检测旨在通过分析面部数据,来检测情绪并将情绪分类

1.5. 自动化情感检测系统现已被广泛运用,尤其是在招聘方面

  • 1.5.1. Affectiva公司主要采用深度学习技术,对各种与情感相关的应用程序进行编码

  • 1.5.2. 其庞大的情感视频集合,由主要位于开罗的员工手工标记

1.6. 情绪识别系统在人工智能技术、军事优先项目和行为科学(尤其是心理学)的间隙中成长起来

  • 1.6.1. 即存在少数独特且普遍的情感类别,我们会不由自主地将这些情感表现在我们的脸上,并且这些情感可以被机器检测到

2. 西尔万·汤姆金斯

2.1. Silvan Tomkins

2.2. 《情感意象意识》

2.3. 他的理论挑战了行为主义科学和精神分析理论的发展,他认为这两种思想流派将意识视为其他力量的副产品,并为其他力量服

2.4. 人类的意识“一次又一次地受到挑战和削弱,首先是被哥白尼”​(他将人类从宇宙中心移开)​,​“然后是达尔文”​(他的进化论打破了人类的形象从基督教中上帝的形象而来的观点)​,​“尤其是弗洛伊德”​(他将作为我们动机背后驱动力的人类意识和理性去中心化)​

2.5. 最大限度地控制自然和最小限度地控制人性二者中的悖论,是源于人们忽视了意识作为控制机制的作用角色

2.6. 意识几乎没有告诉我们,为什么我们会拥有这样的感受和行为

2.7. 强调人类无法同时识别感觉和情感的表达

2.8. 本能往往与饥饿或口渴等直接的生理需求密切相关

  • 2.8.1. 它们是有用的,饥饿造成的痛苦可以通过食物来缓解

  • 2.8.2. 但是控制人类动机和行为的主要系统是情感,包括积极和消极的情绪

2.9. 与本能不同,情感并不是严格的工具

  • 2.9.1. 他们高度独立于外部刺激和物体,这意味着我们常常不知道为什么我们会感到愤怒、害怕或快乐

2.10. 对情感表现的解释取决于个人、社会和文化因素

  • 2.10.1. 不同社会中面部语言的“方言”不尽相同

  • 2.10.2. 即识别情感和情绪取决于社会和文化背景

  • 2.10.3. 文化方言和基于生物学的通用语言之间的潜在冲突,对面部表情和随后的情感识别模式研究产生了巨大的影响

  • 2.10.4. 对于情感的解释可能不会按照人们的想法进行

3. 面相学

3.1. 从面相学悠久的历史中,我们可以窥见从外部迹象可以可靠地推断出内部状态的想法,即研究一个人的面部特征就可以了解其性格或个性

3.2. 亚里士多德曾相信“可以通过外貌来判断人的性格“

3.3. 面相学也被希腊人当作种族分类的早期形式,可被用于判断“一个人本身的属性,从而将其分为不同的种族,只要种族间的外表和性格不同”

3.4. 面相学在18世纪和19世纪达到了顶峰,当时它被视为解剖科学的一部分

3.5. 情绪是暂时的,甚至是转瞬即逝的东西,但摄影提供了固定、比较和分类表情的能力

  • 3.5.1. 许多面部表情在人类感知的极限之外呈现

4. 捕捉感觉

4.1. 需要收集标准化的图像来进行实验

4.2. 随着该领域研究的规模和复杂性的不断扩展,用于情感识别的照片类型也在不断增加

4.3. 2009年,Affectiva项目在麻省理工学院媒体实验室问世,其目标是在现实生活中捕捉“自然和自发的面部表情”​

5. 保罗·埃克曼

5.1. Paul Ekman

  • 5.1.1. 世界上最著名的人脸阅读者

5.2. 所有人都表现出少量的“普遍情绪”或“情感”​,这些情绪是自然的、先天的、跨文化的,并且在世界各地都是一样的

5.3. 奥卡帕(Okapa)的福尔人与广阔的外部世界隔绝,这使得他们成为其完美的测试对象

5.4. 他没有接受过关于福尔人历史、语言、文化或政治方面的培训

5.5. 如果情感是一组与生俱来的进化反应,那么它们将具有普遍性,并且可以被跨文化识别

5.6. 提供了一组可广泛应用的原则,将复杂性简化并使其易于复制

5.7. 任何人在没有接受特殊训练或缺少慢动作捕捉设备的情况下,都可以在大约一个小时之内学会如何识别微表情

5.8. 埃克曼和弗里森于1978年发布了面部动作编码系统(Facial Action Coding System, FACS)

  • 5.8.1. FACS是一种劳动密集程度极高的测量工具

  • 5.8.2. 一组稳定的、离散的、有限的标签,人类可以使用它对面部照片进行分类,以及一个用于生成测量值的系统

5.9. 他的工作,对测谎软件到计算机视觉的方方面面,都产生了深远而广泛的影响

  • 5.9.1. 电视剧《别对我撒谎》(Lie to Me)

6. 对埃克曼理论的诸多批评

6.1. 玛格丽特·米德

  • 6.1.1. Margaret Mead

  • 6.1.2. 文化人类学家

  • 6.1.3. 最早对埃克曼工作进行批评的人之一

  • 6.1.4. 埃克曼不考虑文化因素,而单纯地认为行为受普遍的、生物学的决定因素影响的观念无法令米德信服

6.2. 在情绪研究领域,研究人员对情绪究竟是什么还没有达成共识

6.3. 许多数据集都是基于演员的模拟情绪状态,是他们面对相机表演出来的

  • 6.3.1. 意味着人工智能系统的训练可能只是为了识别虚假的情感表达

  • 6.3.2. 接受的训练资料不可避免地是人造的

6.4. 即使是在捕捉人们对广告或电影所做的反应时,这些人也知道自己正在被观看,这可能会改变他们的反应

6.5. 难以对面部动作和基本情绪类别之间的联系进行自动化操作导致了一个更大的问题,即情绪是否可以被完全分组为少量的离散类别

6.6. 面部表情几乎不能说明我们最真实的内心状态,任何笑了但未真正感到快乐的人可以确认这一点

  • 6.6.1. 不可能从微笑中推断出幸福,从皱眉中推断出愤怒,或从皱眉中推断出悲伤,对这项技术的应用就像当前的许多技术被错误地认为是科学事实而展开应用一样

6.7. 人们对某些面部运动表达情绪的方式和原理的了解少之又少,尤其缺少足够的细节,以为重要的现实世界中的应用所用

6.8. 一旦承认情绪不容易分类,或者从人类面部表情中无法可靠地探测到情绪,整个行业的有效性就会受到威胁

  • 6.8.1. 在人工智能领域,比起直接进入工程挑战,技术人员更倾向于引用埃克曼作为问题已经解决的标志

  • 6.8.2. 接受不确定性和可变性是既定的—不符合计算机科学的学科方法,也不符合商业技术部门的雄心

  • 6.8.3. 他们的重点一直是提高人工智能系统的准确率,而不是研究关于我们体验、表现和隐藏情绪的复杂方式,以及解决我们如何解释他人面部表情等更重要的问题

6.9. 巴雷特

  • 6.9.1. 情绪是与生俱来的生物类别,因此情绪类别是可识别的而不是由人类思维构建的

7. 面孔政治

7.1. 不应该试图构建更多可将情感表达分配到机器可读类别的系统,而应该就这些类别本身的起源以及它们的社会和政治后果提出更多问题

7.2. 情感识别工具已经被用于部署政治攻击

7.3. 从不具有代表性的训练数据构建“平均值”​,一开始就在认识论层面是可疑的

7.4. 一刀切的“识别”模型并不是识别情绪状态的正确隐喻

7.5. 科技公司很可能在问一个从根本上就存在错误的问题

  • 7.5.1. 都用对情绪的狭隘理解(植根于埃克曼最初的愤怒、快乐、惊讶、厌恶、悲伤和恐惧的分类)来代表人类无限的感受和跨越时空的表达

  • 7.5.2. 将我们带回到在单一分类模式中捕捉世界复杂性的深刻局限性

  • 7.5.3. 让我们回到了我们在机器学习中看到的相同问题:希望将复杂事物冷冰冰地过度简化,以便轻松计算,从而将其打包以供市场使用,并被开发以获取利润

7.6. 人工智能系统正在尝试从我们的肉体中,提取我们情感的、私密的和内在的体验,但结果会是一幅漫画草稿,它无法捕捉到世界上情感体验的细微差别

posted @ 2025-10-12 09:58  躺柒  阅读(23)  评论(0)    收藏  举报