MIT-CMS-595-学习-媒介与技术笔记-全-

MIT CMS.595 学习、媒介与技术笔记(全)

001:人们如何学习——认知负荷理论 🧠

在本节课中,我们将要学习认知负荷理论,这是一种关于人类如何学习的重要理论。我们将探讨人类认知结构的关键组成部分,以及这些组成部分如何影响教学设计的有效性。


课程导入:个人教育技术史

首先,我们进行一个简短的反思练习。请回顾你个人的教育技术使用历史,思考那些对你的学习轨迹产生过积极或消极影响的工具、平台或系统。

以下是具体步骤:

  1. 回想一个对你学习产生积极影响的教育技术经历。
  2. 回想一个对你学习产生消极影响的教育技术经历。
  3. 与身边的同学组成小组,分享你们的经历,讨论大约五分钟。

案例分析:智能白板的启示

在刚才的讨论中,许多同学提到了智能白板。这是一个非常有趣的案例研究。大量资金被投入到这项技术中,但在许多地方,它似乎对学习没有产生任何积极影响。

智能白板失败的原因可能包括:

  • 缺乏配套的教师培训。
  • 没有与课程内容有效整合的教学材料。
  • 教室的基础设施(如灯光)不匹配。
  • 在许多情况下,它仅仅被当作一块昂贵的普通白板使用。

这个案例提醒我们,每一项教育技术的投入都有机会成本。学校花费的每一美元,本可以用于其他可能更有效地改善学习体验的资源上,如课程材料、教师专业发展或艺术用品。技术的有效性高度依赖于其应用的具体情境。


核心理论:人类认知架构

为了理解技术如何影响学习,我们需要先了解人是如何学习的。本节中,我们将探讨认知负荷理论所基于的人类认知架构模型。

请与你的小组合作,绘制一个视觉图表,展示人类认知架构的关键组成部分,并说明这些组成部分如何引出一系列教学原则。


认知架构的关键组件

根据各小组的图表,人类认知架构主要包含两个关键部分:工作记忆和长时记忆。

长时记忆 的特点包括:

  • 容量近乎无限:目前尚未发现人类大脑存储信息的明确上限。
  • 以图式存储:信息被组织成称为“图式”的、有意义的组块。
  • 处于无意识状态:我们无法同时意识到长时记忆中的所有内容。
  • 存在遗忘:信息会随着时间被遗忘,这是学习过程中一个重要因素。

工作记忆 的特点包括:

  • 容量极其有限:在任何给定时间,只能同时处理 3到5个 信息单元。
  • 处理有意识信息:我们当前正在思考、注意或操作的信息都位于工作记忆。
  • 是全人类的共同特征:这是连接地球上所有人的一个认知共性。

在这个模型中,学习 被定义为将工作记忆中的信息存储到长时记忆的过程。记忆 则是将长时记忆中的信息提取到工作记忆的过程。心理学家丹尼尔·威林厄姆有一句名言:“记忆是思考的残留物。”


图式的作用:一个记忆实验

为了理解图式如何工作,我们进行一个简单的实验。

首先,尝试在10秒内记忆并写下这行梵文字符(对于非梵文使用者,这只是一系列无意义的线条):
(此处原为梵文图片,描述为一系列复杂线条)

然后,尝试在10秒内记忆并写下这句英文短语:
Let the entire world be happy.

绝大多数人会发现,记住英文短语要容易得多。这是因为对于英语使用者来说,字母(如 L, E, T)和单词(如 “let”)已经是内化的图式。你可以将整个短语“Let the entire world be happy”作为一个有意义的组块来记忆。而对于梵文字符,由于缺乏图式,你不得不试图记住每一条独立线条的方向和顺序,这迅速超出了工作记忆的容量。

国际象棋大师记忆棋局的能力是另一个经典例子。新手需要记忆每个棋子的独立位置,而大师则将整个棋局识别为熟悉的战术模式(如“土耳其舰队弃兵”),这是一个复杂的图式。


教学启示:基于认知负荷理论的原则

基于对人类认知架构,特别是工作记忆有限性的理解,认知负荷理论提出了一系列教学原则,旨在优化学习过程,避免认知超载。

以下是认知负荷理论倡导的一些有效教学策略:

  • 示例效应:向新手展示完整的问题解决步骤(例题),比让他们直接尝试解决开放性问题更有效。
  • 补全问题效应:提供部分完成的解决方案,让学习者补全剩余部分,这比解决全新问题负担更小。
  • 模态效应:用口语解释搭配视觉信息(如图表),比用书面文本搭配同样的视觉信息学习效果更好。这是因为听觉和视觉通道在工作记忆中似乎是分开处理的。
  • 空间邻近原则:将相关的文字说明和图片在空间上紧密排列,而不是分开,可以减少寻找关联的认知负荷。

需要注意的是,这些原则对新手效果最显著。对于某个领域的专家,开放性问题解决和探索性学习可能更有效,这被称为“专家反转效应”。因为专家的相关图式已经建立,工作记忆有足够的空间进行更复杂的操作。


理论的边界与演变

我们阅读的迈克尔·珀尚的文章标题是《不是万有理论》,这提醒我们认知负荷理论的适用范围和局限性。

认知负荷理论主要关注认知过程,特别是工作记忆的瓶颈。它并不直接解决动机、情感或社会文化背景等问题。对于一位教师而言,学生缺乏学习动机可能是比认知超载更紧迫的挑战。因此,不同的学习理论(如下节课要讲的“情境学习理论”)会从其他角度切入。

此外,理论本身也在发展。例如,“相关认知负荷”这个概念曾被认为是促进图式构建的“好”负荷,但后续研究发现难以精确测量和应用,因此当前的研究中已较少强调。这说明了科学理论是在不断检验和修正中演进的。


课程总结与作业预告

本节课中,我们一起学习了认知负荷理论的核心内容。我们了解了人类认知架构中工作记忆的有限性是关键瓶颈,学习是将信息从工作记忆存储到长时记忆的过程,而图式是组织复杂信息、提升思维效率的关键。

基于此,认知负荷理论提出了一系列旨在减少“外在认知负荷”、优化学习过程的教学设计原则,如示例效应和模态效应。

现在,你已经掌握了完成第一次作业所需的一半知识。作业要求是:

  1. 选择一项教育技术。
  2. 分析它是更偏向于“讲授主义”(如认知负荷理论)还是“建构主义”(如下节课的情境学习理论)。
  3. 重新想象并描述,如果从相反的哲学视角来设计这项技术,它会是什么样子。

下节课,我们将学习另一种重要的学习理论——情境学习理论,它将为我们提供理解学习的另一个有力视角。

002:情境学习

在本节课中,我们将深入探讨“情境学习”这一核心学习理论。我们将通过对比“认知负荷理论”,分析婴儿的学习方式,并结合具体案例(如Logo编程语言和助产士学徒制),来理解情境学习的原则、方法及其在教育中的应用。

课程概述

上一节我们介绍了认知负荷理论,它强调通过精心设计的直接教学来优化工作记忆的负荷。本节中,我们来看看与之形成对比的“情境学习”理论。情境学习认为,学习本质上是一个社会性的、参与性的过程,是在特定社群实践中“成为其中一员”的过程,而非仅仅是知识的内部化。

婴儿的学习:对认知负荷理论的挑战

首先,让我们思考一个现象:婴儿在生命最初几年的学习速度和总量是惊人的。他们几乎每天都在掌握新技能,从语言到运动,学习速率远超成年人。

如果认知负荷理论是正确的,即学习需要避免工作记忆过载并依赖已有的长时记忆图式,那么婴儿的学习几乎不可能发生。因为对他们而言,周围环境中的一切都是全新的、离散的“外在认知负荷”,他们几乎没有长时记忆可以调用。然而,现实是婴儿的学习效率极高。

这与情境学习的观点产生了共鸣。婴儿的学习环境通常是开放式的、基于玩耍和探索的,充满了试错和社会互动,而不是结构化的“工作样例”教学。这种学习是自然的、充满乐趣的,并且深深植根于他们的日常活动和社交关系中。

情境学习的核心:从边缘性参与到完全参与

情境学习理论的代表人物让·莱夫和埃蒂安·温格提出了“合法的边缘性参与”这一核心概念。学习被看作是一个新手从实践共同体的边缘逐渐向中心移动,最终成为完全参与者的过程。

以下是这一过程的几个关键特征:

  • 在实践中学习:学习发生在日常实践活动中,而非脱离情境的正式教学中。例如,助产士的女儿通过观察、跑腿、辅助按摩,自然而然地掌握了技能。
  • 身份形成:学习知识与形成特定社群成员的身份是同一过程。你通过学习成为“物理学家”、“程序员”或“舞台管理员”。
  • 社会性与动机:学习动力来自于成为社群一员的渴望,以及实践本身的意义。这与认知负荷理论中“克服困难”的叙事不同,更强调学习的自然愉悦和社会满足感。

案例研究:Logo编程与学徒制

为了更具体地理解情境学习,我们来看两个例子。

1. Logo编程语言
西摩·派珀特开发的Logo语言旨在让孩子们“用数学说话”。学生通过控制屏幕上的“海龟”绘图来学习几何和编程概念。学习过程是项目式的、充满玩耍和探索的。学生从制作简单图形开始,逐步组合成复杂作品(如一条鱼及其游动动画)。在这个过程中,学习是自我驱动的,计算机提供即时反馈,同伴之间相互教学,知识在有意义的创造情境中被掌握。

2. 尤卡坦玛雅助产士
人类学家布里吉特·乔丹的研究描述了玛雅助产士的学徒制。年轻女孩并非通过上课成为助产士,而是从小生活在助产士(通常是母亲或祖母)身边。她们通过观察、聆听故事、传递消息、准备用品等“边缘性”工作,逐渐吸收相关知识。直到自己生育后,才开始承担更核心的任务,如为产妇提供支持甚至进行产前按摩。整个过程中,正式的“教学”很少,学习完全融入生活与实践社群。

情境学习的原则与教学启示

基于上述理论,我们可以总结出情境学习倡导的一些教学原则,常被概括为“4P”:

  • 项目:学习应围绕有意义的、开放式的项目展开,让学生制作或创作真实的事物。
  • 热情:学习应与学习者的兴趣和热情相连,允许他们追随自己关心的领域。
  • 玩耍:学习环境应鼓励探索、实验和冒险,容忍失败,保持轻松的氛围。
  • 同伴:学习本质上是社会性的,应在实践共同体中通过与同伴和“老师傅”的互动进行。

从教学角度看,这意味着应尽早让学生“玩整个游戏”(如T-ball棒球),在真实或模拟的实践情境中学习,并重视学习社群的建设。

与认知负荷理论的比较与融合

虽然情境学习与认知负荷理论看似对立,但它们都致力于培养“专家”,即具备精通、身份认同和创造力的个体。分歧主要在于路径:

  • 认知负荷理论倾向于“精通优先”:先通过结构化教学掌握基础知识和技能(精通),进而建立身份认同,最终实现创造性应用。
  • 情境学习倾向于“创造力/身份优先”:先通过参与实践和玩耍激发兴趣、建立身份认同,从而产生掌握必要知识和技能的内在动机。

在实际教育中,很少有课程完全采用单一路径。例如,MIT的一些工程课程可能先让学生建造一个粗糙的机器人(情境/创造),再驱动他们去学习枯燥的控制系统理论(精通);而生物导论课则可能先从细胞基础知识(精通)教起。有效的教学往往需要根据学习内容的复杂度和学习目标,灵活融合两种理念。

总结

本节课我们一起学习了情境学习理论。我们了解到,学习不仅仅是信息的摄入,更是一个在社会文化实践中构建身份、从边缘参与到核心参与的过程。通过分析婴儿的学习、Logo编程和传统学徒制,我们看到了基于项目、热情、玩耍和同伴的学习方式的强大力量。尽管与认知负荷理论路径不同,但两者都指向培养真正的专家。理解这些理论,能帮助我们在设计学习体验时,更好地平衡知识传递、动机激发和社群构建。

003:07. 互联网时代前的教育科技

在本节课中,我们将通过一个课堂练习,深入探讨在互联网时代之前,如电影、广播和电视等技术进入学校时所面临的复杂情况。我们将学习如何识别和分析影响技术实施的各种利益相关者及其动机。


为了参与接下来的练习,你需要从桌上拿一张索引卡,每张卡对应一种特定的技术。

看起来电影、广播和电视是剩下的选项。你将加入小组,并围绕这些技术展开工作。

以下是需要你做的事情。找到持有相同卡片的人,讨论你们从阅读材料中学到的内容。

任何让你印象深刻或想到的内容都可以讨论。然后,我希望你们制作一个图表,可以在白板或那边的蓝色纸上完成,主要捕捉三个核心想法。

首先,列出所有参与实施这项技术的利益相关者。

我认为拉里·库班做得特别出色的一点是,他让你感受到一项技术进入学校的过程中,所有经手的不同角色,以及技术在学校里时,所有与之互动的不同角色。这对于理解技术在实际中如何被使用至关重要,很多时候这与经典的设计模型不同。

我认为这在软件工程等课程中有所体现,比如那种认为存在一个程序员和一个用户的观念,用户就像是坐在键盘前、手指放在键盘上的一个人,这是你需要关注的对象。而在学校中,这种“设计者与用户”的两部分模型完全失效。

在学校里,有许多非常不同的人都可以被视为技术的用户。

拉里·库班另一个做得非常好的地方是,他帮助我们关注这些人拥有我称之为“不同利益”的东西。这里的“利益”不是指好奇心,而是指激励、利害关系,类似于政治学家使用“利益”一词的方式。

所有这些不同的利益相关者会因不同的事情获得回报。

他们也有我们称之为“无利益”或“负激励”的东西。

他们也在试图避免某些事情,或者会因为不同的事情受到惩罚。

因此,对于你选择并与同事讨论的技术,请思考所有你认为可以被视为该技术实施利益相关者的不同人群。

然后,为每个利益相关者想出他们的一些“利益”和一些“无利益”或“负激励”,或者会惩罚他们的事情。

这个练习的大致思路清楚了吗?我们共同尝试做的事情是,我们想要围绕这些技术重建当时的世界。

这就是拉里·库班如此出色的地方,他说,是的,一台电视机会被推进来,但它会被推进一个教室、一所学校和一个社区。而那里有所有这些人参与其中。这就是我们真正要理解的东西。

在我让你们开始之前,我要告诉你们的最后一件事是,拉里·库班本人有着非常迷人的历史。

他在20世纪50年代和60年代是一名社会研究教师,然后是一名校长,后来是一名督学。他实际上是弗吉尼亚州阿灵顿的督学,那是我妻子上学的地方。所以当我妻子还是小学生时,当时的督学就是拉里·库班。阿灵顿,弗吉尼亚。费尔法克斯,差不多。

是的。直到他作为一名教师、校长和督学度过了相当杰出的职业生涯后,他才去了斯坦福大学,获得了博士学位,成为教育历史学家,最终成为那里的教育史教授。

所以他是一个博览群书的人,我相信你们已经有所体会。但他也深刻理解使学校运转以及使学校里的人运转的种种因素。

这个练习清楚了吗?找到持有你卡片的人,移动你们的位置,在白板或这些蓝色纸上制作这个小图表。准备开始。


这些因素尤其重要。比如,教学实际发生在哪里?那里有某个需要上厕所、需要吃饭的人。我的意思是,这里有一个比电影更核心的例子,是关于电视的,他们发现人们在下午比在上午更可能使用电视。这完全与生物和文化有关,比如我们的大脑在上午工作得更好,到了下午我们都有点疲惫,诸如此类。

所以,是的,我认为任何构建技术的人都必须思考,比如,教师一天中的变化是什么?他们什么时候精力更充沛或更不充沛?技术如何适应这些周期?这些问题与我们拥有的考试成绩目标或其他任何事情一样真实。


这真的很好,这真的很好,再花几分钟,再花几分钟。我们正在思考他对学校的利益。当然,所以如果你是一所学校,什么会让你觉得……我不确定我是否想用电影做任何事情。那是1913年。无声电影大约在世纪之交开始认真出现,有少数人,其中最著名的是托马斯·爱迪生。

这个人发明了电灯泡,他站在国会面前说,你知道,首先在1913年。他说,我的意思是,我会读另一段引文。他说,十年内,教科书将被电影胶片取代。这就是这项新技术的强大之处。如果你是一名校长,什么会让你觉得……你挺聪明的,托马斯,但我不太确定这个。也许他们刚刚在教科书上投入了一大笔钱。

当然,是的,他们围绕现有技术建立了完整的基础设施。他们有墙上的书架。他们有装满书籍的图书馆。他们的每一位教师都接受过使用教科书教学的培训,而当这些技术首次引入时,他们的教师中没有一个人曾经作为学生通过电影学习过。

所以系统中存在着巨大的、固有的保守主义。这可能是一个原因。还有什么其他原因呢?

哦,好的,关键。是的,我的意思是,我想补充一点,但比如将其整合到课堂环境中,他们甚至……对于电影,整合的挑战是什么?你需要将什么技术放入教室或移动?对于电影,一些技术可能是什么?我的意思是,我不认为当时的投影仪……教室里的投影仪,它们足够便携,但它们是笨重的大型机器,房间……假设你经历了人口大幅增长。

所以有人在19世纪50年代建了一所学校,当时是每间教室12个孩子,现在你要放18个孩子进去。教室里没有空间来物理移动这台机器,这是一个完全合理的理由。

对于电影作为一种技术能够被实施,你还需要什么其他东西?所以你需要一台巨大的投影仪。你得把它放在轮子上。你还需要什么?一个实际投影的地方。好的。你得去所有的教室,在房间前面安装屏幕。这不是最大的挑战,但也不是免费的。谁来做这些事情?电影也存储在这些巨大的卷轴上,不只是像选择你的YouTube频道然后播放那样。在你的建筑里,你打算在哪里存放一个电影胶片库?谁来组织这些电影胶片库?如果你有四所小学,假设有四个一年级班级,你会买四份这部电影吗?这样每个人都可以同时观看。如果不,你打算如何物理组织和移动这个巨大的卷轴从一个地方到另一个地方?你可以想象校长会想,所有这些事情都要花钱。

所以这些都是托马斯·爱迪生没有考虑到的各种成本。他说你将通过这个东西获得100%高效的学习,这是潜在的收益。但没有人有任何证据,因为它还没有发生。你必须思考,所有这些成本是什么?所有这些物质上的变化是什么?是的,所以想想你如何阐述其中的一些事情。但是,当你真正做这个练习时,你必须思考,这项技术到底是什么?甚至物理上,它需要什么?你需要买多少这些东西?它们成本多少?所有这类事情。它们的可重用性如何?


好的,这真的很好。我们在这里休息一下怎么样。请回到你们原来的座位坐下。我认为每个人都写得足够广泛,我们从远处也能看到。

但是,是的,真的很好,真的很好。现在我需要为我找一个位置。每个人最后的笔记。是的,是的。现在是你们添加最后几笔的机会。好的,那么最少有多少利益相关者?这些人列出了最长的清单,他们是赢家。让我们大声读出来。管理员、家长、教师、学生、公司、制造商、教育科技投资者、开发者、政策制定者。很好。

作为一个起点,我的意思是,这里还出现了一些其他的,比如制片厂、广播公司、联邦通信委员会,不同的心理学家。是的,有很多人在这些决策中有利害关系。它们是复杂的、涉及多人的决策。这是一个好的开始。

让我读一下。考虑到这些事情如此复杂,为什么人们还对它们如此热情?让我们问问托马斯·爱迪生。托马斯·爱迪生对此有什么看法?

我相信电影注定要彻底改变我们的教育体系。在几年内,它将在很大程度上,即使不完全,取代教科书的使用。我应该说,平均而言,我们从今天的教科书中只获得了大约2%的效率。

你们在笑。你们在笑什么?托马斯·爱迪生在这里胡说八道。他说的2%毫无意义。他擅长电灯泡。在这方面可能没那么擅长。

未来的教育,正如我所见,将通过电影媒介进行,在那里应该有可能获得100%的效率。——托马斯·爱迪生,1922年。

你们会读到托马斯·爱迪生的其他一些引文,其中一段在《未能颠覆》这本书里。但在1913年,他站在国会面前说,十年内,教科书将完全被电影胶片取代,然后十年后的1923年,他又回去说,二十年内,教科书将完全被电影胶片取代。

我认为你今天可以找到许多类似的论点。我认为你很容易找到人告诉你,老式技术只有2%的效率,但新技术将是100%的效率。这就是承诺。

承诺是,如果我们考虑实施所有这些不同的技术,我们可以做得比现在好得多。

因此,你可以形成的一个直觉是,这是一个持续了一个世纪的事业。在过去的110年里,人们一直在思考如何将模拟技术,最终是数字技术,带入学校以改善学习。有数百万人在教育领域工作,其中许多人非常聪明。

从早期开始,你们读了一点关于个人电脑的内容,大约从70年代和80年代开始,比如Apple II Plus,这是我成长过程中使用的那一代电脑。但那实际上是从人们建造房间大小的计算机开始,大约20年后的事情。计算机科学家、教育工作者、学习科学家合作,试图找出是否有一些方法可以使用计算机来教人。

所以,仅仅计算,甚至不包括所有这些其他广播、电影等东西,计算本身就是一项长达70年的、试图改善学校的事业。在70年里,我们尝试并学到了很多东西。

因此,我希望你们从这门课中带走的一个直觉是,当你们思考任何形式或类型的教育技术问题,无论是设计问题、实施问题还是政策问题时,你们都应该想,我们以前可能做过类似的事情。没有什么东西是如此新颖、如此完全不同,以至于没有类似的例子可以帮助我们思考这些挑战。

让我们思考其中一些利益相关者,哪些利益相关者似乎出现在几乎所有列表中?谁似乎是普遍存在的利益相关者?教师。

让我们从他们开始,因为他们是最好的。我,我爱教师。我,我的意思是,我从事现在工作的原因之一就是我认为教师很棒。

什么事情会让教师兴奋?如果你想让教师使用教育技术,对他们来说真正重要的、感受到的需求是什么?这个可能在这些技术中相当一致,但我们也可以看看是否有差异。

减轻他们的工作量。好的,很好,我喜欢。减轻工作量。

为什么这对教师如此重要?他们有太多事情要做。这些人不是那种花大量时间坐着等电话响的人。在美国,教师的工作量在某些方面实际上比其他可比的经合组织国家要高得多。

所以,比如经济合作与发展组织,大约30或40个富裕国家。与我们在其他国家的同事相比,美国教师花在直接面对学生教学上的时间比许多其他地方都多。世界上许多其他国家,比如一个全职的有执照的教师会有更多的协作规划时间、更多的评分时间等等。

因此,与世界各地的同事相比,美国教师在拥有时间方面本来就落后。减轻工作量是他们关心的事情。他们还关心什么?比如它必须能激发兴趣。他们不希望孩子们感到无聊。

所以,他们的核心利益之一是,我如何让这些人保持动力?我如何让他们持续学习?他们还关心什么?关于实际高质量。好的,所以,学习效果提升、质量高非常重要。

教师非常认真地对待他们的专业性,并以各种方式被问责,这可能因不同类型的教师而异。所以在美国,我们主要以某些方式进行测试,我们测试的方式比其他国家多得多。没有哪个国家像我们这样每年测试所有学生三年级、八年级的阅读和数学。大多数其他国家是,如果你在三年级测试他们,你可能会等几年再测试,我的意思是,你给他们评估或考试之类的,但不会给他们像这样的大型全国性测试。因此,如果你是阅读或数学教师,你的考试成绩会受到仔细审查,而科学教师、艺术教师、健康教师等其他类型的教师则不会受到同样的审查。所以,即使在同一个国家,也可能存在不同的激励。

我作为一名历史教师总是喜欢的一点是,从来没有真正的考试让我以同样的方式为学生准备。我在私立学校,但即使是我的数学教师同事也觉得他们在为学生准备SAT、AP考试等。那从来不是我的关注点。因此,我花更少的时间思考,我带进教室的这个新东西是否会为某种近乎普遍的考试体验做准备,而我的数学教师同事总是不得不考虑这一点。我可以想,嗯,藏传佛教不在考试范围内,但它很棒,我们来学习它。所以,那是不同的。好的,其他种类的事情。是的,然后是萨布丽娜,可及性和包容性。

所以,比如,你多样化的群体中没有人被任何技术排除在外,是的。

这几十年来,这并不是一个普遍关注的问题。在30年代、40年代和50年代,人们更普遍地认为某些人有完全无法解决的学习障碍,社会应该以其他方式照顾他们的福利。然后在20世纪中叶,我们通过了《美国残疾人法案》,这彻底改变了我们的想法,事实上,为人们获得公平和适当的公共教育创造了联邦权利。

我还要说,随着社会总体上对包容性价值观越来越感兴趣,人们在20世纪80年代对个人电脑的包容性担忧,与现在他们对学生面前的电脑的担忧是非常不同的。这是一个很好的点。什么时候……能够跟踪学生进度。跟踪进度。评估。好的,是的,实际上有趣的是,在这个世纪里,一些最早的技术与此无关,比如广播和电影,但你们读到的最早的技术之一是物理教学机器,希望你们……我的意思是你们看到了一些图片。我今天刚看到,悉尼·普雷西是奥黛丽·沃特斯写到的人之一,有人在YouTube上发布了他演示其中一台教学机器的精彩两分钟片段,不幸的是,那个账户在今年课程开始前被删除了,也许我稍后会给你们发一个版本。唯一仍然存在的视频版本是一个叠加了非奥古瓦尔声音的视频。所以有人拿了一段非奥古瓦尔谈论edX能力的音频,在悉尼·普雷西演示教学机器时播放了音频,尽管相隔一个世纪,但这让人感到有点过于接近。但教学机器,它们有点像打字机,上面有四个按键。

所以它们一次显示一个问题。那是前扫描仪技术,然后会有四个可能的答案之一。这是最早的版本之一。它们后面有一个小薄荷糖库。所以当你按下正确的按钮时,会滚出一颗小糖果之类的东西,给你一种行为主义的积极强化。但是,它的主要优点之一是,哦,如果我们能让足够多的人拥有这些东西,那么我们几乎可以持续评估他们的进度,我们会确切知道他们在哪里。所以这个跟踪学生进度的想法,在我们这个数据驱动的世界里是特别迫切关注的事情,但在一个世纪前人们就已经感兴趣了。

教师的一些“负激励”是什么?如果你试图让教师采用新技术,哪些事情会成为他们的障碍?复杂性,为什么复杂性?有很多……有些教师更能适应新技术,而有些教师就是无法理解某些东西如何工作。

是的,所以,我认为能力是对的。我也认为,如果你从事教学,可能有两件事真正驱动你:一是你热爱你教的内容,这对中学教育者比早期小学教育者更适用,但可能两者都有一些。你可能热爱人。如果你不觉得人,尤其是年轻人,很有吸引力,就很难成为一名教师。那些觉得人有吸引力的人,可能只是觉得技术不那么有吸引力。他们不想一生都坐在电脑前打字。他们肯定想与人互动。

但我要说的另一件事是,许多教育工作者花了很多时间打磨他们的技艺,并且擅长他们现在教学的方式,以及过去十年的教学方式。因此,当他们看到一项新技术进来时,他们会想,这个东西真的会比我已经做了很久并且擅长的事情更好吗?当我整合这个新东西时,我将不得不失去什么?任何技术的采用都涉及损失。任何改变都涉及损失,你必须放弃一些东西。放弃的东西可能相当不错。我认为很多人认为年长的教师因为技术不熟练而不太可能采用技术,但与许多教师合作后,我确信年龄与技术采用之间没有关系。有对技术超级感兴趣的年轻教师,也有讨厌它的年轻教师。有年长的教师认为我对我所做的事情很在行,也有年长的教师之所以年长,是因为他们在过去20年里一直在尝试新事物,尝试变得更好。萨布丽娜,你的一个负激励是,学生分心。很好。

显然,其中一些技术比其他技术更容易导致分心。比如,如果你播放电影胶片之类的东西,你可能会吸引孩子的注意力,但当然,当我们进入计算机领域,任何需要每个学生负责自己注意力的东西都可能引起教师的担忧,因为孩子们喜欢关注各种事情。

还有什么会是负激励?比如教师被取代的感觉?他们觉得自己的工作被替代了?

嗯。所以教师是一个职业。你知道,这个职业通过执照等保护他们的工作安全,就像许多其他职业一样,比如医生、药剂师、律师等。是的,大多数专业人士对有可能取代他们职能的技术并不十分热情。好的。

让我们思考其他一些利益相关者。所以,这又是一个好的点。所以,再次,我们可以思考任何时候引入一项新技术。它会减轻工作量吗?它会激发兴趣吗?在这项新技术引入的前三周,它会激发兴趣吗?在这项技术引入两年后,它还会激发兴趣吗?它会高质量吗?我对质量有控制权吗?可及性和包容性。它会改善学习吗?它能够跟踪评估吗?它太复杂吗?它会让学生分心吗?它会取代我执行的基本职能吗?这是一组很好的问题,拉里·库班在某种程度上对广播、电影、电视、教学机器和计算机提出了这些问题,你也可以对人工智能、可汗学院、iCivics以及任何其他出现的东西提出这些问题。这些问题仍然是好问题。

现在让我们尝试触及其他一些利益相关者。哪些利益相关者让你感到惊讶?哪些是你觉得,在教育技术方面我不会想到的?奇怪的或独特的。

我的意思是,我的小组是教学机器,我们想到了提出这些技术背后理念的心理学家。比如,我从来没有真正想过,哦,你知道,是那些提出建构主义、情境学习等理念的人,然后激发了其他一切的兴趣。所以,人们有关于好的教学和学习应该是什么样的想法,这些想法在某种程度上似乎是普遍的,因为我们可以追溯到历史中找到它们,但它们总是被重新解释、更新。悉尼·普雷西处在一个行为主义是一套非常突出的思想的时刻。行为主义你们可能都很熟悉,当人们做错事时你惩罚他们,做对时奖励他们,通过这种方式调节他们的行为。所以他创造了一台体现这些思想的物理机器。然后西摩·佩珀特会出现并说,哦,为什么我们不能像去法国访问的孩子学习法语那样学习数学?为什么我们不能创造一个像数学乐园一样的东西?Logo可以是数学乐园。他有一套关于好的教学和学习应该是什么样的想法,并将这些想法融入其中。人们成为这些思想的拥护者。今天美国教育技术领域最突出的拥护者可能是萨尔·可汗,他对个性化学习有着非常具体的想法。我不知道你们是否知道他的个人经历,但他曾是对冲基金人士之类的,他的侄女在数学上遇到困难,他开始辅导他的侄女数学,并通过视频进行,所以他把视频放在网上,人们开始观看。他想,哇,如果每个人都能有这样一个个性化的导师会怎样?如果每个人都能按照自己的节奏学习数学会怎样?然后他建立了整个企业,并且现在仍然对人工智能非常热情,因为,哦,与其只是我为每个人录制一个导师视频,不如让AI为每个个体生成个性化的文本。这些想法,你知道,它们不是凭空出现的,有人倡导它们。你们都看到《纽约时报》或《华盛顿邮报》,有人写了一篇关于萨尔·可汗和人工智能的专栏文章。要么是在《华盛顿邮报》,要么是在《纽约时报》,但基本上是一篇庆祝性的文章,关于可汗学院。所以,这是一个不寻常的群体。今天,比如萨尔·可汗上《今日秀》告诉人们他的想法,他去投资者会议告诉人们他的想法,他每隔几年就被哈佛和麻省理工请来等等。所以这些人倡导他们的想法。想法不是从天上掉下来的。有一个利益相关者在推进这些想法。

还有哪些利益相关者看起来很重要?

我认为很奇怪的是,你可以想到像制造商和生产晶体管的人,比如台积电和ASML,因为美国各地的学校突然需要成千上万的iPad,并且有大量的积压订单,或者现在流行的任何东西,然后像台积电这样唯一真正生产晶体管的人就有了巨大的需求和很多钱。这些人然后组织成贸易团体,他们去……他们如何推进自己的利益?他们做一些事情,比如免费赠送一些材料给学校做演示,他们为他们的材料创建培训项目并分享,他们有销售和营销人员四处走动让人们对此产生兴趣,他们赞助会议,也许他们甚至不直接做广告,只是……他们的存在试图鼓励教师和其他团体支持它。我们每年在美国教育上花费巨额资金,其中最大的一部分用于支付工作人员的工资,另一大块用于供暖和空调,有人卖这些东西,但基本上,除了这两项之外,第三大块是我们为帮助人们学习而在学校购买的东西。所以,是的,有倡导者,你知道,这些人在这类事情上并非中立。苹果公司过去几年在这方面特别突出,试图塑造自己作为一家在学院、大学、学校内部具有特定作用的公司的形象。

我认为让我惊讶但也许并不那么令人惊讶的是,比如政府,政府测试等等,以及政府之间的竞争,因为上学期我们上的教育课,我们讨论了很多美国主义以及它与教育的联系,我知道这是一件大事,比如,哦,这个国家平均分数最高,也许是通过可汗学院之类的,所以有时真的只是政府之间相互竞争,试图看看谁是最好的。

很好,在美国,当我们谈论政府行为者时,我们可能想到的所有不同的政府行为者有哪些?所以有美国教育部。还有谁?所以有地方教育委员会。

美国教育部一个非常不寻常的事情是,美国教育系统极其分散,有13万所学校,1.3万个学区。在美国,最常见的民选官员是学校董事会成员。如果你是美国民选官员,你最有可能成为的就是学校董事会成员。学校董事会成员是有趣的利益相关者,他们在社区中……在许多社区,他们只是对教育特别感兴趣的社区成员,但他们也是那些……你知道,这是对政治生涯感兴趣的人的切入点。很多人从学校董事会成员成为州议员等等。这是一个特别……的时刻,对于那些有政治野心的人来说,尤其是美国右翼,学校改革已经成为在党内获得关注的一种方式。是的,全国各地有各种各样的城镇,你知道,我认为你们从阅读中得到一些,比如某个学校董事会认为,电影胶片会很棒,让我们大力推广电影胶片,或者闭路电视会很棒,拥有它会很有用。所以,甚至不是教师,不是督学,不是学校里的人,而是一些社区成员说,我们来做吧。

是的,你知道,在美国今天,可能有两种版本。肯定有一些学校董事会的身份是围绕成为一所尖端学校而形成的,比如在波士顿周围许多富裕的郊区城镇,比如韦尔斯利、牛顿,他们希望被认为是拥有真正优秀、尖端、前瞻性思维的学校。你知道,牛顿在他们建的上一所高中上花了2亿美元左右。所以,成为学校董事会成员的一种方式是,我要帮助学校系统现代化并拥抱技术等等。也可能相反。也可能有人进来,最常见的是在技术行业工作的人,他们说,你们不知道这些技术中内置了多少监控。每次我与校长或督学交谈时,他们都说,我们很难帮助家长理解这些东西为什么有用。比如,一个为谷歌或微软工作的人,知道这些工具的监控能力并对此感到担忧。

是的,我有个小轶事。我过去在教育出版业工作,主要做佛罗里达州的产品,这真的显示了这些学区有多大的权力,因为学校董事会会做出决定,比如佛罗里达州的一两个学区几次要求某个东西,这就会改变一个全国性产品的整个路线图。所以,就像佛罗里达州的几个人说,我们真的需要这个东西,然后阿肯色州的孩子们也以不同的方式学习。这绝对仍然是真的,由于网络出版和定制出版的能力,这种情况正在逐渐改变,但在20世纪后半叶的大部分时间和21世纪的前十年,出版商出版一本美国历史书时,他们如何决定内容?他们会说,哪些州是销售这本历史书最重要的州?佛罗里达是其中之一。其他还有哪些?你能说出它们,加利福尼亚、德克萨斯、纽约。加利福尼亚、德克萨斯、纽约、佛罗里达,这四个州仅凭人口就是最重要的州。所以现在你必须思考,每个州都有标准,这四个州的历史标准比缅因州和北达科他州的历史标准更重要。当历史上出现政治问题时,这种情况经常发生,在数学、阅读和其他方面也是如此。实际上,我曾经为历史教科书出版商做咨询,有一次我看到一个矩阵,列是所有可能的主题,行是所有州,标着X表示哪些主题被覆盖。另一件事是,比如,一大群波兰移民来到某个州,他们在教科书中看不到波兰人的代表,所以他们就会说,我们只采用那些谈论波兰裔美国人在历史中的重要性的书。出版公司说,好吧,加入波兰部分。然后意大利人也这样做,柬埔寨人也这样做,每个人都这样做,这就是为什么当你拿起你那本800页的历史教科书时,里面充满了所有这些奇怪的小片段。所以,是的,这些州级的影响,这里还有一个小特点但最终变得重要。有些州,主要在南部,教材采用是集中进行的,或者有某种集中功能。比如德克萨斯、佛罗里达,他们有州级委员会,规定只能采用通过这些委员会审核的书籍。马萨诸塞州是一个高度地方控制的州。如果州政府试图告诉马萨诸塞州的学区可以使用哪些教科书,学区的反应会很激烈,他们会说,再来一场革命,我们要从陆地到海洋,或者类似的话。他们就是不允许。但这意味着,那些有这种集中功能的州实际上对出版商有更大的影响力,因为他们说,看,你想在这里卖书。现在不仅仅是书,现在是网络程序之类的。现在正在打破这种垄断,虽然也带来一些问题的是,你知道,州可以说,好吧,我们要通过所有这些法律,效果是大幅减少黑人历史的教学,出版商可以说,好吧,你们的网络版本我们会删除这个、这个和这个,但在纽约或加利福尼亚等自由派州,你们可以保留所有那些内容。是的,有点像那个,平台在这些地方扮演着重要角色。以我自己的国家为例,每所公立学校都有一个扬声器系统,在一天开始时特别用来播放国歌,这是他们真正希望孩子们做的事情。就像,哦,有这么多技术。就这一件事。为什么这是唯一的……有某种激励去建造,比如,你知道,某种政治性的东西。然后这个广播系统在一天的其他时间也被使用吗?还是只在开学时使用?国歌之后,有些孩子,每个班级,他们会做一些村庄事务。一些阿拉伯诗歌,一些有趣的事实,不只是……我太喜欢这个了。我认为这是一个极好的例子。所以无论州政府是什么样,国家政府说每所学校必须每天播放国歌,那么这个国家的每一所学校都必须建立一个技术基础设施来实现这一点。然后,一旦这个技术基础设施存在,它也可以以其他方式被使用,或者不被使用,等等。你可以在其他国家找到类似的例子。目前教育政策制定者最感兴趣的国家之一是爱沙尼亚。大约每十年,某个人们不太关注的国家在国际考试中取得非常好的成绩。新加坡曾是这样一段时间,芬兰曾是这样一段时间,人们一度对芬兰着迷,而爱沙尼亚是最近的一个,人们会想,你们是谁?为什么你们阅读这么厉害?爱沙尼亚有时被称为“e-爱沙尼亚”。他们的政府以一种非常集中的方式真正拥抱了互联网。所以人们正在观察和思考教育技术在爱沙尼亚和其他地方是如何被采用的。但这不仅仅是一项针对学校的政策,他们想,我们要通过提供非常好的数字政府服务将爱沙尼亚置于地图上。而这个国家政策决策最终以各种方式影响学校孩子们的学习体验。是的,这是一个很好的例子。

学生,学生的利益和负激励是什么?一项技术的新颖性。好的,所以我们几乎所有人都喜欢新奇。这是技术的一个优势,尽管新奇的一个惊人之处在于它消退的速度快得惊人。我前几天在Reddit上读到这个。一位老师说,我带了一个任天堂Switch到课堂上,这样我们可以玩这些数学逻辑游戏。我的学生们说,哦,老师,我们能只做练习题吗?我说,好吧,那就做练习题吧。但是,比如玩一些在线游戏。这个班级曾经有过一个时刻,他们会觉得,什么?我们可以在课堂上玩电脑游戏?太棒了。但你知道,这是教育技术采用的一个有趣特点,新奇在短期内可能极具吸引力,但很快就会消退。

你对……有什么评论吗?为什么学生的默认选择又回到了纸笔?我的意思是,人们总是说教育几十年来一直如此,为什么即使我们改革了,它看起来还是这个样子?为什么默认是纸笔?好的。那么,让我们强调你观察到一个重要的事情,这也是我们在这里讨论过的,即学校是极其保守的机构。为什么是保守(小写c,不是指右翼)?有些是,但保守(小写c)意味着他们一遍又一遍地做同样的事情。可能的原因有哪些?一是,当你采访家长时,家长是另一个很多人提到的利益相关者,你问他们,你希望我们在你的孩子身上做多少实验?这个答案会相当低。人们对在孩子身上做实验的热情很低。第二,教育系统中的每个成年人都有所谓的“观察学徒期”。你们所有人都在学校待了大约13到18年,这塑造了你们的经验。所以,与你们教育水平大致相同的人进入学校成为教师,他们带来了那13、18、20年的教育经验,这塑造了他们认为学校应该如何展开的方式。

家长也会带来这些期望。我永远不会忘记这个。我曾经与犹他州一所学校交流,他们试图改用开放许可材料。那大概是15年前,18年前,他们试图摆脱教科书,让人们使用数字材料,特别是教师可以编辑的数字材料,以便根据学生情况定制。他们说,但他们仍然在教室里保留教科书,我不能告诉你这是否是真的,他们说,我们在教室里保留教科书的原因是,如果没有教科书,家长会不高兴。家长走进教室时,期望看到教科书。基本上,继续购买足够多的教科书放在所有教室里,比雇佣管理人员向家长解释为什么教室里不再有教科书要便宜。

所以,所有这些不同的利益相关者,这种保守的教育观是其中的一部分。一种可能性是,这真的很糟糕,实际上存在更好的方法,而我们如此保守,这真的拖累了我们。另一种可能性是,学校中存在的实践经过了几十年和几个世纪的完善,它们之所以是现在这个样子,是因为它们相当不错。我们继续做某些事情是因为它们有效。所以,你必须自己判断,当你听到学生采用旧实践的例子时,他们采用这些实践是因为它们真的很好用,因为他们喜欢它们,因为它们舒适和熟悉。有一种观点认为,特别是在我们这个时代,学生以一种几十年前可能没有的方式专注于成绩和表现,不是因为孩子们更物质主义了,而是因为经济不确定性。

因为随着贫富差距扩大,教育的赌注变得更高,人们更加专注于它。所以那些采用熟悉方式的孩子,他们是喜欢熟悉感,还是知道如何在熟悉感中表现出色?但是,再次,将我们谈论的所有事情与教育者试图实施新技术的决策联系起来。

你系统中的每个人都会有某种保守的冲动,一直到学生。这种保守冲动可能会被我们谈论的新奇效应所平衡,但它确实存在。所以,如果你希望一项新技术以某种有意义的方式被采纳,你可以采取的一个策略是让它与现有实践保持一致。你可以说,让我们采用那些已经在学校发生的事情的技术,那样就不会那么令人不安,需要更少的培训,引起更少的不安。它可能也不会带来太大帮助。我的意思是,卖技术的人不会这么说。但是,如果你只是将现有实践数字化,你通过数字化现有实践获得实质性收益的可能性有多大?或者也许你是一个雄心勃勃的改革者,说,不,不,我们可以做得更好。我们可以将学校的效率从2%提高到100%。我们只需要对我们的实践进行大的改变。然而,对实践进行大的改变需要说服人们改变所有这些事情。

这本书我读了很多遍。但我刚刚重温了。我喜欢里面的一段话。他说,在接近结尾的地方,他说,环境为其居住者制定了计划。

记住,他谈论的是教室的物理布局,但他使用了一个更广泛的社会学原则。环境为其居住者制定了计划。人们以某种方式在一个空间中互动,因为物理空间是以那种方式布置和建造的。

所以,我和这些人谈论电影胶片的一个问题。要在你的教室里放电影胶片,你必须拿一台巨大的带轮子的投影仪,把它推进空间。在20世纪初的一些城市学校教室里,挤满了大量涌入美国海岸的移民,他们的教室里没有空间放这个大东西。电影胶片另一个巨大的麻烦是这些巨大的电影卷轴。早期的电影卷轴真的非常大。你打算把这些东西放在哪里?你的城镇没有建一栋附有档案电影存储单元的建筑。假设你有一所大学校,有四个一年级班级,你想买一部电影。

你是要为所有四个一年级班级买四份同样的电影胶片吗?每个教室都要有自己的电影库吗?如果有一个集中的图书馆,你必须有一些方法来标记、存档、维护这些东西,并把它们带到教室里。所有这些事情的现代版本是,哦,你想给每个孩子一台设备。那个孩子的设备如何连接网络?他们如何登录?当他们忘记密码时谁来处理?当他们的设备坏了会发生什么?你会让家庭支付他们损坏的设备费用吗?你的孩子非常穷,他们负担不起,所以你要与保险公司签订合同。你的员工中谁有与保险公司签订计算设备保险合同的经验?你没有学过这个。我的意思是,我们周三会和教育学院院长们谈谈,但我很确定他们没有教学生如何管理保险合同。所有那些事情都成为,你知道,它们有一系列相关的激励和负激励。好的。

在我们得出结论之前,还有哪些其他人看起来对我们来说很重要,需要讨论一下?我们谈到了家长。是的,我,我,我的意思是,我不知道我们谈了多少。也许我们可以最后讨论一件事。

我们稍微谈了一下学校管理人员,但是,在学校里要特别注意的一点是,那里有多少不同类型的、角色不同的成年人。所以我们谈到了教师。还有校长之类的人。比如,如果你是一名校长,你在任何一天最紧迫的关注点是什么?作为校长,你的主要激励是什么?是的,你必须确保你能支付一切费用,教师不担心这个。教师会买……如果学校付钱,他们会想要多少技术就要多少。但校长必须平衡预算。我的意思是,奇怪的是,在美国,平衡预算可能根本不是校长的职责,可能完全是学区的职责。所以有些学区,学区会做出所有采购决策。其他一些学区,学区会拨一大笔钱给学校,说学校做出所有采购决策。

对校长来说还有什么超级重要?我正要说,比如维护校舍本身,为了学生安全。是的,学生安全,维护学校的物理建筑,确保一切正常运行。

他们也在管理关系,比如与学区、与家长等外部关系。校长是典型的组织行为学中的中层管理者。他们被授权做一些事情,但不是所有事情。他们对许多不同类型的利益相关者负责。他们所做的工作中有各种各样的复杂性。他们中的许多人很大程度上是根据考试成绩来评估的,特别是在学生有考试不及格风险的地方,并且根据政策基础设施,考试成绩对他们真的很重要。安全和学校的有序运行,比如,大楼里的每个人都希望学校有序,但当学校无序时,处理最多的人是助理校长或校长。这只是给他们更多的工作。你知道,比如让所有孩子都有手机,然后打架爆发,各种事情发生,教师必须处理,校长真的必须处理。我只是想简短地评论一下,当你问我们校长做什么时,我一生都在他们周围,我就像,我只能想到两三件我知道校长实际做的事情,我只是觉得这真的很奇怪,大多数人不会坐下来告诉你,这个人是为你处理X、Y、Z事情的人。

是的,围绕这些组织,很好。所以,你可以从那个见解中把握几件事。首先,学校简直复杂得令人难以置信。过去20年我基本上什么都没做,只是在思考学校。我仍然不理解那里发生的所有事情。它们就像一个生态系统,复杂得令人难以置信,也令人着迷。第二,如果你决定从事教育工作,从学生转变为教育工作者,你必须重新学习所有这些东西。从学生到从事教育工作的人,有很多事情对你来说是隐藏的,或者对你来说不重要。比如,你们中任何人是真正麻烦制造者的几率相当低,因为你们在麻省理工。但是,你知道,某个地方坐满了一个教室的人,他们非常了解校长,因为他们因为所做的事情在校长办公室待了很多时间。所以,很好,是的。

如果这门课发生在你身上的部分事情是,很多时候在社会科学中,我们谈论使熟悉的事物变得陌生。你一生都在看的东西,你会想,哇,看看那里所有这些我以前没有注意到或没有意识到的东西。

那些事情。也许这里有一个非常具体的事情。让我们想想像学生信息系统或Canvas这样的东西。让我们想想像学习管理系统这样的东西。谁花最多时间使用Canvas?告诉我其他使用Canvas的人。学生花很多小时登录,在Canvas上看东西。还有谁看Canvas?教师,教师。谁购买Canvas?不是学生和教师。在商学院,我想他们会称之为第三方支付者问题。所以,如果你是一家制作学习管理系统的公司。谁是你的利益相关者?谁最有权力决定你的东西是否被购买?比如某个教育技术主管之类的人,某个IT人员。所以,如果你曾经想过,比如,为什么这个这么糟糕?它不是为你设计的。在某些重要方面,它字面上不是为你设计的。它是为了解决某个将要购买这些东西的中层信息技术经理的问题而构建的。所以第三方支付者问题在教育技术领域比比皆是。我的意思是,从经典经济学的角度来看,第三方支付者问题的问题在于激励错位。你知道,在某些方面,你可以说改善Canvas上的教学和学习体验是一种成本。显然,你必须让它足够好,这样,你知道,如果有足够多的教师使用的话。你们有人曾经必须使用Blackboard吗?好的。很好。我曾经见过制作Blackboard的人。我只是站在他后面排队什么的,我在想,制作了一个数百万人讨厌的软件会是什么感觉?给世界带来这么多不快乐会是什么感觉?我想在自助餐队伍里问他这个问题会很不礼貌。

关于谁购买这些东西,我还有一件事要说。这也非常重要,特别是你们中任何对创办教育初创公司或其他事情感兴趣的人。

在学校里,谁能购买技术?可能购买技术的人有哪些头衔?我们提到了几个。图书管理员可以购买技术。系主任,系主任可以购买技术。教师,教师,他们是最不可能的人之一。实际上,有时人们认为教育系统的一个问题是,很难有一个真正的自下而上的市场效应。在大多数地方,教师很少有可自由支配的资金来决定。这就是为什么他们举行大型义卖活动,当你成为家长时,你的老师会要求你带纸巾盒之类的东西,你会想,我们生活在什么样的失败国家,你竟然不能简单地购买你需要的所有纸巾?每个学期为所有学生买两令纸?所以教师……在某些情况下他们有,但在很多情况下,校长可以买东西,教学技术主管可以买东西,助理督学可以买东西,督学可以买东西,学校董事会在某些地方可以直接授权购买东西,虽然可能更罕见,但他们可以推动。但重点是,在这个国家的1.3万个学区和13万所学校中,谁能购买东西这个问题的答案在所有那些背景下都是不同的。这使得创办一家教育技术公司非常非常困难。当你去某个地方时,你甚至不知道谁能买这个东西。比如,你甚至不知道你在向谁推销。现在,有人知道谁购买所有这些东西。在美国,唯一知道每个学区每所学校谁有权购买东西的人是大型出版商。培生、霍顿·米夫林,你工作的公司是什么?麦格劳-希尔。他们有一支销售大军。

004:大规模开放在线课程(MOOCs)📚

在本节课中,我们将要学习大规模开放在线课程(MOOCs)的兴起、背后的技术原理、其未能实现颠覆性变革的原因,以及它如何融入更广泛的教育技术图景。


课程概述

上一节我们讨论了教育技术计划(NETP)以及技术在教育中的角色。本节中,我们来看看一种曾被认为将彻底改变高等教育的特定技术形式:大规模开放在线课程(MOOCs)。我们将探讨其设计理念、实际效果以及它最终为何未能实现其最初的宏伟承诺。


课堂讨论回顾:技术在教育中的角色

在深入MOOCs之前,我们先回顾一下上节课小组讨论的要点。以下是同学们分享的一些关于技术在其教育经历中作用的观察:

  • 学习管理系统(LMS)的演变:MIT在COVID-19疫情前使用自有的、非标准化的Stellar系统,体验不佳。疫情后转向更统一的Canvas平台,提高了组织性,但教授们并未充分利用其全部功能(如实时成绩反馈)。
  • MITx平台与自适应学习:一些物理和数学课程使用MITx平台,它提供概念介绍视频或文字,并配有即时反馈的检查性问题。这种即时反馈有助于学生专注于解题过程,而非仅仅答案。
  • 数字笔记工具:如Notability等工具,配合学校提供的iPad,改变了学生组织课堂笔记和作业的方式,实现了无纸化学习与便捷的分享。
  • 课程特定工具:例如计算机科学课程使用的CAT-SO等自动辅导/评分系统。它们提供了良好的界面和功能,但不同课程使用程度不一,有时也存在系统稳定性问题。
  • 教学方法的差异与体验:新生在“TEAL”等翻转课堂模式中的体验,与后续传统讲座式课程形成对比,引发了关于教学方法连续性与有效性的思考。

这些个人体验是理解教育技术的重要数据来源。但需要注意的是,作为MIT的学生,我们的学习偏好和能力可能并不代表更广泛的学生群体。


《未能颠覆》一书框架:三类规模化学习

为了理解MOOCs,我们需要将其置于一个更广阔的框架中。在《未能颠覆》一书中,作者提出大多数旨在服务大量学习者而专家指导有限的教育技术,都属于以下三种类型之一。区分的关键在于:谁引导学习活动的序列?

1. 教师引导的规模化学习 👨‍🏫

由专家或专家团队预设学习路径(如第一部分、第二部分...)。学习者通常按此顺序进行。

  • 核心技术
    1. 学习管理系统(LMS):如Canvas, Blackboard, edX, Moodle。它们功能趋同,主要用于组织学习材料。
    2. 自动评分器:用于对大量学习者的作业提供反馈或认证。计算机擅长评估答案明确的问题(如数学、拼写),但在评估需要主观判断的内容(如论文主题分析)方面能力有限。
  • 教学理念倾向:更偏向直接教学、认知负荷理论。

2. 算法引导的规模化学习 🤖

计算机根据学习者对上一个问题的回答表现,通过算法决定下一个学习项目(如更难的题、更简单的题或同类型题)。

  • 核心技术项目反应理论(Item Response Theory, IRT)。这套由教育考试服务中心(ETS)在20世纪80年代开发的算法,用于量化题目难度,从而实现自适应测试。许多学习平台(如Khan Academy)和标准化考试(如GRE机考)都基于此技术。
  • 教学理念倾向:与教师引导型有相似之处,但更依赖于数据驱动的个性化路径。

3. 同伴引导的规模化学习 👥

学习者沉浸在同伴社区中,通过观察、模仿、修改他人的项目,自行设计学习路径。没有中心化的课程序列。

  • 核心技术基于网络的社区和内容聚合工具(如标签、专题推荐)。例如,Scratch编程社区、Rainbow Loom手链制作的YouTube教程网络。
  • 教学理念倾向:更偏向学徒制、情境学习。

MOOCs本质上属于“教师引导的规模化学习”。它的核心交互是“上一页”和“下一页”按钮,引导学习者按预设顺序完成视频、文本和自动评分问题。


MOOCs的兴衰:承诺与现实

曾经的宏伟承诺(约2011-2013年)

MOOCs在2011年左右爆发式增长,当时被认为将:

  1. 为资源有限者提供新的高等教育途径
  2. 重组、颠覆、解构传统高等教育系统。有人预测未来大学数量将大幅减少,精英机构制作的在线课程将成为主流。
  3. 形成规模化经济:一次性投入巨资制作顶级课程,边际成本极低。

残酷的现实

然而,这些承诺大多未能实现:

  • 完成率极低:通常只有约5%的注册者、10%的首次点击者能完成课程。自主学习非常困难。
  • 未能惠及最需要的人群:数据显示,参与MOOCs的绝大多数是已经受过高等教育的人群,而非缺乏教育机会的人。熟练的自主学习能力本身往往需要通过传统教育获得。
  • 未能颠覆高等教育:即使在疫情期间,学生和机构也普遍选择自己熟悉的、社交属性更强的本地教师在线课程,而非制作精良但匿名的大型公开课。
  • 商业模式的演变:单纯的单门课程“店面”模式未能获得足够认可。随后,MOOCs平台转向与大学合作提供完整在线学位,实质上变成了“在线课程管理商(OPMs)”。例如,edX在2021年被OPM公司2U收购。

原因分析

  • 教育的社交本质:人类联系(师生、生生)是坚持学习的关键动力,尤其是学习不感兴趣的内容时。MOOCs为降低成本而减少人际接触,这削弱了其有效性。
  • 自主学习是高阶技能:大多数人不擅长自主学习,这项技能往往需要在有支持的传统教育环境中习得。
  • 认证与 legitimacy:单门课程证书的认可度远不及传统大学颁发的学位。高等教育机构的核心能力是教学与认证,将其外包存在风险。


教育技术面临的持久困境

《未能颠覆》一书的后半部分指出了教育技术领域反复面临的四个核心困境,MOOCs的历程也体现了其中几点:

  1. 熟悉度诅咒:容易推广的技术往往是那些将现有教育实践数字化的产品(如Quizlet之于抽认卡),但它们带来的提升有限。真正具有变革性的新方法则难以被采纳。
  2. 马太效应:新技术往往 disproportionately 使优势群体受益,加剧教育不平等,而非缩小差距。
  3. 常规评估陷阱:计算机擅长评估结构化、常规的技能(这些技能未来可能也容易被自动化),但不擅长评估如批判性思维、证据推理等更核心但非结构化的能力。这可能导致教育系统过度关注可自动评估的次要技能。
  4. 数据化困境:虽然收集大量数据可以优化系统,但在教育中大规模实验和持续监控可能引发伦理问题,并使学生步入“监控社会”。

总结

本节课中我们一起学习了大规模开放在线课程(MOOCs)的发展历程。我们将其定位为“教师引导的规模化学习”的一种形式,并分析了其最初颠覆高等教育的承诺为何未能实现——核心原因在于低估了教育中社交互动和结构化支持的重要性,以及自主学习本身的高门槛。MOOCs的演变(从单门课程到学位合作)反映了教育技术产品在现实中与市场、机构认证以及人类学习本质相互妥协的过程。最后,我们通过《未能颠覆》一书的框架,了解到MOOCs的兴衰只是教育技术领域应对几个持久困境的一个具体案例。理解这些模式与困境,有助于我们以更清醒、更务实的态度看待未来的教育技术创新。

005:智能导师

概述

在本节课中,我们将探讨算法引导的大规模学习,特别是智能导师系统。我们将回顾其历史背景、核心原理、实际应用效果以及相关的教育理念与政治经济背景。

论文二作业说明

上一节我们讨论了大规模开放在线课程(MOOCs),本节中我们来看看本课程的第二个主要作业。

对于论文二,你需要完成以下任务:

  • 识别一个具体的学习环境(例如,麻省理工学院的物理系、你曾就读的中学、你参与过的课后项目或图书馆)。
  • 反思一项特定的教育技术。
  • 根据该学习环境的具体情况,论证是否推荐采用这项技术。

你需要撰写一份备忘录,提交给该环境中的特定利益相关者(如系主任、课程教学助理学监、图书馆馆长等)。在论证时,你需要:

  • 评估该技术开发者所做的宣传。
  • 查阅相关的研究证据。
  • 分析该技术发挥作用所需的条件是否与目标环境匹配。

作业的详细说明已在教学大纲中列出,提交日期大约在一个月后。

回顾MOOCs的三大赌注及其结果

在上一讲中,我们讨论了MOOCs曾许下的三大赌注。现在,我们来总结一下它们的结果。

第一个赌注是为缺乏机会的人提供接受高等教育的新途径。第二个赌注是重组、颠覆和解构高等教育。第三个赌注,也是我参与最多的一个,是创建数据驱动的学习科学。

然而,现实情况是:

  • 这些技术并未颠覆教育系统,反而被教育系统“驯化”了。
  • 关于数据驱动学习科学的愿景也未能实现。尽管我们记录了海量的点击数据,但很难从中洞察学习者内心的认知过程。大多数研究得出的结论类似于“做得更多的人学得更好”,这并非深刻的发现。
  • 我们曾尝试通过课前小干预(如计划制定、价值肯定)来提升学习效果,在初期小规模实验中效果显著,但当推广到数十万人时,效果却消失了。

因此,MOOCs的宏大愿景大多未能实现。如今,它们更多地被应用于企业高管培训等成熟领域,而非彻底变革教育。

算法引导的大规模学习:智能导师

现在,让我们进入本节课的核心主题:算法引导的大规模学习,通常被称为“智能导师”系统。

核心原理:项目反应理论

许多同学在K-12教育阶段都接触过这类系统(如IXL、Khan Academy)。其核心思想是根据学习者的实时表现,提供个性化的学习路径。

这种个性化评估的基础是项目反应理论。该理论通过逻辑函数对测试题目的难度进行建模。

  • 在坐标图中,横轴代表学习者的能力值,纵轴代表答对该题的概率。
  • 不同的题目会形成不同的曲线。系统可以根据学习者的答题情况,估算其能力值,并选择最能有效测量其水平或提供适当挑战的下一道题目。

这套统计工具最初用于确保标准化考试的安全性,后来被用于开发能够动态调整题目顺序的计算机化系统。

个性化学习的两种愿景

“个性化学习”是一个被广泛使用但含义不同的概念。主要存在两种愿景:

  1. 混合式学习:学生部分时间通过在线学习,并对学习的时间、地点、路径或进度有一定控制权。其目标是利用算法为每个学生规划出掌握特定知识体系(如数学)的最优路径。
  2. 联通式学习:学习是社交性的、兴趣驱动的,并与教育、经济或政治机会相连。其目标是支持学习者基于个人兴趣和热情,在朋友和成人的帮助下进行探索。

这两种愿景分别呼应了我们之前讨论过的“授导主义”与“建构主义”传统。

现实效果与挑战

尽管智能导师的概念充满魅力(如本杰明·布鲁姆提出的“两西格玛问题”:一对一辅导效果极佳),但其实际应用面临挑战:

  • 学科局限性:现有证据表明,这类系统在数学(尤其是程序性技能练习)上效果相对较好,但在阅读、科学等需要深度概念理解的学科上效果较弱。
  • 对“有效”的定义:所谓“提高数学成绩”,通常指的是在州标准化测试中得分提高。但这些测试往往无法衡量问题提出、建模、解释等更重要的数学实践能力。
  • 实施挑战:系统的效果高度依赖于教师的实施。如果教师只是偶尔使用,而非将其有机整合到课程中,效果会大打折扣。
  • 技术发展:尽管经历了数十年的发展,许多智能导师系统的基本模式与几十年前相比变化并不大。

可汗学院创始人萨尔曼·可汗的认知转变是一个例证:他从最初倡导“用视频重塑教育”的变革性愿景,转变为建议“每周在传统教学基础上,使用30-60分钟可汗学院作为补充练习”。这更像是教育系统对技术的“驯化”,而非颠覆。

个性化学习的政治经济维度

个性化学习不仅是一种教学法,也常与更广泛的政治经济项目相关联。

一种观点认为,应该“解构”学校教师的职责,让明星教师(如可汗)负责最擅长的讲授部分,而课堂教师则专注于机器无法替代的辅导、关怀和评估工作。

更进一步的观点则主张“解构”学校本身,将教育资金直接赋予学生(如教育券、学生背包基金等形式),让学生和家长在市场上自由选择甚至组合各种教育服务(从数学课到性教育课)。这背后是“资助学生而非系统”的市场化教育改革理念。

因此,关于个性化学习的讨论,常常与关于学校公共性、教育公平和政府角色的深层政治辩论交织在一起。

总结

本节课我们一起探讨了算法引导的智能导师系统。

  • 我们了解了其基于项目反应理论的核心工作原理。
  • 我们分析了它在实践中(尤其在数学练习上)显示出的效果及其局限性。
  • 我们区分了“混合式学习”与“联通式学习”两种不同的个性化愿景。
  • 最后,我们认识到,个性化学习的技术理念常常与更大范围的教育市场化、学校解构等政治经济议题紧密相连。

下一讲,我们将更深入地审视关于智能导师有效性的具体研究证据。

006:兴趣驱动学习

概述

在本节课中,我们将要探讨大规模同伴引导式学习。我们将从个人兴趣驱动的非正式学习实践出发,分析其核心特征,并审视将这些模式引入正规教育机构(尤其是高等教育)的尝试与挑战。

从个人兴趣到在线学习

上一节我们讨论了技术如何塑造学习环境,本节中我们来看看兴趣如何驱动人们利用在线资源进行学习。

课程开始时,教授邀请学生们分享自己利用网络资源学习爱好的经历。以下是几位学生的分享:

  • 摄影学习:Omar分享了他如何通过YouTube教程、Reddit论坛和专业摄影网站,自学了摄影技术,甚至学会了如何选购一台有50年历史的胶片相机。他从手机摄影开始,逐步构建了自己的知识体系和设备库,现在甚至开始指导他人。
  • 算法引导的兴趣探索:Ja谈到,YouTube等平台的推荐算法有时会引导他的兴趣在不同爱好间快速切换,例如从吉他学习转向其他领域,这让他感觉兴趣被算法所驱动。
  • 时尚与设计:有学生利用YouTube和Pinterest等平台追踪时装周动态、观看评论和分析,以理解时尚的社会与艺术层面。Pinterest被用作收集、分类和整合灵感的工具。
  • 烹饪学习:Dana通过在线食谱文章和TikTok短视频学习烹饪。她提到,看到非专业厨师分享的“你也能做”类视频,会让她感觉更亲切、更容易上手。
  • 数学科普:Ron提到了像“Numberphile”这样的YouTube频道,它们以有趣的方式讲解数学概念(如分数维),成为一种兴趣驱动的学习途径。
  • 游戏社区:教授回忆了早期文本游戏的攻略本(甚至用隐形墨水书写答案),并对比了当今围绕每个视频游戏形成的Wiki、Reddit论坛、Discord社区和YouTube频道,这些构成了深入且亲密的非正式学习网络。

这些例子表明,非正式、兴趣驱动的在线学习已成为许多人生活中的常态。人们为了工作、爱好或热情,不断利用网络社区和资源发展新技能。

非正式学习与正规教育的鸿沟

这些技术深刻地改变了我们在校外追求学习的方式,但学校作为机构,却对这些学习形式表现出显著的抵抗力。

核心论点在于:虽然技术在非正式学习领域引发了革命,但正规教育体系(尤其是学校)在吸纳这些同伴引导、大规模、兴趣驱动的学习模式方面却举步维艰。大多数学生不觉得八年级物理课的学习体验与通过YouTube学习摄影的体验相似。学校的设计与组织方式,使得这类学习环境难以融入。

教授提出,今天分享的一些高等教育领域的重大尝试,更像是一个有趣但未能成功的探索。研究失败与研究成功同样重要,因为它能帮助我们更清晰地理解事物运作的真正原因。

案例:彩虹织机与网络学习社区

一个标志性的例子是2013年左右风靡的“彩虹织机”。孩子们利用简单的塑料织机制作彩色橡皮筋手链。媒体报道称赞其让孩子们“离开了手机”,但实际上,孩子们在整个过程中都离不开手机。例如,两个女孩制作的“彩虹织机星爆手链”教学视频获得了数千万的观看量,远超官方内容。

这展示了高度去中心化的网络学习机制。在互联网时代之前,一种新工艺的传播可能需要依靠实体店、俱乐部或电视节目。而如今,学习者可以通过网络自主连接,形成分散但强大的学习社区。这甚至实现了早期思想家(如Ivan Illich在《去学校化社会》中)对“学习网络”的预言。

这种现象甚至能支持精英级别的技能获取。例如,肯尼亚标枪运动员Julius Yego早期主要依靠YouTube视频学习技术,并最终获得了奥运会银牌。这体现了在线资源在打破地域和专业基础设施限制方面的民主化潜力

大规模开放在线课程中的混合学习

早期的大规模开放在线课程学习者并不仅仅使用平台提供的材料。他们还会搜索维基百科、购买相关书籍、加入相关的Facebook学习小组等。这表明,结构化的课程学习与非正式的、基于网络的探索之间的界限是模糊的

许多大学生也有类似体验:在课堂上没听懂时,会上网搜索教学视频;不满足于某位教授的讲解时,会去观看其他教授(例如通过MIT OpenCourseWare)讲授同一主题的课程;课程讨论板(如Piazza)不够用时,会转向Stack Overflow等专业社区。

编程领域尤其依赖这种非正式学习。程序员必须擅长利用在线资源和社区解决问题。积极参与这些社区(如贡献开源项目、在Stack Overflow上回答问题)甚至能带来职业发展机会。这表明,非正式学习环境与正式学习环境之间的边界是可以渗透的

教育者的责任:为终身学习做准备

将技术整合进学校学习的一个重要理由是:对于大多数人而言,毕业后的终身学习将更类似于围绕爱好的学习,而非传统的课堂学习。

这引发了一个深刻的问题:学校是否有责任帮助学生熟练掌握通过在线社区进行自我学习的技能? 如果K-12或大学教育的目标之一是让学生毕业后能自如地利用网络资源自学烹饪、摄影或音乐,那么今天的教育应该如何设计?

有学生提到,数字素养教育至关重要。她中学的计算机课程教授了打字、创建LinkedIn资料、建立个人作品集网站等技能,并通过个人项目教授研究方法。关键在于,教育者需要不断判断,哪些新兴技能值得投入宝贵的教学时间。十年前,有人曾认为MOOC至关重要,但如今其影响力已不如预期。当前,教育者正对AI在教育中的角色感到焦虑和困惑。

人工智能是同伴引导学习吗?

关于AI是否可被视为一种同伴引导学习形式,讨论认为:如果一个同伴引导学习网络包含由先前人类生成的大量学习资源,那么由生成式预训练Transformer来生成有用的学习序列似乎是可能的。然而,有学者对人与聊天机器人的直接互动效果持怀疑态度,认为AI代理或许更适合介入两人之间的对话,例如在论坛讨论中帮助引导问题或连接不同观点。

一个核心挑战是:AI生成的内容对专家比对新手更有用。专家能辨别其中的合理与荒谬之处,而新手可能全盘接受那些表述自信但可能错误的信息。这是教育者未来必须应对的重大问题。

Web 2.0的兴衰与教育平台的标准化

回顾互联网发展,Web 2.0技术曾让任何人都能轻松在线发布内容(博客、微博等)。人们曾预测,年轻一代需要学习如何在社交网络中连接。然而,大约从2015年开始,社交媒体格局变化,许多开放的博客空间被Facebook等平台吸纳和标准化。个人拥有的、可控的网络空间减少,转向由企业控制的平台。David Weinberger评论道:“博客圈未能规模化……Facebook实现了博客的梦想,但方式不同。”

高等教育也发生了类似的故事。早期大学网页是个人化、风格各异的“波浪号空间”(如 web.mit.edu/~username)。它们体现了个人控制和网络特色。随后,Blackboard、Canvas等学习管理系统兴起,它们标准化了课程页面格式,带来了便利,但也消除了多样性,并将学习产出的控制权从个人转移到了机构手中。更甚的是,这些课程网站通常会在学期结束后被删除。

这引发了思考:是否存在一种替代方案,既能协调学习,又能让学生拥有自己的学习成果,发展技术能力,并建立持久连接?

连接主义与开放网络教育实验

一些教育者(如Stephen Downes)提出了“连接主义”学习理论,认为学习和知识更多地存在于人与人之间,而非个体头脑中。学习不仅是获取内容,更是融入社群、建立连接。在这种观点下,课程内容甚至可以被视为推动连接发生的“麦高芬”。

受连接主义和开放网络精神启发,一些教育者尝试构建替代学习管理系统的架构。例如,教授曾运营一门课程,要求学生在自己的网络空间(如个人博客、Twitter、Flickr)完成所有作业。然后,课程通过“联合总线”技术(利用RSS订阅)将这些分散的内容聚合到一个中心站点。这样,学生拥有自己的数据,课程则能展示和连接所有人的工作。

这种方式鼓励学生为自己的学习设定目标、创建评价标准,并将写作与更广泛的专业社区连接。类似的课程(如数字讲故事课程DS106)也强调创造性任务和网络化分享。

实验为何未能普及?

尽管这些实验令人兴奋,但它们并未成为主流。主要原因有二:

  1. “熟悉度的诅咒”:这种方式太奇特、太不同,学习成本高。学生需要花时间学习使用博客、Twitter等工具,而这些时间本可能用于学习课程核心内容。
  2. 公平与安全风险:要求所有人公开写作,但并非所有人都平等地承受公开表达可能带来的后果(如网络骚扰、人肉搜索)。在课堂上,学生需要能够试验不成熟或具有挑战性的想法,而公开环境可能抑制这种探索,并对某些群体构成更大风险。

此外,像Reclaim Hosting这样的公司曾试图简化这种个人网络空间的搭建流程,但整体上,这种模式因技术复杂性、上升时间成本以及日益严峻的在线安全环境,而更多地成为一个值得研究的“有趣的死胡同”。

总结

本节课中我们一起探讨了兴趣驱动的非正式在线学习的强大力量,以及将其原则整合进正规教育体系所面临的挑战。我们回顾了从彩虹织机社区到连接主义教学实验的案例,分析了其背后的理念、优势以及最终在制度化教育中难以扎根的原因。关键启示在于:虽然学校环境难以完全复制非正式学习的活力,但理解这种鸿沟以及那些失败的整合尝试,能帮助我们更好地思考如何设计更能培养学生终身学习能力、更能连接真实世界网络的教育体验。 下周我们将继续探讨在K-12教育环境中类似的尝试与挑战。

007:学习游戏 🎮

在本节课中,我们将探讨学习游戏的概念,分析不同类型的教育游戏,并讨论一个核心问题:在游戏中获得的技能能否有效地迁移到其他领域。

概述

我们首先回顾了大家童年或近期玩过的学习游戏,从经典的《数学冲击波》到现代的《多邻国》。接着,我们通过试玩和分析几款游戏,探讨了它们背后的学习理论。最后,我们深入讨论了“学习迁移”这一关键概念,即在一个情境中学到的知识或技能能否应用于另一个不同的情境。

游戏回忆与讨论

以下是同学们分享的一些具有代表性的学习游戏体验:

  • 数学游戏:例如《数学24点》和《酷数学游戏》网站上的游戏。这些游戏通常将数学练习(如算术、乘法)包装在有趣的互动形式中。
  • 角色扮演与沟通游戏:例如《抵抗组织》和《狼人杀》。这类游戏主要锻炼玩家的推理、沟通、团队合作和说服能力。
  • 基于坐标系统的游戏:例如早期的《苹果大战》和《打地鼠》变体。玩家需要理解并快速运用坐标概念来完成游戏目标。
  • 课堂互动工具:例如 Kahoot。它将知识问答竞赛化,通过实时排行榜、竞争机制和趣味性界面提高课堂参与度。
  • 开放式创造与模拟游戏:例如《我的世界》。它提供了一个沙盒环境,玩家可以自由探索、建造和解决问题。
  • 早期教育软件与玩具:例如《星落》和跳跳蛙玩具。它们通过互动故事和活动教授阅读、数学等基础技能。

游戏类型与学习理论

上一节我们回顾了各种游戏,本节中我们来看看如何用三种“规模化学习”的理论框架来分析它们。

游戏并不严格属于某一种框架,但具体游戏的设计往往更贴近其中一种,或呈现混合特征。

  • 《数学冲击波》与“巧克力裹西兰花”:这类游戏本质上是算法引导的规模化学习。它将传统的练习题(如数学运算)包装上游戏外壳(如射击外星人)。其核心是重复练习和即时反馈(自动评分),类似于一个有趣的自动评分系统。这种设计有时被称为“巧克力裹西兰花”,旨在让枯燥的学习内容变得更有吸引力,但游戏机制与学习内容本身关联较弱。
  • 《祖宾斯的逻辑之旅》与“共鸣游戏”:这款游戏更接近情境化学习的理念。它没有明确的指令,而是将玩家沉浸在一个需要运用组合逻辑和问题解决技能的世界中。学习是通过探索、试错和叙事驱动自然发生的。这类“共鸣游戏”不是给学习内容套上游戏外壳,而是挖掘学科内容本身固有的趣味性和游戏性。
  • 《多邻国》的混合设计:《多邻国》巧妙地融合了多种方法。它采用算法引导来个性化学习路径和控制难度(如瞄准“最近发展区”)。同时,它也运用了大量游戏化元素来提升用户粘性,例如:
    • streak(连续学习天数)
    • 丰富的视觉和声音反馈
    • 建立与“多邻鸟”的拟社会关系
    • 徽章和社区互动
      此外,其某些功能(如模拟弹钢琴)也试图创造情境化的体验。

核心挑战:学习的迁移

在讨论了不同类型的学习游戏后,一个根本性问题浮现出来:在游戏中学到的东西,到底有多大用处?

这就是学习迁移问题:在一个情境(如游戏)中获得的知识或技能,能否被有效地应用到另一个不同的、通常更现实的情境中。

  • 迁移的困难性:大量教育心理学研究表明,迁移是困难的。例如:
    • 擅长估算矩形面积,并不能让你更好地估算圆形面积。
    • 精通国际象棋,未必能提升学业成绩。
    • 历史学家擅长在档案中辨别真伪,但在评估网站可信度时,表现可能不如专业的事实核查员。因为后者掌握了一套特定于网络环境的核查技能(如离开原网站进行横向搜索)。
  • 对通用技能的质疑:许多我们认为是“通用”的技能,其实高度依赖于具体领域的知识。例如:
    • 阅读理解:一个对足球知识丰富的“差”读者,在阅读足球文章时,可能比一个对足球一无所知的“好”读者理解得更深入。理解力与领域知识紧密交织。
    • 计算思维:常有人说编程教会人“将大问题分解为小问题”。但写作从一开始就教人将大观点分解为段落和句子。这种“分解”能力在不同领域(文学 vs. 编程)的体现和应用方式差异很大,没有具体的领域知识,你甚至不知道从哪里开始“分解”。
  • 对游戏价值的启示:这对评价《我的世界》等游戏的教育价值至关重要。玩家在游戏中确实学到了很多(如协作、信息检索、目标设定)。但关键问题是:这些在《我的世界》中学到的技能,能否帮助他们在学校项目、未来工作或其他生活场景中做得更好?目前的研究尚无定论,这也是教育游戏设计者和研究者面临的核心挑战之一。

总结

本节课中,我们一起学习了学习游戏的多样性和它们背后的设计理念。我们分析了从“巧克力裹西兰花”式的技能练习游戏,到“共鸣游戏”式的情境化体验。最重要的是,我们探讨了学习迁移这一核心概念,认识到将特定情境中学到的技能应用于新领域并非易事。这一认识促使我们更审慎地思考教育游戏的设计目标与实际效果,也让我们明白,声称能培养“通用技能”时需要坚实的证据支持。

008:初创公司与熟悉感的诅咒

概述

在本节课中,我们将探讨教育技术领域两个“尚未解决的困境”:熟悉感的诅咒教育技术的马太效应。我们将分析为何许多新技术未能如预期般变革教育,并讨论一些可能突破这些困境的策略。


熟悉感的诅咒

上一节我们讨论了教育技术规模化应用的几种模式及其局限性。本节中,我们来看看第一个困境:熟悉感的诅咒。

这个概念指的是,许多教育技术创新者倾向于将旧的教学理念和方法(如抽认卡)进行数字化包装,使其看起来是新的,但本质上并未带来根本性的变革。这种做法有其优点,例如易于被保守的教育系统接受,但也限制了技术发挥其变革潜力。

以下是关于熟悉感的诅咒的一些核心讨论要点:

  • 定义与表现:将旧理念重新包装,使其看似新颖,但实质未变。例如,Quizlet 本质上是数字化的抽认卡。
  • 产生原因:创新者可能缺乏对教育史的了解,或者为了适应现有保守、厌恶风险的教育机构而将新技术“弯曲”以符合旧模式。
  • 优点:熟悉的技术更容易被教师、学生和家长接受和采用,因为它们符合现有的教学安排和期望,降低了使用门槛和风险。
  • 缺点:这种做法可能无法解决教育的深层次问题,只是对现有实践的微小改进,无法带来变革性的影响。

那么,是否存在策略能够帮助我们突破熟悉感的诅咒,利用技术实现真正不同的教学方式呢?目前有两种被认为可能有效的策略。

策略一:从熟悉之处入手,导向新领域

开发一种技术,让用户从熟悉的功能开始,但逐渐引导他们探索和采用全新的、更具变革性的使用方式。其核心设计理念是 “低门槛、高天花板” ,即入门简单,但能实现复杂、有深度的创作。

策略二:培育专业社群

推广新技术最大的挑战往往不是技术本身的扩散,而是与之配套的新教学理念和实践的传播。关键在于培育教育者社群,促进他们之间分享新想法、新教学法。成功的案例如Scratch和Desmos,它们不仅推广了工具,更通过会议、工作坊、在线社区等方式,成功地规模化了一个实践新教学法的教育者社群。

改变教学实践本质上是一个同伴学习问题。教师最愿意尝试新实践,通常是因为看到同行(尤其是处境相似的同行)的成功。然而,教育领域缺乏像医学那样强大的、能制定和推广最佳实践的专业组织,这使得培育社群变得尤为重要且困难。


教育技术的马太效应

接下来,我们探讨第二个困境:教育技术的马太效应。这个效应描述了新技术往往不成比例地惠及已经具备优势的群体,而非如人们所期望的那样“民主化”教育或缩小差距。

人们常希望新技术能“民主化”教育,但大量证据表明,实际情况更可能是:新技术不成比例地使优势群体受益更多。即使技术本身是免费或可广泛获取的,使用方式、支持系统和文化环境上的差异也会导致新的不平等。

以下是一些关键的研究发现和例证:

  • MOOC参与者画像:对哈佛和MIT的MOOC平台数据分析显示,参与者普遍比美国普通民众更富裕、父母受教育程度更高。虽然全球各地都有人成功,但主体仍是已具备优势的群体。
  • “第一道”与“第二道”数字鸿沟:保罗·阿特威尔指出,数字鸿沟不仅是访问鸿沟(谁有设备/网络),更是使用鸿沟。即使访问平等,低收入学生也更可能将技术用于机械练习,而高收入学生则更多用于创造性应用和模拟。这种模式在1996年和2011年的数据中惊人地一致。
  • 文化信息的差异:一项对三所技术装备水平相似的学校的研究发现,学校社区传递的文化信息截然不同。在富裕的白人学校,“捣鼓”技术受到鼓励;在亚裔中产阶级学校,则被视为对学业的威胁;在拉丁裔工薪阶层学校,则基本被忽视。这影响了学生与技术互动的方式。
  • 社交媒体的退缩:近期研究发现,由于网络极化等原因,来自边缘化背景的年轻人比富裕的白人男性更倾向于从社交媒体上的公共学习中退缩,这构成了新的社会文化排斥。

面对这个根深蒂固的问题,我们能否采取行动?虽然尚无完美解决方案,但以下是一些有前景的探索方向:

  • 联结家庭、学校与社区:设计技术或项目,帮助所有家庭(而不仅是高知家庭)支持孩子的学习,例如“家庭创造性学习”项目。
  • 对接学生兴趣与身份:从年轻人现有的兴趣(如游戏、舞蹈、时尚)切入,引导至学术学习,这是“联结学习”的核心。
  • 有针对性地降低关键成本:识别并消除对弱势群体构成实质性障碍的成本。例如,Desmos将图形计算器成本降为零,OpenStax提供顶尖的免费大学教科书,这对社区学院学生意义重大。
  • 设计针对子群体需求的干预:在课程或产品中,为可能面临 stereotype threat(刻板印象威胁)或缺乏支持的学生设计增强归属感或提供额外支持的环节。
  • 支持关键过渡阶段:关注教育轨迹中的关键过渡点(如高中升大学),为缺乏系统知识的学生(如家庭第一代大学生)提供“助推”信息和支持。
  • 实现全球平台与本地定制的结合:利用可定制的开源技术平台(如Open edX),允许本地运营者根据特定语言、文化和需求进行适配,在规模化和情境化之间取得平衡。

总之,如果我们不有意地将边缘化群体的需求置于中心,那么开发的教育技术几乎可以肯定会不成比例地惠及优势群体。我们需要在整个项目生命周期中,持续探索如何更公平地服务多样化的人群。


总结

本节课我们一起探讨了教育技术领域的两个核心困境。熟悉感的诅咒揭示了新技术为何常被旧框架束缚,而教育技术的马太效应则警示我们技术可能加剧而非缓解不平等。我们讨论了诸如“从熟悉到创新”、“培育专业社群”、“降低关键成本”、“对接学生兴趣”等可能的突破路径。理解这些困境是未来设计更公平、更有效的教育技术的第一步。

009:常规评估的陷阱

在本节课中,我们将探讨教育技术中的一个核心困境:常规评估的陷阱。我们将分析为何现有的评估技术倾向于测量那些计算机已经擅长、且人类未来可能不再需要亲自执行的任务,以及这对教育目标意味着什么。

课程概述

上一节我们讨论了“熟悉性诅咒”和“教育技术马太效应”。本节中,我们来看看“常规评估的陷阱”。这个陷阱的核心在于:我们能够大规模评估的技能,往往与计算机能够自动化的技能高度重叠。这导致教育系统可能过度关注那些即将被技术取代的能力,而忽视了人类在未来社会真正需要的、更复杂的技能。

常规评估的核心困境

任何想要阐述常规评估陷阱核心难题的人?其核心难题在于,教师教授学生学科知识,而学校体系非常强调期末考试和标准化考试的准备。但同时,我们也在与“计算机能评分什么”这一理念作斗争。如果你试图标准化某种评分方式,你只能真正专注于教授计算机能做的事情。但如果计算机已经能做这件事,那为什么它还是我们教学的重点?这就像一个维恩图:我们真正应该关注的教学领域,与实际因为便于评估而只关注的重叠部分,并不一致。

很好。我们现有的评估技术在某种程度上限制了我们在任何规模上能够评估的内容。

还有人想补充达纳最初观点之外的重要内容吗?我认为阅读材料中您也提到了这与劳动力市场的联系。学校本应帮助我们为劳动力市场做准备,但我们学习的却是正在被自动化取代的常规事务。这如何真正实现学校应有的功能?

好的。学校运作于几个不同事物之间。一是我们需要孩子做什么,这会随着新技术的发展而随时间变化。随着计算机能力的扩展,我们对于教人们什么的想法也在改变。与此同时,随着计算机技术的扩展,我们可能有更新、不同的方式将它们用于评估。这两件事一直在相互影响。

还有其他重要的引入点吗,奥马尔?就像我们并不是说不教乘法表之类的东西,那些是计算机可以评估的,但却是学生为进一步学习打基础所必需掌握的根本内容。

很好。这使得整个对话更加复杂,因为有些事是人们生活中需要能够做的。可能还有一类事情被称为“为了能做那些复杂事情而需要学习的东西”。即使计算机能做那些更简单的事。所以,有一类计算机能做的事,我们可能不再需要人类去做了。但像一位数乘法则不同,计算机可以轻松完成,但人类学习它实际上非常重要。所以这类事情中存在一些复杂性。

关于常规评估陷阱的初步框架,还有人想补充吗?我想再补充一点,我们的社会重视这些常规评估,所以即使你试图改变并拓展我们教学生的内容,他们仍然总是受到市场本身的约束,教师最终不得不与之抗争。

所以,几乎任何教育工作者都会同意,标准化考试并非捕捉学生应知所有重要事项的良好机制。但更棘手的问题是,存在一类对学生很重要但我们不擅长评估的事情。在教育体系中很难优先考虑这些事情,因为我们不知道如何衡量,或者不知道如何以我们想要用于高风险评估(如毕业考试或大学入学考试)的那种公平方式进行系统性衡量。

劳动力市场的演变与教育的挑战

我认为我们可以从蒂的建议出发,回顾大约20年前,上一次计算机真正让教育工作者和劳动经济学家感到不安的时刻。现在随着大语言模型的兴起,我们再次处于这样的时刻。回顾个人电脑普及到大多数美国家庭和工作场所,以及互联网的引入,都曾引发过类似的问题。

关于这场辩论,一篇很好的总结性文章是2015年左右两位经济学家弗兰克·利维和理查德·默南的论文《与机器人共舞》。早期经济学家的一个预测是:计算机将补充高薪工人,并取代低薪工人。但利维和默南认为事情会更复杂。他们思考了人们在工作中所做的具体事情以及这些工作如何变化。

你们有多少人曾直接与真人交谈办理登机手续?大多数人现在是通过机器办理登机。有趣的是,这些与真人的对话是高度标准化、高度常规化的。随着计算技术变得更复杂、用户界面更先进,有人想到可以把这些对话编程到机器里。但尽管如此,只要有机场自助值机亭,总有一些情况是机器无法应对的。于是,仍然有一个人在这排机器后面,负责处理所有机器无法进行的对话。作为一个劳动经济学家,这是个有趣的问题:那个人在做什么是我们无法编程到所有机器里的?

另一个有趣的例子是关于管道工的。过去,管道工学徒学习焊接管道和做一些基本的电工活。但现在,安装一个按需热水系统可能需要管道工具备计算机编程能力来解决系统无法自行诊断的非结构化问题。即使职位名称保持不变,工作内容也被技术能力所改变。

《新劳动力分工》的研究分析了劳工部收集的工作描述,发现可以将工作大致分为四类:

  • 常规体力劳动:如搬运、移动物品等。
  • 常规认知劳动:如归档、标准化对话(如值机)等。
  • 非结构化问题解决:解决那些你不知道需要什么输入、输出应该是什么样子、正确答案是什么的问题。
  • 复杂沟通任务:需要与人交流来解决问题,如市场营销、家庭健康助理等。

他们的基本论点是:常规性工作正在从美国劳动力市场中消失。这对想要稳定社会的我们来说是个大问题。而正在增长的工作是那些需要非结构化分析技能和社交技能的工作。

如果你是一名教育工作者,你必须思考:我们面前有一项不同的任务。仅仅培养人们从事需要常规认知或体力劳动的工作已经不够了,因为这些工作正在劳动力市场中消失。即使相同的职位名称仍然存在,比如仍然有管道工,但管道工越来越多地被要求进行非结构化问题解决和复杂沟通。

评估技术与现实需求的错位

常规评估陷阱的核心在于:计算机擅长评估的事物,几乎完全与计算机擅长执行的事物重叠,而这些正是我们不再需要人类去做的事情。我们能够构建的、擅长评估人类表现的工具,其评估范围几乎总是与计算机擅长的领域紧密重叠。

以下是几个例子:

数学建模框架:大约15年前,共同核心州立标准的一个重大变化是,我们希望教学生不仅做数学程序性计算,还能进行数学建模练习。数学建模练习可以大致分为五个步骤:

  1. 在现实世界中发现问题。
  2. 将其建立为模型(方程、示意图、表格等)。
  3. 在模型内计算某种解决方案。
  4. 用现实世界的术语解释你的解决方案。
  5. 解释为什么你的解决方案是合理的。

在这五个步骤中,我们有什么技术可以评估?我们唯一能可靠地用计算机评估的,是你能否计算出解决方案。但如果你在职业中使用数学,你几乎永远不会做哪一步?计算解决方案。计算机会为你做数学。然而,在任何级别的标准化数学考试中,你将花费大部分时间进行计算。这是一个真正的问题。

研究测试的心理测量学家有一个术语来描述我们对测试的误解,叫做“具体化谬误”。给某物贴上“数学测试”的标签,并不意味着它就是全面的数学测试。测试实际上是在对一个领域进行抽样。问题在于,我们过度抽样了“计算”,而对所有其他种类的技能抽样不足。

计算机编程:哈尔·阿贝尔森曾写道:“首先,我们希望确立这样一种观念:计算机语言不仅仅是让计算机执行操作的一种方式,而是一种表达方法论思想的新颖形式媒介。因此,程序必须为人阅读而写,只是顺便让机器执行。” 当你们提交编程作业进行自动评分时,这些系统擅长评估你们编程的哪些特征?它们检查你的代码是否通过一系列预设的测试用例,是否运行高效,可能还有代码风格检查器。这些主要评估的是“顺便让机器执行”的部分。风格检查器可能是朝着评估“为人阅读”部分迈出的合理第一步,但评估人类相互理解和沟通的代码特征要困难得多。

讨论:其他领域与未来展望

以下是其他可能面临类似困境的领域,以及我们对未来突破常规评估陷阱的乐观展望。

写作评估:在写作领域,我们很难用计算机触及重要的东西。长篇文章的标准化评估质量令人失望。虽然我们已经开发了自动作文评分工具,对于特定问题,其可靠性大致与人类评分员相当,但它们无法评估写作中所有重要的方面,尤其是对于新颖的题目。

语言学习:计算机可以轻松评估词汇量、词形变化或语法,但这并不是语言学习的重点。语言学习很大程度上是关于说和听,尤其是考虑到口音和地区差异,评估某人是否真正流利非常困难。不过,自动发音检测器在语言学习课堂环境中可能是一个进步,它能提供比人类教师更高效、更专注的反馈。

艺术分析:计算机可以分析色彩构成、创作年代、客观吸引力,但未必能深入艺术家的背景、作品背后的情感信息或创作缘由。计算机擅长触及表面层次,但可能完全错过了整体的意义和信息。

未来乐观展望:在未来五年,我们最有可能在哪些领域看到突破常规评估陷阱的最大进展?

  1. 写作形成性反馈:许多系统正在开发中,为学生写作提供形成性反馈。这些系统可以检查文章是否具备主题句、过渡句、论据等要素。更重要的挑战是让机器能像有经验的教师一样,从众多可评论的问题中,判断出学习者当前最应该关注哪一两个问题。
  2. 理解基础原理:随着AI工具能完成更多具体任务,教学重点可能转向让学生理解事物如何从底层运作,从而能够从零开始构建事物,培养更根本的解决问题的能力。
  3. 人机协作评估:未来的评估系统可能不是完全自动化的,而是人机协作。例如,机器处理常规可评估的部分,而人类教师专注于需要专业判断、情境理解和个性化指导的复杂评估部分。

总结与反思

本节课中,我们一起深入探讨了“常规评估的陷阱”。我们了解到,由于评估技术的限制,教育体系可能不自觉地侧重于测量那些易于自动化、且未来价值可能降低的常规技能。我们回顾了劳动力市场如何向需要非结构化问题解决和复杂沟通技能的方向演变,并分析了数学、编程等领域中评估与现实需求的错位。

这个陷阱给教育者带来了持续的挑战:我们很难预测哪些技能在未来至关重要,哪些将被技术取代。同时,教育系统本身也不擅长快速纳入全新的教学内容。面对以大型语言模型为代表的新技术浪潮,教育者需要在拥抱技术赋能与坚守人类独特价值之间找到平衡,思考如何设计评估,才能真正衡量和培养那些让人类在未来社会中持续保有竞争力的核心能力。

010:数据与实验的毒性力量 🧪📊

在本节课中,我们将探讨教育领域中数据收集与实验的“毒性力量”。我们将审视学校(以麻省理工学院为例)收集学生数据的广度,讨论这些数据带来的机遇与风险,并分析在教育环境中进行随机实验的伦理与实践困境。


数据收集的广度与深度

上一节我们讨论了评估的陷阱,本节中我们来看看教育机构掌握学生数据的惊人规模。让我们以麻省理工学院(MIT)为例,进行一次思想实验:MIT可能拥有关于你的哪些数据?

以下是MIT可能收集的数据类别与示例:

  • 财务信息:家庭收入、个人收入、银行账户信息。
  • 健康记录:疫苗接种史、处方药记录、过敏信息、心理咨询记录、保险信息。
  • 身份与人口统计信息:社会安全号、性取向、性别认同、旅行记录(特别是国际旅行)。
  • 学术记录:成绩、课程注册信息、考试分数、在线学习平台(如Canvas)上的每一次点击、出勤记录。
  • 位置与活动数据:校园内住所、Wi-Fi设备连接记录、门禁刷卡记录、健身房使用记录、社团活动参与情况。
  • 通信与在线活动:全部电子邮件记录、VPN使用记录、Google Drive文件、在线注册信息。
  • 生活细节:洗衣频率(通过校园洗衣应用)、宿舍钥匙信息、宿舍检查记录、校园内购买历史(如通过学生卡消费)、包裹收发记录。

这些数据的颗粒度在过去十年发生了巨大变化。从1980年代仅有的成绩单和选课记录,到今天几乎涵盖所有在线和线下活动的海量数据。关键在于,这些数据不仅由学校直接持有,也通过授权给第三方服务提供商(如学习管理系统、洗衣应用)而间接存在。


数据的“毒性”与双重力量

“毒性”一词借用于安全研究员布鲁斯·施奈尔。他的论点是,有毒物质具有强大力量:化疗药物有毒,却能拯救生命;与之互动有时是好事,但它们也具危险性。核心观点是:不应让有毒物质长期闲置

将数据视为“有毒资产”:收集和存储大量数据本身存在风险。数据闲置越久,就越容易受到数据泄露、被恶意行为者利用等威胁。因此,更负责任的做法可能是只收集必要数据,并尽快处理掉其余部分。

然而,从教育研究者的视角看,这些海量数据也蕴含着巨大机遇。


数据赋能的研究机遇

以下是利用聚合数据可能实现的强大研究:

例如,一项关于挪威中学禁止手机的研究显示,禁令显著降低了女生因心理症状就医的比例,减少了男女生的欺凌现象,提高了女生成绩,并增加了她们进入学术高中轨道的可能性,对低社会经济背景学生效果尤为明显。

要完成此类研究,需要整合多种数据:学生成绩、升学去向、医疗系统就诊记录、年度幸福感与欺凌问卷调查数据。正是国家层面收集的这些庞大而详细的数据,使得我们能够进行复杂的分析,得出有意义的结论,从而可能改善学生的生活和学习成果。

这体现了数据的双重力量:既能用于有益的、亲社会的研究,也因其敏感性和聚合性而带有“毒性”风险。


教育环境中的随机实验

接下来,我们探讨在教育软件中进行随机实验的案例。2018年,教育出版巨头培生(Pearson)在其计算机科学学习软件中测试了“成长型思维”干预信息。

  • 实验设计:随机让一部分学生收到鼓励性的成长型思维消息(如“答错了,但继续努力,你会进步”),另一部分学生(控制组)则收到标准反馈。
  • 支持实验的观点
    1. 有研究基础表明成长型思维干预可能有效。
    2. 在特定产品、特定人群中测试效果,比直接全面推广更科学。
    3. 教育本身充满变化(教师不同教法、教材版本更新),随机实验只是将这种变化系统化,以便我们从中学习。随机分配是确保两组可比性、准确归因效果的最佳方法。
    4. 数字系统可以很好地实现随机化,确保无偏。
    5. 美国“通用规则”将“典型教育实践”研究列为豁免类别,允许在无需严格知情同意的情况下进行。
  • 反对与担忧
    1. 公平性质疑:如果干预有效,控制组学生则被剥夺了潜在益处,这不公平。
    2. 知情同意缺失:学生通常不知情,感觉被“监视”或“实验”,令人不安。
    3. 代表性疑虑:实验对象(如使用该软件的大学生)可能无法代表更广泛的学生群体。
    4. “操纵”感:“社会心理信息”的表述可能让人感觉像是在进行宣传或心理操纵。

这与我们日常使用的软件(如亚马逊、谷歌)持续进行A/B测试形成对比。这些测试是产品改进的核心,但人们对其“ creepiness”(诡异感)的容忍度似乎高于教育场景。这种差异可能源于教育的选择性(特别是K-12教育的强制性)、对儿童数据的更高敏感性,以及教育成果对人生的深远影响。


集中化数据管理的尝试与挑战

面对数据碎片化在各服务商手中的问题,曾有过集中化管理的尝试。2013年,由盖茨基金会等支持的 inBloom 项目启动。

  • 目标:建立一个非营利性中介,集中存储来自学校的学生数据,第三方服务商通过该平台获取所需数据,旨在解决数据分散、学校IT能力不足、隐私保护薄弱的问题。
  • 潜在优势
    1. 非营利实体可能比营利性公司更受信任。
    2. 专业机构在数据处理、安全和隐私保护上更专业。
    3. 可以精确控制向第三方提供的数据范围,最小化数据暴露。
  • 失败原因
    1. 时机与舆论:项目启动时(2013年),正值斯诺登事件后公众对数据监控高度敏感,远不如当今一代对数据收集“习以为常”。
    2. 叙事风险:“将所有孩子数据放在一个地方”的说法极易引发公众恐慌和反对,尽管现状(数据分散在各处且保护不力)可能更糟。
    3. 信任问题:与州教育机构合作,未能充分建立公众信任。来自家长(尤其是科技行业家长)和新兴的学生隐私倡导组织的强烈反对,导致各州相继退出。
    4. 注意力悖论:试图修复一个糟糕但未被注意的现状,反而会吸引对修复方案本身的审查和抵制。

inBloom的失败催生了许多州级学生隐私法律,但也留下了如何安全、有效管理教育数据的基础设施问题。


新的尝试:Safe Insights

2024年,一项新的尝试——Safe Insights——启动。它由美国国家科学基金会资助9000万美元,由莱斯大学(以开发开源教材OpenStax闻名)牵头。

  • 与inBloom的对比与演进
    1. 信任锚点:依托备受信任的研究型大学(莱斯大学)和国家科学基金会,而非基金会或州政府。
    2. 叙事转变:强调“生成见解”、“进行研究”,而非“数据仓库”。品牌名突出“安全”和“洞察”。
    3. 技术路径:可能采用“差分隐私”等技术,允许在不集中原始数据的情况下进行跨数据集查询,旨在实现聚合研究的好处,同时避免数据集中带来的风险。
    4. 合作伙伴:初期与多家数字学习平台(如Kahoot!)和教育机构合作,更具协作性和开放性。
    5. 聚焦群体:更侧重于高等教育(学生选择入学)和成人学习者,而非强制性的K-12教育,可能涉及更少的代理权争议。

Safe Insights的设计明显吸取了inBloom的教训,试图在数据效用与隐私保护、公众信任之间找到新的平衡点。它的成功与否,将取决于能否产出显著改善学习成果的研究,以及能否持续与公众、教育者进行透明沟通。


总结与前行之路

本节课中,我们一起学习了教育数据与实验的复杂性。我们认识到:

  1. 教育机构掌握着关于学生极其广泛和深入的数据,这些数据既有“毒性”(隐私和安全风险),也有强大力量(驱动有益研究)。
  2. 随机控制实验是评估教育干预效果的有力工具,但在教育环境中面临独特的伦理挑战(如公平性、知情同意)和公众接受度问题。
  3. 管理教育数据的基础设施建设充满挑战。inBloom的失败揭示了公众信任、叙事方式和时机的重要性。
  4. 新的尝试如Safe Insights,正试图通过不同的信任锚点、技术方案和沟通策略,重新探索这条道路。

最终,要缓解公众对数据收集和实验的“诡异感”,关键在于:产出能够明确、显著改善学习成果的研究证据,并持续进行透明、负责任的公众沟通。教育永远存在差异与变化,而系统化的数据收集与实验,或许是帮助我们理解何种变化真正有效的关键途径。


下一步:请开始着手你们的最终项目,并将思考延伸至教育科技在学校中的实施层面。我们将在下节课继续探讨相关议题。

posted @ 2026-03-29 09:22  绝不原创的飞龙  阅读(0)  评论(0)    收藏  举报