读天才与算法:人脑与AI的数学思维笔记24_预测性文本生成器

1. 起源

1.1. 人类讲故事可能起源于“假如……”这种问答结构

1.2. 讲故事是人类做安全试验的一种方式

1.2.1. 如果你问一个人“假如……”,其实是在探索你的行为对他可能带来的影响

1.3. 最早出现的故事极有可能就源自我们对在周遭混乱的环境中寻找某种秩序的渴望,想要在这个残酷无情的宇宙中找到自身存在的意义

1.3.1. 围坐在火堆旁分享当天的狩猎故事,可以帮助部落在第二天能获取更多的猎物

1.3.2. 智人力量上的短板,在部落的集体智慧中得到了弥补

1.3.3. 这种智慧的力量随着社交和分享的增加而增强

1.3.4. 营地的篝火点燃了人类创造力的火种

1.3.5. 这是一种早期的科学形式

1.4. 算法能不能构想出其他有趣的动物以便推动故事情节的发展?

1.4.1. 就像那些长有头、躯干和腿的动物一样,将不同事物的组成部分解构,然后再通过混合进行重构,就可以创造出千奇百怪的新事物

1.4.2. 这些具有奇技异能的新生物是促使新故事诞生的极佳催化剂

2. 预测性文本生成器

2.1. 到目前为止,大多数例子都基于自上而下的编程思想

2.1.1. 按照明确的规则,可随机填充单词的诗歌模

2.1.2. 将经典作品转换为新作品的代码

2.1.3. 通过编程获取数据并将其转化为故事的算法

2.1.4. 这些程序实际上并没有太多自由发挥的空间

2.2. 机器学习正在改变这一切

2.2.1. 算法可以从小说作者的所有作品中学习,探索他们的写作方式

2.2.2. 如果他们喜欢使用某个特定的词,这个词后面很可能会跟着其他出现频次高的词

2.2.3. 通过构建作者使用单词的概率图,算法可以生成该作者作品的续篇

2.2.4. 这就是预测性文本生成器的工作原理,其产出的文学作品既发人深省又引人入胜

3. Botnik

3.1. 一个名为“Botnik”的公司倡导使用机器学习来创造新文学

3.1.1. 一家研发人工智能自然语言技术的公司

3.1.2. 其致力于开发能与人协作的内容创作工具,即用人工智能挖掘人类的创造潜能

3.2. 该公司由作家杰米·布鲁(Jamie Brew)和《纽约客》(The New Yorker)前漫画编辑鲍勃·曼考夫(Bob Mankoff)于2016年创立

3.3. 算法有时会输出出人意料的超现实主义作品

3.3.1. Botnik为《宋飞正传》写出了精彩的剧本

3.3.2. Botnik还制作了一份感恩节食谱,并在YouTube上发布了一段视频,让人们了解如果把烹饪这件事交给算法

3.4. Botnik在学习了《哈利·波特》七卷丛书之后,生成了三页几乎可以以假乱真的续集

3.4.1. 有些时候,算法才是最纯粹的“天才”

3.5. Botnik确实可以从构建句子的方式中学习、辨认、识记,但其所捕捉到的只是这样一个事实存在:作者的写作风格

3.5.1. 只捕捉到了这一点:文本的局部,却没有从整体上考虑叙事结构

3.5.2. 就像爵士乐的“续作者”一样,它可以生成一些以假乱真的乐句,但最终还是难逃走向乏味、无聊和枯竭,因为算法不知道该继续向何处发展音乐

3.5.3. 小说家们很快就会失业是不大可能的

4. Scheherazade-IF

4.1. 2012年,乔治亚理工学院的马克·里德尔(Mark Riedl)和他的同事开发了一个会讲故事的算法“Scheherazade-IF”

4.1.1. 这个算法名字中的“Scheherazade”来源于王后山鲁佐德为暴虐的国王讲故事来安抚他的传说,她是一位优秀的故事讲述者

4.1.2. “IF”取自“Interactive Fiction”,意为交互式小说

4.2. 目标是在故事发展可能性的迷宫中找到一条更加连贯畅通的路径

4.3. 由于人类具备许多现实世界的知识,所以他们都是天生的、优秀的故事讲述者

4.4. 如果你要求Scheherazade-IF构建一个关于某个特定主题或情境的故事,而这个主题或情境它之前从未遇到过,那么它就会通过搜集和消化之前的故事来进行学习

4.5. Scheherazade-IF从由一大群人构成的大规模知识库中汲取新的信息并充分消化,再将这些范例汇总形成一个树状图,图中列出故事发展的各种可能方向

4.5.1. 好的故事讲述者,会在故事发展树状图中找到最佳的路径

4.5.2. 在很多故事情节会随玩家的选择而走向不同结局的开放性电脑游戏中,这种方法非常奏效

4.6. Scheherazade-IF正尝试通过它在网上收集到的数据,生成故事发展的可能性树状图,进而实现这一点

4.6.1. 它所做的选择获得的满意度得分可以与人类相媲美,远远高于随机生成的故事

5. Whim

5.1. What If Machine

5.2. 由欧盟资助的Whim(What If Machine)项目所试图解决的问题

5.2.1. 从网上搜罗以前的故事把它们重新组合在一起固然不错,但想象一下如果是前所未见的场景会有怎样的结果?

5.3. 作家在尝试创造新作品时面临的一个问题是,他们会卡在自己有限的固定思维模式里

5.3.1. Whim通过提供焕然一新的故事场景,把故事讲述者带出他们的舒适区

5.4. 由Whim生成的一个故事情节,最终促成了一部音乐剧于2016年在伦敦西区上演

5.4.1. 筛选算法分析音乐剧走红或惨败的原因,为Whim提供故事情节进一步发展的建议

5.4.2. 2016年春天,《飞越藩篱》在伦敦西区的艺术剧院进行了短暂的演出

5.4.2.1. 为完成这一作品,人类的干预可能和电脑的创造力一样多

6. 普洛普写手

6.1. PropperWryter

6.2. 在生成童话故事方面,另一个算法“普洛普写手”(PropperWryter)更胜一筹

6.3. 1928年,形式主义语言学家、民俗学家弗拉基米尔·普洛普(Vladimir Propp)在他的《故事形态学》里提出,俄国民间故事有31种叙事原型

6.4. “普洛普写手”把Whim提供的情节最终发展成为一个关于格林汉姆普通妇女反核运动的故事

6.4.1. 其音乐由另一个名为“机器人劳埃德·韦伯”(Android Lloyd Webber)的算法提供

7. “自动化”数学家

7.1. 数学家如果能提出诸如“假如……”这一类的问题,就意味着他距离突破知识边界已经只有一步之遥了

7.1.1. 假如有一个数的平方值为–1

7.1.2. 假如弯曲空间中,两条平行线可以相交

7.1.2.1. 黎曼几何

7.2. 打破固有的结构框架,从变化中探索有价值的新发现,是编写新的数学“故事”的经典工具

7.3. 如果数学是用数字讲述的故事,那么目前的算法在生成新的数学故事方面有多大的价值呢?

8. 整数序列在线百科全书

8.1. oeis dot org

8.2. 其目的旨在收集所有有趣的数列,并探索生成这些数列的公式或方法

8.3. 由素数(或者说除了1和它本身以外不再有其他因数的自然数)构成的数列

8.3.1. 对于该数列,很难找到一个通项公式来生成下一个数,这也是数学界公认的未解之谜之一

8.4. 可重分解因子数是一项由机器生成的发明

8.4.1. 可重分解因子数”(refactorable numbers)的概念,其定义为:数列中每个数字的因数个数,本身又是该数字的因数

8.4.2. 该数列中的奇数,被称为“奇数可重分解因子数”

8.4.2.1. odd refactorable numbers

8.4.3. 算法推测:所有的奇数可重分解因子数都是完全平方数

posted @ 2024-05-11 07:14  躺柒  阅读(17)  评论(0编辑  收藏  举报