《数学之美》总结

总结

最近看的书总感觉是命运的指引,比如前几天刚对接了nodejs的RSA签名和验签,这本书就讲了RSA算法的公钥和私钥原理是基于“费马小定理”来实现,好神奇。

伽利略说过:“数学是上帝描写自然的语言”。
爱因斯坦说过:”纯数学使我们能够发现概念和联系这些概念的规律,这些概念和规律给了我们理解自然现象的钥匙。”

生命的本质是化学,化学的本质是物理,物理的本质是数学,数学的魅力就在于能将复杂的问题简单化。
还是那个观点,任何东西到最后拼的都是数学和哲学,小到所谓的管理,大到牛逼的人工智能,无一例外。

得益于之前学习数据分析、机器学习、人工智能、大数据或云计算的资料中都已经接触过书中大部分的数学原理,并且还是有代码实战的教程,再看这本书的时候非常顺畅。

整本书从外行的角度来普及了很多ABC(Ai、Big Data、Cloud Computing )背后的数学概念及原理,例如马尔可夫模型、隐含马尔可夫模型、分词、信息熵、条件概率、互信息、相对熵、PageRank算法、TF-IDF计算相关性、余弦定理计算向量夹角、贝叶斯网络、人工神经网络等等,已经尽可能深入浅出其中原理,用作者本人的话就是:一个技术或者问题有”术“和“道”之分,这本书比较偏向“道”。

顶尖的高手总是能用最简单的大白话深入浅出地把大道理讲给外行听,而不是故弄玄虚把简单的问题复杂化,比如霍金的《时间简史》、薛定谔的《生命是什么》。

整体来说是非常值得看的一本书,比较注重心法的传授,虽然看完不会有实质性的技术提高,但是会让你有如沐春风、任督二脉被打通的感觉,教你带着新的视野去重新理解世界。
收货良多,同时也被吴军老师的知识广度和深度所折服,优秀的人总是不仅仅局限在工作相关的东西,吴军老师世界史如数家珍,做过那么多顶尖的项目,对机器学习、神经网络、自然语言处理等各种涉及算法理解得这么深刻,关键还能这么简单直白且不带任何装逼色彩地讲解,着实让人敬佩。

数学不仅仅是枯燥的考试题,而是人类理解世界最重要的一种工具,能够化繁为简、四两拨千斤,而简单即是美,所以数学也很美,5星推荐。

笔记

文字

象形文字

正如动物园里的动物经常发出他们喜欢的怪叫声一样,早期的人类也会用这样含糊不清的声音来简单的交流,因为早期人类了解和需要传播的信息是很少的,并不需要语言和数字。
随着人类的进步和文明化的进展,需要表达的信息也越来越多,不再是几种不同的声音就能覆盖,语言就此产生了。
当语言和词汇多到一定程度,人类仅靠大脑已经记不住所有的词汇了,于是,高效记录信息的需求就产生了:文字。
在中国的甲骨文出现还要早几千年,尼罗河流域就已经有了高度的文明,古埃及人发明了最早保存信息的方式——象形文字。
我们对5000年前的埃及的了解远比1000年前的玛雅文明要多得多,原因就是埃及人通过文字记录了他们生活中最重要的信息,可见文字的重要性。

楔形文字

楔形文字由美索不达米亚的苏美尔人所创,每个不同的楔子其实是不同的字母,这些文字其实是拼音文字,楔形文字是这个星球上最古老的拼音文字。
拼音文字由腓尼基人从美索不达米亚带到地中海东岸的叙利亚,因为不愿意花大量时间雕刻这些漂亮的楔形字母,将它们简化成了22个字母。这些字母随着腓尼基人传到了希腊人的祖先。
拼音文字在古希腊得到了充分的发展,和古巴比伦的楔形字母已经不同,古希腊文字母的拼写和读音已经紧密地结合起来了,这种语言相对容易学习。

从象形文字到拼音文字是一个飞跃,人类在描述物体的方式上,从外表进化到了抽象的概念,同时不自觉地采用了对信息的编码。
常用字短,生僻字长,这完全符合信息论中的最短编码原理。

数字

掰指头

早期的数字并没有快写的形式,人们用的是掰指头,而人有十根手指,所以这就是我们今天使用十进制的原因。
具有书写形式的数字和象形文字应该诞生于距今有几千年的同一时期,几乎所有的早期文明对于数字都是几横(中国)、几竖(罗马)或几个楔子点(美索不达米亚),这是象形文字的典型特征。
数字在早期只是承载信息的工具,并不具有任何抽象的含义。

进制出现

后来,人们发现十个手指不够用了,发明了进位制,人类开始懂得对数量进行编码了,这是人类的一大飞跃。
几乎所有的文明都采用了十进制,而唯独玛雅文明使用的是二十进制,也就是说他们手指+脚指合在一起用来计算了。
玛雅文明称一个世纪为太阳纪,是400年,2012年正好是太阳纪的最后一年。

解码不同

在中国,解码的规则是乘法,比如200万表示为2x100x10000
在罗马,解码的规则是加减法,小数字出现在大数字左边有减,右边为加,比如IV表示5-1=4,VII表示5+2=7,IIXX表示20-2=18。
罗马这个规则 不仅复杂,而且很难表示非常大的数字和分数 ,如果有写个1000万,得写一堆。
从编码的有效性来讲,中国人的做法是比罗马人更高级的。

二进制

二进制的历史很早,中国古代的阴阳学说可以认为是最早二进制雏。而二进制作为一个计数系统,则是由公元前2到5世纪的印度学者完成,但是他们没有使用0和1计数。
到了17世纪,德国伟大的数学家莱布尼兹进一步冠状了二进制,并且用0和1两个数字表示,成为我们今天使用的二进制。
二进制可以表示逻辑的“是”与“非”。

布尔代数

布尔代数是针对二进制的运算:与、或、非。
布尔代数对于数学的意义等同于量子力学对物理学的意义,它们将我们对世界的认识从连续状态扩展到离散状态。
在布尔代数的世界里,万物都是可以量子化的。

天文学

天文学起源于古埃及,由于尼罗河的洪水每年泛滥一次,尼罗河下游有着十分肥沃而且灌溉方便的土地,由此孕育出人类最早的农业文明。每当洪水过后,埃及人就在退洪的土地上碳水化合物,然后便可以获得很好的收成。
为了准确预测到洪水的到来和退去的时间,6000年前的埃及人发明了天文学。

到了人类文明的第二个中心美索不达米亚兴起的时候,古巴比伦人对天文学有了进一步的发展,他们的历法中有了月和四季的概念。同时他们观测到了五大行星不是简单地围绕地球转动,而是波浪形地运动。

真正创立我们今天意义的天文学,并且计算出诸多天体运行轨迹的是近2000年前古罗马时代的克罗狄斯·托勒密,“地心说”的集大成者,托勒密在天文学上的地位堪比欧几里何之于几何学,牛顿之于物理学。

中国古代著名天文学家张衡提出的浑天说,其实就是地心说,但是张衡并未进行定量地描述。

托勒密的伟大之处就是用40-60个在大圆上套小圆的方法,精确地计算出了所有行星运行的轨迹。
精度之高,让后来所有的科学家都惊叹不已,即使今天在计算机的帮助下,我们也很难解出40人套在一起的圆的方程。

其他

  • 怀特兄弟发明飞机靠的是空气动力学,不是仿生学。
  • 马尔可夫链:把s1,s2,s3...st看成是北京每天的气温,马尔可夫为了简化问题,提出了一种简化的假设,即随机过程各个状态st分布只与它的前一个状态st-1有关,符合这个假设的随机过程称为马尔可夫链。
  • 隐含马尔可夫链:马尔可夫链的一个扩展,任一时刻的st的状态是状态是不可见的,观察者没法通过观察到一个s1,s2,s3...st来推测状态转移概念参数。
  • 信息量就等于不确定性的多少
  • 信息的作用在于消除不确定性,自然语言处理的大量问题就是寻找相关的信息。
  • 知道的信息越多,随机事件的不确定性就越小
  • 互信息是两个随机事件“相关性”的度量
  • 相对熵用来衡量相关性,但和变量的互信息不同,用来衡量两个取舍为正的函数的相似性。
  • 信息熵的物理含义是对一个信息系统不确定性的度量,它和热力学中熵的概念类似,因为后者是一个系统无序度的度量,也是对一种不确定性的度量
  • TF-IDF的概念被公认为信息检索中最重要的发明。在搜索、文献分类和其他相关领域有着广泛的应用。
  • 在计算机领域,一个好的算法应该像AK-47一样,简单、有效、可靠性好而且容易读懂(或者说易操作)
  • 辛格认为,计算机不必学习人的做法,就如同飞机不必像鸟一样飞行。
  • 数学、文字和自然语言一样,都是信息的载体,它们之间原来有着天然的联系。
  • 语言和数学的产生都是为了同一个目的——记录和传播信息。
  • 直到半个世纪前香农博士提出信息论,人们才开始把数学和信息系统自觉地联系起来。

说实话虽然是科普性质的书,如果完全没有相关经验或写过代码的话,会吃力一点,比如书中说的很多类似图论、广度优先搜索、深度优先搜索这样的概念,即使是写过代码实现的过了很久都会忘,行业外人士应该会觉得更抽象难懂。

posted @ 2020-08-18 01:31  雪山飞猪  阅读(47)  评论(0编辑  收藏