数学之美感想1

  数学之美以浅显易懂的方式向我讲述了很多现在前沿性的问题。为我阐释了很多复杂的问题其实很简单,分成几个阶段,然后每个阶段再仔细研究。

     从文字和语言vs 数字和信息中两者之间的联系。都是用来记载信息的。用于交流的。

     自然语言处理和通信方式的相同,从规则的计算的复杂性然后转到统计规则的必然,然后统计中如何选取更好的模版。

     统计语言模型先用大方面介绍了选取概率比较的大的结果,然后是条件概率,并且对概率小于一定阀值的概率事件做平滑处理。

     然后接着谈到中文分词,具体到了中文分词中的概率统计。提出了一个词的颗粒性概念。

     隐含马尔可夫模型,通信中的一个模型,用到了自然语言处理,这个是从编码到解码的统计概率模型。

     接下来介绍到了信息的度量和作用,这个就介绍到了信息论的基础创立。和bit或者说字节的创立的重要性

     接下来是介绍了贾里尼克的贡献,在现代语言处理中灵活的运用了隐含马尔尼克的模型解决自然语言的处理。

    接下来开始介绍到了搜索引擎中的大概技术,包括最基本的布尔代数,还有下载,索引,排序。这三个作者总结的搜索中的过程,

     然后接着下载中,介绍到了图论和网络爬虫的概念。网络爬虫中不是简单的BFS也不是简单的DFS。不同情况下采取不同的处理方案。哈希表在大服务器中的用处就体验到了,先优先下载各个网站的首页,这里是BFS的问题,然后是首页中的链接,然后又是BFS。但是从首页到其子网站是DFS算法,这里是一个综合起来的状况,这里面有比较复杂的优先级队列来存储首页和子网站的位置,因为下载中首页和子网站需要有个通信握手的协议的存在,所以会影响到这个队列的优先级设定问题,所以这里的优先级或者说调度系统会比较复杂。

   

posted @ 2012-08-05 22:45  gui__li  阅读(209)  评论(0编辑  收藏  举报