摘要: 信息的作用在于消除不确定性,自然语言处理的大量问题就是找相关信息。信息熵不仅是对信息的量化度量,而且是整个信息论的基础。它对于通信、数据压缩、自然语言处理都有很强的指导意义。通过阅读后对文中讲的搜索存储颇有感触,将url通过算法进行随机数编码,由之前的哈希存储变化为二进制数存储,不得不说这种做法对空间及时间方面的节约程度是极高的。这种思想也是我们平常常规很少会想到的,可以说也是一种启发。 阅读全文
posted @ 2013-08-29 22:08 Gdreamlend 阅读(177) 评论(0) 推荐(0)
摘要: 隐含马尔可夫模型最初应用于通信领域,继而推广到语言和语言处理中,成为连接自然语言处理和通信的桥梁。同时,隐含马尔可夫模型也是机器学习主要工具之一。和几乎所有的机器学习的模型工具一样,它需要一个训练算法(鲍姆-韦尔奇算法)和使用时的解码算法(维特比算法),掌握了这两类算法,就基本上可以使用隐含马尔可夫模型这个工具了。 阅读全文
posted @ 2013-08-29 17:23 Gdreamlend 阅读(120) 评论(0) 推荐(0)