摘要: 在本节中,我们会讨论序列的长度是变化的,也是一个变量 we would like the length of sequence,n,to alse be a random variable 一个简单的解决方案是,我们经常定义define Xn=STOP,STOP是一个特殊的标志(where STOP is a special symbol) 在了解了上述的定义之后,我们像上一节当中... 阅读全文
posted @ 2013-07-14 23:35 createMoMo 阅读(486) 评论(0) 推荐(0) 编辑
摘要: 在0-1中提到了,当最终output的p=0时,这个时候模型无法正常使用,为了解决这个问题,在0-4中会有所提及。在本节中,其实,计算概率的时候,我们应该假设某一个位置的词与它前面的所有词都是相关的,但是,如果我们这样计算的话,可以计算出来,计算量是相当大的。例如在p(x1,x2,x3…xn)中,x是集合V中的一个单词,假设v的大小为|v|,也就是说(x1,x2…xn)就一共有|v|的n次方中可能。提出了马尔可夫过程来解决。在计算P的时候,实际上我们给出了一个独立性假设,这个独立性假设就是说所有的随机变量只于它前面的随机变量条件相关。其实不难理解:假设,有一串随机的变量X1,X2,…XN.(a 阅读全文
posted @ 2013-07-14 21:47 createMoMo 阅读(1002) 评论(0) 推荐(0) 编辑
摘要: 在对语言建模之前,先来说明一些基本的简单的概念。我们假设:有这样一个集合,在这个集合里面,是我们所有的涉及到的单词集,并且这个单词的集合是有限的(finite)。为了表示这个集合,用字母V来表示,例如V={the,a,man,telescopo,Beckham,two…}有了单词的集合,然后还需要有一个单词串的集合,为了更形象的解释,比如:the STOPa STOPthe fan STOPthe fan saw Beckham STOPthe fan saw saw STOPthe fan saw Beckham play for Real Madrid STOP…这个单词串的集合使用V+来 阅读全文
posted @ 2013-07-14 21:18 createMoMo 阅读(303) 评论(0) 推荐(0) 编辑
摘要: 【根据公开课的讲义整理】 自然语言处理如这个图中所表示的。作为一台计算机,要理解我们人类的语言。也就是understanding(NLU)。当计算机懂的我们的语言之后,变回给我们回应,像与我们对话一样,再生成我们可以接受的语言。generation(NLG)。 在自然语言处理方面,有哪些例子? 那么,在自然语言处理方面,有什么经典的例子呢? 比如: 机器翻译,现在市场上见到的谷歌翻译... 阅读全文
posted @ 2013-07-14 19:35 createMoMo 阅读(516) 评论(0) 推荐(0) 编辑