2012年7月9日

摘要: 如果 S 表示一连串特定顺序排列的词 w1, w2,..., wn ,换句话说, 可以表示某一个由一连串特定顺序排练的词而组成 S的一个有意义的句子。 现在, 机器对语言的识别从某种角度来说,就是想知道 S 在文本中出现的可能性, 也就是数学上所说的 S 的概率用 P(S) 来表示。利用条件概率的公式,S 这个序列出现的概率等于每一个词出现的概率相乘,于是 P(S) 可展开为:P(S) = P(w1)P(w2|w1)P(w3| w1 w2)...P(wn|w1 w2...wn-1)。其中 P (w1) 表示第一个词 w1 出现的概率;P(w2|w1) 是在已知第一个词的前提下,第二个词出现的. 阅读全文
posted @ 2012-07-09 22:00 蓝色守望 阅读(135) 评论(0) 推荐(0)
摘要: 使用已有的cookie访问网站import cookielib, urllib2ckjar =cookielib.MozillaCookieJar(os.path.join(’C:\Documents andSettings\tom\ApplicationData\Mozilla\Firefox\Profiles\h5m61j1i.default’, ‘cookies.txt’))req = urllib2.Request(url, postdata, header) req.add_header(’User-Agent’, \ ‘Mozilla/4.0 (compatible; MSIE 6 阅读全文
posted @ 2012-07-09 17:31 蓝色守望 阅读(225) 评论(1) 推荐(0)

导航