随笔分类 - Python
摘要:这篇真的写的很棒,用心领会吧!怎样写一个拼写检查器Peter Norvig翻译:Eric You XU上个星期, 我的两个朋友 Dean 和 Bill 分别告诉我说他们对 Google 的快速高质量的拼写检查工具感到惊奇. 比如说在搜索的时候键入 [speling], 在不到 0.1 秒的时间内, Google 会返回: 你要找的是不是 [spelling]. (Yahoo! 和 微软也有类似的功能). 让我感到有点奇怪的是我原想 Dean 和 Bill 这两个很牛的工程师和数学家应该对于使用统计语言模型构建拼写检查器有职业的敏感. 但是他们似乎没有这个想法. 我后来想了想, 他们的确没什么理
阅读全文
摘要:这是一篇介绍NLTK的文章,原载于这里,值得一看,唯一不足之处在于作者对于一些名词的解释略显业余,同时对于最新版的NLTK,我们在代码上的实现和原文上还是有些出入的。原文见下: 在本期文章中,David 向您介绍了自然语言工具包(Natural Language Toolkit),它是一个将学术语言技术应用于文本数据集的 Python库。称为“文本处理”的程序设计是其基本功能;更深入的是专门用于研究自然语言的语法以及语义分析的能力。 鄙人并非见多识广,虽然写过很多关于 文本处理 方面的东西(例如,一本书),但是,对我来说, 语言处理(linguistic processing) 是一个相对..
阅读全文
摘要:简介:urllib2是python的一个获取url(Uniform Resource Locators,统一资源定址器)的模块。它用urlopen函数的形式提供了一个非常简洁的接口。这使得用各种各样的协议获取url成为可能。它同时 也提供了一个稍微复杂的接口来处理常见的状况-如基本的认证,cookies,代理,等等。这些都是由叫做opener和handler的对象来处理的。以下是获取url最简单的方式:import urllib2response = urllib2.urlopen(‘http://rootexp.com/’)html = response.read()许多urlib2的使用都
阅读全文
摘要:python版本3.2.1:对网上针对input()和raw_input()的区别做了测试。input()和raw_input()都可以从控制台读入数据,不同的是input()在读入数据为数字时会返回数据的类型如:int,float;而raw_input()在读入数据时会返回string类型。关于以上说法做了测试,测试结果如下:>>> i=input()1>>> type(i)<class 'str'>>>> i'1'关于input()会计算字符串中数字表达式的值做了下测试,测试结果如下:>
阅读全文
摘要:原型:round(flt, ndig=0) 接受一个浮点数 flt 并对其四舍五入,保存 ndig位小数。若不提供ndig 参数,则默认小数点后0位。round()仅用于浮点数。(译者注:整数也可以, 不过并没有什么实际意义)test:>>> round(3.1415926,2)3.14>>> round(3.1415926)#默认为03>>> round(3.1415926,-2)0.0>>> round(3.1415926,-1)0.0>>> round(314.15926,-1)310.0其实就是调
阅读全文
摘要:python2.5之前不支持C/C++中x=(y>1 ? 1 : 2)这类三元运算符可以借组tuple元组实现:>>> number=int(input())1>>> res=(-number,number)[number>0]>>> res1>>> number=-1>>> res=(-number,number)[number<0]>>> res-1>>> res=(-number,number)[number>0]>>>
阅读全文
摘要:单引号,双引号,三引号引起的的字符串是没区别的>>> "1"=='1'True>>> '''1'''=='1'True>>> '''1'''=="1"True字符串加法拼接两个字符串;字符串乘法将字符串重复所乘数字。>>> 'ab'+'cd''abcd'>>> 'ab'*3
阅读全文

浙公网安备 33010602011771号