随笔分类 - Python
摘要:最近参加了由CCF举办的数据挖掘比赛,主办方提供了csv格式的数据文件,由于中文显示乱码的问题,我先用txt文本编辑器将编码改为utf-8格式,但是在读取文件并输出读取结果时发生了问题,代码如下: 1 # -*- coding:utf-8 -*- 2 __author__ = 'Jz' 3 4 cs
阅读全文
摘要:今天安装Python的模块时,安装失败,提示信息:Python version 2.7 required, which was not found in the registry.原因在于Python在注册表中没有注册信息,需要手动添加: 1 # 2 # script to register Pyt...
阅读全文
摘要:最近参加比赛,写了一个垃圾短信识别器,在这里做一下记录。 官方提供的数据是csv文件,其中训练集有80万条数据,测试集有20万条数据,训练集的格式为:行号 标记(0为普通短信,1为垃圾短信) 短信内容;测试集的格式为: 行号 短信内容;要求输出的数据格式要求为: 行号 标记,以csv格式保存。 实现
阅读全文
摘要:有了上次利用python爬虫抓取糗事百科的经验,这次自己动手写了个爬虫抓取豆瓣电影Top250的简要信息。1.观察url首先观察一下网址的结构http://movie.douban.com/top250?start=0&filter=&type= :可以看到,问号?后有三个参数 start、filt...
阅读全文
摘要:今天使用python爬虫实现了自动抓取糗事百科的段子,因为糗事百科不需要登录,抓取比较简单。程序每按一次回车输出一条段子,代码参考了http://cuiqingcai.com/990.html 但该博主的代码似乎有些问题,我自己做了修改,运行成功,下面是代码内容: 1 # -*- coding:ut...
阅读全文
摘要:今天用Python写了个简单的爬虫程序,抓取虎扑篮球(nba.hupu.com)的首页内容,代码如下:1 #coding:gb23122 import urllib2, re3 webpage = urllib2.urlopen('http://nba.hupu.com')4 text = webp...
阅读全文
摘要:今天在使用Python的GUI平台wxPython时,写了一个只有打开、编辑、保存功能的简易笔记本,代码如下: 1 #coding:utf-8 2 import wx 3 4 def load(event): 5 f = open(FileName.GetValue()) 6 Co...
阅读全文
摘要:一.异常 Python遇到错误后会引发异常。若异常对象未被捕捉或处理,程序会回溯(traceback)来终止运行: 1 print 1 / 0 2 3 Traceback (most recent call last): 4 File "D:\coding_file\python_file\Test
阅读全文
浙公网安备 33010602011771号