2015年3月9日

摘要: 开始总是乱码,该设置的都设置了,后来用charde检测编码也一直报错,之后重启了pycharm就好了,乱码问题也没了 阅读全文
posted @ 2015-03-09 22:33 长456风 阅读(233) 评论(0) 推荐(0)
摘要: # -*- coding: utf-8 -*-import chardetimport urllib#可根据需要,选择不同的数据 TestData = urllib.urlopen('http://www.baidu.com/').read() try: print chardet.d... 阅读全文
posted @ 2015-03-09 22:26 长456风 阅读(139) 评论(0) 推荐(0)
摘要: Python模块安装方法 一、方法1: 单文件模块 直接把文件拷贝到 $python_dir/Lib 二、方法2: 多文件模块,带setup.py 下载模块包,进行解压,进入模块文件夹,执行: python setup.py install (先要配置环境变量,打开cmd执行命令)... 阅读全文
posted @ 2015-03-09 22:21 长456风 阅读(204) 评论(0) 推荐(0)
摘要: class Clawer(): headers = { 'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6' } ... 阅读全文
posted @ 2015-03-09 21:00 长456风 阅读(109) 评论(0) 推荐(0)
摘要: 编码一直都是一个很让人头疼的问题,尤其是在python里面。花了几天时间,终于把这个问题给弄明白了。 一,什么是编码,编码过程是怎样的?常见的编码方式有哪些? 编码是从一个字符,比如‘哈’,到一段二进制码流的过程。解码是从一段二进制码流到一个字符的过程。 在编码的过程中,会涉及到三个名词:字符... 阅读全文
posted @ 2015-03-09 20:54 长456风 阅读(233) 评论(0) 推荐(0)
摘要: ipath = 'D:/学习/语料库/SogouC.mini/Sample/C000007/10.txt'uipath = unicode(ipath , "utf8") 阅读全文
posted @ 2015-03-09 18:26 长456风 阅读(204) 评论(0) 推荐(0)
摘要: 方法一:使用codecs import codecs f = codecs.open('nlpir/Readme.txt','r','GBK')line = f.readline()while line: print line, line = f.readline()f.close... 阅读全文
posted @ 2015-03-09 09:48 长456风 阅读(344) 评论(0) 推荐(0)

导航