随笔分类 -  Python

摘要:安装:pip install elasticsearch Python操作ES查询时,如search操作,源码:search(self, index=None, doc_type=None, body=None, params=None) 其中index,doc_type,body都好理解,与平时查 阅读全文
posted @ 2018-10-26 18:48 好奇的小明 阅读(4483) 评论(0) 推荐(0)
摘要:1.日志模块设置日志文件大小以及最大备份数量(使用了日志配置文件): 当日志文件超出大小后发现不会自动备份,系统报错,经分析日志文件处于占用状态,不能进行重命名,原因是由于logger添加了多个handler,如果改成一个handler即可进行备份了 2.使用多进程初始化同一日志模块,会导致日志备份 阅读全文
posted @ 2017-09-20 16:04 好奇的小明 阅读(1040) 评论(0) 推荐(0)
摘要:Python读取文件中的字符串已经是unicode编码,如:\u53eb\u6211,需要转换成中文时有两种方式 1.使用eval: 2.使用decode: unicodestr.decode('unicode_escape') # 将转义字符\u读取出来 # ’\u’开头就基本表明是跟unicod 阅读全文
posted @ 2017-04-20 13:41 好奇的小明 阅读(29132) 评论(0) 推荐(1)
摘要:from bs4 import BeautifulSoup import urllib2 html = urllib2.urlopen('http://tieba.baidu.com/p/5058456989') bsobj = BeautifulSoup(html.read(), "html.parser") # 不加"html.parser"会有警告。。。。 print bsobj.ti... 阅读全文
posted @ 2017-04-14 15:42 好奇的小明 阅读(200) 评论(0) 推荐(0)
摘要:Python爬虫遇到IOError或连接失败等将headers补充全尝试 爬取贴吧图片 Python爬取的网页read一次之后再次read会出问题,可将状态恢复至read前的状态 爬取贴吧帖子 Python连接数据库时出现 UnicodeEncodeError: 'latin-1' codec ca 阅读全文
posted @ 2017-04-13 11:41 好奇的小明 阅读(251) 评论(0) 推荐(0)
摘要:Python读取excel中的图片文件,并转成base64 阅读全文
posted @ 2017-04-01 18:07 好奇的小明 阅读(8267) 评论(0) 推荐(0)
摘要:1.提取中文与指定字符串 2. ValueError: Expecting ',' delimiter: 转json的时候出现此类错误,多是由于单双引号造成的,可以在sublime Text中查看要转json的内容,如果不可以正确转json,在sublime Text中会高亮显示,此时将不能正确转j 阅读全文
posted @ 2017-03-27 11:19 好奇的小明 阅读(310) 评论(0) 推荐(0)
摘要:抓取异常,Python缩进格式要求严格,与Java不同,可以理解Python中的缩进格式与Java的{}相当 Python循环跳出使用break 新建文件并输入文件内容 文件读取 选择功能 1 #!/usr/bin/env python 2 # coding:utf-8 3 'makeTextFil 阅读全文
posted @ 2017-02-08 10:05 好奇的小明 阅读(231) 评论(0) 推荐(0)