python(36):python日志打印,保存,logging模块学习
摘要:1.简单的将日志打印到屏幕 默认情况下,logging将日志打印到屏幕,日志级别为WARNING;日志级别大小关系为:CRITICAL > ERROR > WARNING > INFO > DEBUG > NOTSET,当然也可以自己定义日志级别。 2.通过logging.basicConfig函数
阅读全文
posted @
2017-03-23 11:13
细雨微光
阅读(2904)
推荐(0)
python(38):sys.argv,sys.argv.pop(),获取用户的外部输入,非指定
摘要:python 传参 见下面的例子(一): # /usr/bin/env python # coding=utf8 import os import requests import sys if __name__ == "__main__": print len(sys.argv) if len(sy
阅读全文
posted @
2017-03-22 15:08
细雨微光
阅读(1039)
推荐(0)
python(33)多进程和多线程的区别
摘要:多线程可以共享全局变量,多进程不能。多线程中,所有子线程的进程号相同;多进程中,不同的子进程进程号不同。 运行结果 ('Main:', 3142)('thread', 3142)('thread', 3142)('thread', 3142)('thread', 3142)('thread', 31
阅读全文
posted @
2017-02-28 11:42
细雨微光
阅读(382)
推荐(0)
python(34):为什么在Python里推荐使用多进程而不是多线程?
摘要:最近在看Python的多线程,经常我们会听到老手说:“Python下多线程是鸡肋,推荐使用多进程!”,但是为什么这么说呢? 要知其然,更要知其所以然。所以有了下面的深入研究: 首先强调背景: 1、GIL是什么? GIL的全称是Global Interpreter Lock(全局解释器锁),来源是py
阅读全文
posted @
2017-02-28 11:35
细雨微光
阅读(4061)
推荐(0)
python(32):多进程(2) multiprocessing
摘要:python 多线程:多线程 由于Python设计的限制(我说的是咱们常用的CPython)。最多只能用满1个CPU核心。 Python提供了非常好用的多进程包multiprocessing,你只需要定义一个函数,Python会替你完成其他所有事情。借助这个包,可以轻松完成从单进程到并发执行的转换。
阅读全文
posted @
2017-02-28 11:22
细雨微光
阅读(724)
推荐(0)
python(31) enumerate 的用法
摘要:例子一: b = "abcd" kv_dict = {} pre = 1234 for i, v in enumerate(b): kv_dict['%s-%d.jpg' %(pre, i)] = v print kv_dict 结果:{'1234-2.jpg': 'c', '1234-0.jpg'
阅读全文
posted @
2017-02-07 20:08
细雨微光
阅读(300)
推荐(0)
python(30) 获取网页返回的状态码,状态码对应问题查询
摘要:获取访问网页返回的状态码 以下内容来自于维基百科:点击查看网页 1xx消息 这一类型的状态码,代表请求已被接受,需要继续处理。这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。由于HTTP/1.0协议中没有定义任何1xx状态码,所以除非在某些试验条件下,服务器禁止向此类客户端发送
阅读全文
posted @
2017-01-06 15:05
细雨微光
阅读(11549)
推荐(0)
python(29)强大的zip函数
摘要:zip函数:它是python的内建函数,(与序列有关的内建函数有:sorted()、reversed()、enumerate()、zip()),其中sorted()和zip()返回一个序列(列表)对象,reversed()、enumerate()返回一个迭代器(类似序列) 代码一: 代码二: 代码三
阅读全文
posted @
2017-01-05 20:28
细雨微光
阅读(355)
推荐(0)
python(28)获得网卡的IP地址,如何在其他文件夹中导入python模块
摘要:获得第几块网卡的ip地址: 如何在其他文件夹中导入模块 获取网卡的IP地址和后缀:
阅读全文
posted @
2017-01-05 14:34
细雨微光
阅读(246)
推荐(0)
python(27)requests 爬取网页乱码,解决方法
摘要:最近遇到爬取网页乱码的情况,找了好久找到了种解决的办法: 头文件中添加:
阅读全文
posted @
2016-10-20 17:33
细雨微光
阅读(698)
推荐(0)
python(26)查看文件的大小
摘要:有时候,在写文件的时候需要判断文件的大小,或者删除空的文件
阅读全文
posted @
2016-10-20 17:24
细雨微光
阅读(3476)
推荐(0)
python(24)下载文件
摘要:利用程序自己编写下载文件挺有意思的。Python中最流行的方法就是通过Http利用urllib或者urllib2模块。当然你也可以利用ftplib从ftp站点下载文件。此外Python还提供了另外一种方法requests。 来看看三种方法是如何来下载zip文件的:
阅读全文
posted @
2016-09-27 14:28
细雨微光
阅读(643)
推荐(0)
python(24)urlencode和urldecode
摘要:当url地址含有中文,或者参数有中文的时候,这个算是很难正常了,但是把这样的url作为参数传递的时候(最常见的callback),需要把一些中文甚至‘/’做一下编码转换。 一、urlencode urllib库里面有个urlencode函数,可以把key-value这样的键值对转换成我们想要的格式,
阅读全文
posted @
2016-09-19 18:02
细雨微光
阅读(523)
推荐(0)
python(23)re函数:compile、match、search、findall
摘要:正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个模式字符串和可选的标志参数生成一个正则表
阅读全文
posted @
2016-08-18 19:32
细雨微光
阅读(2558)
推荐(0)
python(22)总结下最近遇到的编码问题
摘要:最近爬取,或者解析网页是总是遇到编码问题(我的版本:python2.7) 一、常见异常:UnicodeEncodeError: 'ascii' codec can't encode character u'\xb4' in position 0: ordinal not in range(128)
阅读全文
posted @
2016-08-17 15:18
细雨微光
阅读(462)
推荐(0)
什么是词干化处理
摘要:词干化处理: 在NLP中,我们对一句话或一个文档分词之后,一般要进行词干化处理。词干化处理就是把一些名词的复数去掉,动词的不同时态去掉等等类似的处理。 对于切词得到的英文单词要进行词干化处理,主要包括将名词的复数变为单数和将动词的其他形态变为基本形态。对动词的词干化可以使用 Porter 算法[5]
阅读全文
posted @
2016-08-11 14:55
细雨微光
阅读(2480)
推荐(0)
python(21)实现多进程(1)
摘要:参考链接:http://www.cnblogs.com/kaituorensheng/p/4445418.html python多进程:multiprocessing python中的多线程其实并不是真正的多线程,如果想要充分使用多核cpu的资源,在python中大部分情况下还是多进程。Python
阅读全文
posted @
2016-08-11 10:57
细雨微光
阅读(579)
推荐(0)
pycharm 格式化代码
摘要:有时候将空格键和tab键混用,在windows上没什么事情,但是如果移动到linux就会有问题,所以我们在移动到linux上之前要先格式化一下代码: ctrl+alt+L可以格式化,但是和锁屏快捷键冲突。 也可以,先选中代码,使用快捷键 ctrl+alt+i 。
阅读全文
posted @
2016-08-04 20:58
细雨微光
阅读(19208)
推荐(0)