摘要: 转自:http://www.cnblogs.com/EasonJim/p/7343892.html Reading package lists... Done E: Problem executing scripts APT::Update::Post-Invoke-Success 'if /usr 阅读全文
posted @ 2018-01-11 15:51 一只宅男的自我修养 阅读(297) 评论(0) 推荐(0)
摘要: #!/usr/bin/env python # -*- coding:utf-8 -*- a="18265068511@163.com" b="公司" c="abc009" #pop3要开启 d="702628045@qq.com" e="xiao被" f="招聘" g="您好,您已经被录取" def you_xiang(a,b,c,d,e,f,g): import smt... 阅读全文
posted @ 2018-01-11 14:44 一只宅男的自我修养 阅读(159) 评论(0) 推荐(0)
摘要: python 2.7#coding:utf-8 import urllib2 import re class Tools(object): remove_n=re.compile(r'\n') replace_br = re.compile(r'|') remove_ele = re.compile(r'', re.S) def replace_rs(sel... 阅读全文
posted @ 2018-01-11 14:16 一只宅男的自我修养 阅读(278) 评论(0) 推荐(0)
摘要: (1)确定好要爬取的入口链接 (2)根据需求构建好链接提取的正则表达式 (3)模拟成浏览器并爬取对应网页 (4)根据(2)中的正则表达式提取出该网页中包含的链接 (5)过滤掉重复的链接 (6)后续操作 阅读全文
posted @ 2018-01-11 13:16 一只宅男的自我修养 阅读(382) 评论(0) 推荐(0)
摘要: 爬取过程,首先通过urllib.request.urlopen(url).read(),读取对应网页的全部源代码,然后根据上面的第一个正则表达式进行第一次信息过滤,过滤完成后,进行第二次过滤,找出所有目标的图片链接,将这些链接地址存储到一个列表中,然后遍历该列表,并将对应链接通过urllib.req 阅读全文
posted @ 2018-01-11 11:15 一只宅男的自我修养 阅读(241) 评论(0) 推荐(0)
摘要: *? 重复任意次,但尽可能少重复 +? 重复1次或更多次,但尽可能少重复 ?? 重复0次或1次,但尽可能少重复 {n,m}? 重复n到m次,但尽可能少重复 {n,}? 重复n次以上,但尽可能少重复 阅读全文
posted @ 2018-01-11 11:04 一只宅男的自我修养 阅读(197) 评论(0) 推荐(0)