2018 年 1月 11 日随笔档案 - 一只宅男的自我修养

2018年1月11日

Ubuntu 16.04出现：Problem executing scripts APT::Update::Post-Invoke-Success 'if /usr/bin/test -w /var/cache/app-info -a -e /usr/bin/appstreamcli; then appstreamcli refresh > /dev/null; fi'

摘要：转自：http://www.cnblogs.com/EasonJim/p/7343892.html Reading package lists... Done E: Problem executing scripts APT::Update::Post-Invoke-Success 'if /usr 阅读全文

posted @ 2018-01-11 15:51 一只宅男的自我修养阅读(300) 评论(0) 推荐(0)

python发邮件

摘要： #!/usr/bin/env python # -*- coding:utf-8 -*- a="18265068511@163.com" b="公司" c="abc009" #pop3要开启 d="702628045@qq.com" e="xiao被" f="招聘" g="您好，您已经被录取" def you_xiang(a,b,c,d,e,f,g): import smt... 阅读全文

posted @ 2018-01-11 14:44 一只宅男的自我修养阅读(160) 评论(0) 推荐(0)

糗事百科爬虫

摘要： python 2.7#coding:utf-8 import urllib2 import re class Tools(object): remove_n=re.compile(r'\n') replace_br = re.compile(r'|') remove_ele = re.compile(r'', re.S) def replace_rs(sel... 阅读全文

posted @ 2018-01-11 14:16 一只宅男的自我修养阅读(279) 评论(0) 推荐(0)

链接爬虫

摘要：（1）确定好要爬取的入口链接（2）根据需求构建好链接提取的正则表达式（3）模拟成浏览器并爬取对应网页（4）根据（2）中的正则表达式提取出该网页中包含的链接（5）过滤掉重复的链接（6）后续操作阅读全文

posted @ 2018-01-11 13:16 一只宅男的自我修养阅读(384) 评论(0) 推荐(0)

简单图片爬虫

摘要：爬取过程，首先通过urllib.request.urlopen(url).read(),读取对应网页的全部源代码，然后根据上面的第一个正则表达式进行第一次信息过滤，过滤完成后，进行第二次过滤，找出所有目标的图片链接，将这些链接地址存储到一个列表中，然后遍历该列表，并将对应链接通过urllib.req 阅读全文

posted @ 2018-01-11 11:15 一只宅男的自我修养阅读(241) 评论(0) 推荐(0)

常见的非贪婪匹配

摘要： *? 重复任意次，但尽可能少重复 +? 重复1次或更多次，但尽可能少重复 ?? 重复0次或1次，但尽可能少重复 {n,m}? 重复n到m次，但尽可能少重复 {n,}? 重复n次以上，但尽可能少重复阅读全文

posted @ 2018-01-11 11:04 一只宅男的自我修养阅读(199) 评论(0) 推荐(0)

一只宅男的自我修养

公告