2019年8月28日
摘要: ''' 爬取中国每个省份的大学名称和官网地址'''import requestsfrom lxml import etreeclass School(object): def __init__(self): self.headers = { "User-Agent": "Mozilla/5.0 (W 阅读全文
posted @ 2019-08-28 19:07 Yihan_07 阅读(343) 评论(0) 推荐(0) 编辑
摘要: ''' 利用greenlet实现多个任务的切换'''from greenlet import greenletdef f1(): print('1') gr2.switch() print('3')def f2(): print('2') gr1.switch() print('4')gr1 = g 阅读全文
posted @ 2019-08-28 19:06 Yihan_07 阅读(133) 评论(0) 推荐(0) 编辑
摘要: ''' gevent来完成多任务,即协程 协程相对进程和线程来说,消耗的资源更加的小,任务切换比较快'''import geventfrom gevent import monkeyimport timemonkey.patch_all() # 处理延时的操作 否则出现time.sleep()的时候 阅读全文
posted @ 2019-08-28 19:05 Yihan_07 阅读(154) 评论(0) 推荐(0) 编辑
摘要: ''' gevent来完成多任务,即协程 协程相对进程和线程来说,消耗的资源更加的小,任务切换比较快'''import geventfrom gevent import monkeyimport timemonkey.patch_all() # 处理延时的操作 否则出现time.sleep()的时候 阅读全文
posted @ 2019-08-28 19:04 Yihan_07 阅读(247) 评论(0) 推荐(0) 编辑
摘要: import requestsfrom bs4 import BeautifulSoupimport reclass Get_links(object): def __init__(self): self.url = 'http://www.jianfeiketang.com' self.heade 阅读全文
posted @ 2019-08-28 19:03 Yihan_07 阅读(270) 评论(0) 推荐(0) 编辑
摘要: from collections import Iteratorfrom collections import Iterableclass Classmate(object): def __init__(self): self.prev = 0 self.curr = 1 # def add(sel 阅读全文
posted @ 2019-08-28 19:03 Yihan_07 阅读(147) 评论(0) 推荐(0) 编辑
摘要: ''' 1.读取本地网页 2.匹配页面中的中文 3.转换为繁体'''import refrom Fan_Jian.langconv import *import Fan_Jian.zh_wikiimport multiprocessingimport osclass Fan_jian_change( 阅读全文
posted @ 2019-08-28 19:02 Yihan_07 阅读(453) 评论(0) 推荐(0) 编辑
摘要: # 域名过滤import requestsimport reimport multiprocessingclass Get_url(object): def __init__(self): self.headers = { "User-Agent": "Mozilla/5.0 (Windows NT 阅读全文
posted @ 2019-08-28 19:00 Yihan_07 阅读(383) 评论(0) 推荐(0) 编辑
摘要: import re# re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。print(re.match('www', 'www.baidu.com', ).span())print(re.match('.com', 'www.baidu. 阅读全文
posted @ 2019-08-28 19:00 Yihan_07 阅读(113) 评论(0) 推荐(0) 编辑
摘要: # 域名生成:import string''' 1.可以生成hg000.com 2.重在数字的添加 '''def f1(): input_wd = input('请输入要生成网站的关键字:') for i in range(1111, 10000): print('00' + str(i) + in 阅读全文
posted @ 2019-08-28 18:59 Yihan_07 阅读(306) 评论(0) 推荐(0) 编辑