Yihan_07 - 博客园

2019年8月28日

摘要： ''' 爬取中国每个省份的大学名称和官网地址'''import requestsfrom lxml import etreeclass School(object): def __init__(self): self.headers = { "User-Agent": "Mozilla/5.0 (W 阅读全文

posted @ 2019-08-28 19:07 Yihan_07 阅读(356) 评论(0) 推荐(0)

greenlet

摘要： ''' 利用greenlet实现多个任务的切换'''from greenlet import greenletdef f1(): print('1') gr2.switch() print('3')def f2(): print('2') gr1.switch() print('4')gr1 = g 阅读全文

posted @ 2019-08-28 19:06 Yihan_07 阅读(142) 评论(0) 推荐(0)

gevent 完成多任务_2

摘要： ''' gevent来完成多任务，即协程协程相对进程和线程来说，消耗的资源更加的小，任务切换比较快'''import geventfrom gevent import monkeyimport timemonkey.patch_all() # 处理延时的操作否则出现time.sleep()的时候阅读全文

posted @ 2019-08-28 19:05 Yihan_07 阅读(161) 评论(0) 推荐(0)

gevent 完成多任务

posted @ 2019-08-28 19:04 Yihan_07 阅读(257) 评论(0) 推荐(0)

获取url

摘要： import requestsfrom bs4 import BeautifulSoupimport reclass Get_links(object): def __init__(self): self.url = 'http://www.jianfeiketang.com' self.heade 阅读全文

posted @ 2019-08-28 19:03 Yihan_07 阅读(292) 评论(0) 推荐(0)

迭代器

摘要： from collections import Iteratorfrom collections import Iterableclass Classmate(object): def __init__(self): self.prev = 0 self.curr = 1 # def add(sel 阅读全文

posted @ 2019-08-28 19:03 Yihan_07 阅读(151) 评论(0) 推荐(0)

网页简体变为繁体

摘要： ''' 1.读取本地网页 2.匹配页面中的中文 3.转换为繁体'''import refrom Fan_Jian.langconv import *import Fan_Jian.zh_wikiimport multiprocessingimport osclass Fan_jian_change( 阅读全文

posted @ 2019-08-28 19:02 Yihan_07 阅读(501) 评论(0) 推荐(0)

域名过滤

摘要： # 域名过滤import requestsimport reimport multiprocessingclass Get_url(object): def __init__(self): self.headers = { "User-Agent": "Mozilla/5.0 (Windows NT 阅读全文

posted @ 2019-08-28 19:00 Yihan_07 阅读(452) 评论(0) 推荐(0)

re模块

摘要： import re# re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。print(re.match('www', 'www.baidu.com', ).span())print(re.match('.com', 'www.baidu. 阅读全文

posted @ 2019-08-28 19:00 Yihan_07 阅读(122) 评论(0) 推荐(0)

域名生成

摘要： # 域名生成：import string''' 1.可以生成hg000.com 2.重在数字的添加 '''def f1(): input_wd = input('请输入要生成网站的关键字:') for i in range(1111, 10000): print('00' + str(i) + in 阅读全文

posted @ 2019-08-28 18:59 Yihan_07 阅读(348) 评论(0) 推荐(0)