08 2022 档案

爬虫-多线程抓取斗图表情
摘要:import requests from lxml import etree import os import time from multiprocessing import Pool headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; 阅读全文

posted @ 2022-08-20 22:09 明.Sir 阅读(57) 评论(0) 推荐(1)

爬虫-获取豆瓣Top250信息
摘要:import time import requests from lxml import etree i = 0 for item in range(0, 275, 25): url = f'https://movie.douban.com/top250?start={item}&filter=' 阅读全文

posted @ 2022-08-19 23:18 明.Sir 阅读(54) 评论(0) 推荐(1)

爬虫-获取中信证券产品信息
摘要:import requests from lxml import etree import time import re ''' 功能描述:手动输入抓取页数,将获取的产品名称、管理人等信息数据,并生成excel ''' # 定义抓取方法 def get_url(url): res = request 阅读全文

posted @ 2022-08-18 16:26 明.Sir 阅读(121) 评论(0) 推荐(1)

导航