2020 年 3月 10 日随笔档案 - 共感的艺术

2020年3月10日

摘要：运用selenium实现alibaba工作职位页面的下一页： import selenium import selenium.webdriver import selenium.webdriver.common.keys import time driver = selenium.webdriver 阅读全文

posted @ 2020-03-10 10:33 共感的艺术阅读(194) 评论(0) 推荐(0)

selenium模拟登录csdn

摘要： selenium模拟登录csdn,可以输入用户名和密码，但是验证码还没有解决： import selenium import selenium.webdriver import selenium.webdriver.common.keys import time driver = selenium. 阅读全文

posted @ 2020-03-10 10:29 共感的艺术阅读(152) 评论(0) 推荐(0)

selenium 进行百度搜索页面的关键词提交，以及RETURN确定

摘要：运用selenium 进行百度搜索页面的关键词提交，以及enter确定到下一个页面： import selenium import selenium.webdriver import selenium.webdriver.common.keys import time driver = seleni 阅读全文

posted @ 2020-03-10 10:26 共感的艺术阅读(431) 评论(0) 推荐(0)

lmxl的xpath提取脚本之间的title以及url

摘要：运用lmxl的xpath提取脚本之间的title以及url: import urllib.request import lxml import lxml.etree import re def makeurllist(url): headers={"User-Agent":"Mozilla/5.0 阅读全文

posted @ 2020-03-10 10:21 共感的艺术阅读(790) 评论(0) 推荐(0)

lxml中的xpath股票信息提取

摘要： lxml中的xpath股票信息提取： import urllib.request import lxml import lxml.etree import re def download(url): headers={"User-Agent":"Mozilla/5.0 (compatible; MS 阅读全文

posted @ 2020-03-10 10:19 共感的艺术阅读(214) 评论(0) 推荐(0)

lxml中的xpat详细使用介绍

摘要： lxml中的xpat详细使用介绍： import lxml import lxml.etree html=lxml.etree.parse("index.html") print(type(html)) res=html.xpath("//li") #res是一个列表，包含所有元素 print(le 阅读全文

posted @ 2020-03-10 10:17 共感的艺术阅读(427) 评论(0) 推荐(0)

lxml中的Xpath的使用

摘要： lxml中的Xpath的使用： #coding:utf-8 import lxml import lxml.etree text=""" <div> <ul> <li class="item-0"><a href="link1.html">first item</a></li> <li class= 阅读全文

posted @ 2020-03-10 10:16 共感的艺术阅读(239) 评论(0) 推荐(0)

python3中运用urllib抓取贴吧的邮箱以及QQ

摘要： python3中运用urllib抓取贴吧的邮箱以及QQ: import urllib import urllib.request import re from urllib import parse #抓取贴吧页面数量信息 def gettiebalistnumbers(name): #计算搜索的关阅读全文

posted @ 2020-03-10 10:14 共感的艺术阅读(442) 评论(0) 推荐(0)