2020年3月10日
摘要: 运用selenium实现alibaba工作职位页面的下一页: import selenium import selenium.webdriver import selenium.webdriver.common.keys import time driver = selenium.webdriver 阅读全文
posted @ 2020-03-10 10:33 共感的艺术 阅读(194) 评论(0) 推荐(0)
摘要: selenium模拟登录csdn,可以输入用户名和密码,但是验证码还没有解决: import selenium import selenium.webdriver import selenium.webdriver.common.keys import time driver = selenium. 阅读全文
posted @ 2020-03-10 10:29 共感的艺术 阅读(152) 评论(0) 推荐(0)
摘要: 运用selenium 进行百度搜索页面的关键词提交,以及enter确定到下一个页面: import selenium import selenium.webdriver import selenium.webdriver.common.keys import time driver = seleni 阅读全文
posted @ 2020-03-10 10:26 共感的艺术 阅读(430) 评论(0) 推荐(0)
摘要: 运用lmxl的xpath提取脚本之间的title以及url: import urllib.request import lxml import lxml.etree import re def makeurllist(url): headers={"User-Agent":"Mozilla/5.0 阅读全文
posted @ 2020-03-10 10:21 共感的艺术 阅读(790) 评论(0) 推荐(0)
摘要: lxml中的xpath股票信息提取: import urllib.request import lxml import lxml.etree import re def download(url): headers={"User-Agent":"Mozilla/5.0 (compatible; MS 阅读全文
posted @ 2020-03-10 10:19 共感的艺术 阅读(214) 评论(0) 推荐(0)
摘要: lxml中的xpat详细使用介绍: import lxml import lxml.etree html=lxml.etree.parse("index.html") print(type(html)) res=html.xpath("//li") #res是一个列表,包含所有元素 print(le 阅读全文
posted @ 2020-03-10 10:17 共感的艺术 阅读(423) 评论(0) 推荐(0)
摘要: lxml中的Xpath的使用: #coding:utf-8 import lxml import lxml.etree text=""" <div> <ul> <li class="item-0"><a href="link1.html">first item</a></li> <li class= 阅读全文
posted @ 2020-03-10 10:16 共感的艺术 阅读(239) 评论(0) 推荐(0)
摘要: python3中运用urllib抓取贴吧的邮箱以及QQ: import urllib import urllib.request import re from urllib import parse #抓取贴吧页面数量信息 def gettiebalistnumbers(name): #计算搜索的关 阅读全文
posted @ 2020-03-10 10:14 共感的艺术 阅读(442) 评论(0) 推荐(0)