文章分类 -  Selenium

摘要:返回的是节点。一个一个去get,或者.text selenium 拿url .get_property href 或者 a .get_attribute href a 是标签 阅读全文
posted @ 2023-08-25 22:05 严永富 阅读(14) 评论(0) 推荐(0)
摘要:# 可以选择先登录,登陆后,放慢抓取速度# 不登录,直接抓,放慢抓取速度from selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byimport timeimport jsonimport reque 阅读全文
posted @ 2023-08-11 22:55 严永富 阅读(19) 评论(0) 推荐(0)
摘要:from selenium.webdriver import Chromefrom selenium.webdriver.support.ui import WebDriverWait # 显示等待from selenium.webdriver.common.by import By # 提取页面内 阅读全文
posted @ 2023-08-11 22:55 严永富 阅读(78) 评论(0) 推荐(0)
摘要:from selenium.webdriver.chrome.options import Options # 浏览器信息配置 # 可以滑动过去,后面过不去,报错,检查到自动化测试工具,不是人在操作# 浏览器 F12 Console (控制台) window.navigator.webdriver 阅读全文
posted @ 2023-08-11 22:55 严永富 阅读(7) 评论(0) 推荐(0)
摘要:from selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.common.action_chains import ActionChainsfrom s 阅读全文
posted @ 2023-08-11 22:55 严永富 阅读(20) 评论(0) 推荐(0)
摘要:import randomfrom selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.common.action_chains import Actio 阅读全文
posted @ 2023-08-11 22:55 严永富 阅读(10) 评论(0) 推荐(0)
摘要:from selenium.webdriver import Chromeimport time# 1. time.sleep(10) # 必须等10秒 动画等待# 2. web.implicitly_wait(10) # 最多等10秒,可能提前被唤醒,隐士等待,全局,爬虫用的最多# 3. WebD 阅读全文
posted @ 2023-08-05 19:46 严永富 阅读(3) 评论(0) 推荐(0)
摘要:1. 滑动,拖拽,点选,点选后的坐标还要各种各样的加密 2. 登录界面验证码图片扣不下来 3. 数据抓包复杂很恶心 考虑拿selenium去完成点选(登录),拿到cookies,拼装cookies,再拿requests去爬取 from selenium.webdriver import Chrome 阅读全文
posted @ 2023-08-05 18:47 严永富 阅读(191) 评论(0) 推荐(0)
摘要:# 安装:pip install selenium selenium 有浏览器环境,不在乎加密解密,用户可以看,selenium就可以拿到,可以搞定大多数反爬 # 安装驱动程序: chrome驱动地址国内阿里巴巴:https://npm.taobao.org 或者 npmjs.org 里面收索chr 阅读全文
posted @ 2023-08-03 22:30 严永富 阅读(8) 评论(0) 推荐(0)
摘要:python web Selenium 中find_element用法 from selenium.webdriver.common.by import By By.XPATH, "//input[@name='username']" By.大写, "外面加引号" find_element() 方法 阅读全文
posted @ 2023-08-03 22:30 严永富 阅读(1450) 评论(0) 推荐(0)
摘要:from selenium.webdriver.common.keys import Keys # 有键盘上所有键 x_btn.click() # click 点击 web.find_element(By.XPATH, '//*[@id="search_input"]').send_keys('py 阅读全文
posted @ 2023-08-03 22:30 严永富 阅读(13) 评论(0) 推荐(0)
摘要:# python 里面删东西# 干掉不需要的遮挡的,selenium 可以动态执行js var a 声明变量web.execute_script(""" var a = document.getElementsByClassName("un-login-banner")[0]; a.parentNo 阅读全文
posted @ 2023-08-03 22:29 严永富 阅读(15) 评论(0) 推荐(0)
摘要:for i in div_list: h3 = i.find_element(By.XPATH, '//*[@id="openWinPostion"]') h3.click() # 此时,在浏览器这边。我们看到的内容已经是详情页的内容了。 # 但是,在selenium的眼中,我们依然在首页 # 所以 阅读全文
posted @ 2023-08-03 22:29 严永富 阅读(11) 评论(0) 推荐(0)
摘要:# 从标签里提取某一个属性的值,比如说图片placeholder = input.get_property('placeholder') # 从 input 标签里提取 placeholder 的值# input.get_property() # ()里可以填 'src' 'value' 'href 阅读全文
posted @ 2023-08-03 22:27 严永富 阅读(5) 评论(0) 推荐(0)
摘要:# 切换到iframe 进去iframe = web.find_element(By.XPATH, '//*[@id="mplay"]') # 定位web.switch_to.frame(iframe) # 切换到iframe里面 # 跳出iframe怎么办? 出来web.switch_to.par 阅读全文
posted @ 2023-08-03 22:27 严永富 阅读(8) 评论(0) 推荐(0)
摘要:# 获取页面代码(不是页面源代码,是F12里面的 elements的代码)page_source = web.page_sourceprint(page_source) 阅读全文
posted @ 2023-08-03 22:27 严永富 阅读(22) 评论(0) 推荐(0)
摘要:from selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.select import Select # 下拉列表 <select>im 阅读全文
posted @ 2023-08-03 22:27 严永富 阅读(8) 评论(0) 推荐(0)
摘要:from selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.select import Select # 下拉列表 <select>im 阅读全文
posted @ 2023-08-03 22:27 严永富 阅读(3) 评论(0) 推荐(0)
摘要:# 报错信息: Message: no such element: Unable to locate element: {"method":"xpath"# no such element 没有这个元素 Unable to locate element 不能去定位某一个元素 (通过你给的xpath) 阅读全文
posted @ 2023-08-03 22:26 严永富 阅读(136) 评论(0) 推荐(0)