文章分类 - Selenium
摘要:返回的是节点。一个一个去get,或者.text selenium 拿url .get_property href 或者 a .get_attribute href a 是标签
        阅读全文
                
摘要:# 可以选择先登录,登陆后,放慢抓取速度# 不登录,直接抓,放慢抓取速度from selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byimport timeimport jsonimport reque
        阅读全文
                
摘要:from selenium.webdriver import Chromefrom selenium.webdriver.support.ui import WebDriverWait # 显示等待from selenium.webdriver.common.by import By # 提取页面内
        阅读全文
                
摘要:from selenium.webdriver.chrome.options import Options # 浏览器信息配置 # 可以滑动过去,后面过不去,报错,检查到自动化测试工具,不是人在操作# 浏览器 F12 Console (控制台) window.navigator.webdriver 
        阅读全文
                
摘要:from selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.common.action_chains import ActionChainsfrom s
        阅读全文
                
摘要:import randomfrom selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.common.action_chains import Actio
        阅读全文
                
摘要:from selenium.webdriver import Chromeimport time# 1. time.sleep(10) # 必须等10秒 动画等待# 2. web.implicitly_wait(10) # 最多等10秒,可能提前被唤醒,隐士等待,全局,爬虫用的最多# 3. WebD
        阅读全文
                
摘要:1. 滑动,拖拽,点选,点选后的坐标还要各种各样的加密 2. 登录界面验证码图片扣不下来 3. 数据抓包复杂很恶心 考虑拿selenium去完成点选(登录),拿到cookies,拼装cookies,再拿requests去爬取 from selenium.webdriver import Chrome
        阅读全文
                
摘要:# 安装:pip install selenium selenium 有浏览器环境,不在乎加密解密,用户可以看,selenium就可以拿到,可以搞定大多数反爬 # 安装驱动程序: chrome驱动地址国内阿里巴巴:https://npm.taobao.org 或者 npmjs.org 里面收索chr
        阅读全文
                
摘要:python web Selenium 中find_element用法 from selenium.webdriver.common.by import By By.XPATH, "//input[@name='username']" By.大写, "外面加引号" find_element() 方法
        阅读全文
                
摘要:from selenium.webdriver.common.keys import Keys # 有键盘上所有键 x_btn.click() # click 点击 web.find_element(By.XPATH, '//*[@id="search_input"]').send_keys('py
        阅读全文
                
摘要:# python 里面删东西# 干掉不需要的遮挡的,selenium 可以动态执行js var a 声明变量web.execute_script(""" var a = document.getElementsByClassName("un-login-banner")[0]; a.parentNo
        阅读全文
                
摘要:for i in div_list: h3 = i.find_element(By.XPATH, '//*[@id="openWinPostion"]') h3.click() # 此时,在浏览器这边。我们看到的内容已经是详情页的内容了。 # 但是,在selenium的眼中,我们依然在首页 # 所以
        阅读全文
                
摘要:# 从标签里提取某一个属性的值,比如说图片placeholder = input.get_property('placeholder') # 从 input 标签里提取 placeholder 的值# input.get_property() # ()里可以填 'src' 'value' 'href
        阅读全文
                
摘要:# 切换到iframe 进去iframe = web.find_element(By.XPATH, '//*[@id="mplay"]') # 定位web.switch_to.frame(iframe) # 切换到iframe里面 # 跳出iframe怎么办? 出来web.switch_to.par
        阅读全文
                
摘要:# 获取页面代码(不是页面源代码,是F12里面的 elements的代码)page_source = web.page_sourceprint(page_source)
        阅读全文
                
摘要:from selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.select import Select # 下拉列表 <select>im
        阅读全文
                
摘要:from selenium.webdriver import Chromefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.select import Select # 下拉列表 <select>im
        阅读全文
                
摘要:# 报错信息: Message: no such element: Unable to locate element: {"method":"xpath"# no such element 没有这个元素 Unable to locate element 不能去定位某一个元素 (通过你给的xpath)
        阅读全文
                
                    
                
浙公网安备 33010602011771号