摘要: from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.by import By import time def get_good(driver,number): try: time.sleep(5) ... 阅读全文
posted @ 2019-07-03 20:24 rant 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 1.爬取京东商品信息 功能为:在京东上搜索“墨菲定律”将所有的商品信息爬取、在一页爬取完之后爬取下一页直到爬取完所有信息 部分结果截图展示: 2.将一个元素拖拽到指定位置处 2.1 瞬间拖动 2.2 缓慢移动 3.BeautifulSoup4 总结: find:找第一个 find_all:找所有 n 阅读全文
posted @ 2019-07-03 17:58 rant 阅读(256) 评论(0) 推荐(0) 编辑
摘要: 1.豆瓣电影top250的信息获取 运行结果部分展示: 2.在京东上自动搜索所需要的信息 3.自动登录百度 总结: selenium请求库优点: 执行js代码 不需要分析复杂的通信流程 对浏览器做下拉、弹窗等操作 获取动态数据 破解登录验证 安装selenium请求库: 在cmd窗口中输入: pip 阅读全文
posted @ 2019-07-02 16:03 rant 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 什么是爬虫? 爬虫就是爬取数据 什么是数据? 电商平台的商品信息、12306票务信息、股票证券投资信息等 requests请求库的安装 在cmd窗口中输入python,然后输入 pip3 install requests 在检查网页的Network的Headers中各个标识的涵义 Request U 阅读全文
posted @ 2019-07-01 20:42 rant 阅读(247) 评论(0) 推荐(0) 编辑