rant

2019年7月3日

摘要： from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.by import By import time def get_good(driver,number): try: time.sleep(5) ... 阅读全文

posted @ 2019-07-03 20:24 rant 阅读(160) 评论(0) 推荐(0)

day03(爬取京东商品信息、解析库)

摘要： 1.爬取京东商品信息功能为：在京东上搜索“墨菲定律”将所有的商品信息爬取、在一页爬取完之后爬取下一页直到爬取完所有信息部分结果截图展示： 2.将一个元素拖拽到指定位置处 2.1 瞬间拖动 2.2 缓慢移动 3.BeautifulSoup4 总结： find：找第一个 find_all：找所有 n 阅读全文

posted @ 2019-07-03 17:58 rant 阅读(287) 评论(0) 推荐(0)

2019年7月2日

day02(百度自动登录、豆瓣电影top250信息的获取)

摘要： 1.豆瓣电影top250的信息获取运行结果部分展示： 2.在京东上自动搜索所需要的信息 3.自动登录百度总结： selenium请求库优点：执行js代码不需要分析复杂的通信流程对浏览器做下拉、弹窗等操作获取动态数据破解登录验证安装selenium请求库: 在cmd窗口中输入: pip 阅读全文

posted @ 2019-07-02 16:03 rant 阅读(252) 评论(0) 推荐(0)

2019年7月1日

day01（跳过github登录、requests请求库）

摘要：什么是爬虫？爬虫就是爬取数据什么是数据？电商平台的商品信息、12306票务信息、股票证券投资信息等 requests请求库的安装在cmd窗口中输入python，然后输入 pip3 install requests 在检查网页的Network的Headers中各个标识的涵义 Request U 阅读全文

posted @ 2019-07-01 20:42 rant 阅读(280) 评论(0) 推荐(0)

公告