会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
非道版
博客园
首页
新随笔
联系
订阅
管理
2019年7月4日
day_04
摘要: 豌豆荚游戏信息搜取
阅读全文
posted @ 2019-07-04 09:18 非道版
阅读(111)
评论(0)
推荐(0)
2019年7月3日
day_03 2
摘要: find:找第一个 find_ all:找所有 标签查找与属性查找: name 属性匹配 name 标签名 attrs 属性查找匹配 text 文本匹配 标签: -字符串过滤器 字符串全局匹配 -正则过滤器 re模块匹配 -列表过滤器 列表内的数据匹配 -bool过滤器 True匹配 -方法过滤器
阅读全文
posted @ 2019-07-03 20:17 非道版
阅读(100)
评论(0)
推荐(0)
day_03 1
摘要: 今日内容:一 Selenium剩余部分 二 BeautifulSoup4一 Selenium剩余部分1.元素交互操作: ——点击、清除 ——Actions Chains ——frame的切换 ——执行js代码 from selenium import webdriver from selenium.
阅读全文
posted @ 2019-07-03 11:25 非道版
阅读(138)
评论(0)
推荐(0)
2019年7月2日
day_02
摘要: 一requests 请求库爬取豆瓣电影信息一请求urlhttps: / /movie . douban. com/ top250一请求方式GET请求头user- -agentcookies import requests import re def get_page(url): response=r
阅读全文
posted @ 2019-07-02 11:36 非道版
阅读(111)
评论(0)
推荐(0)
2019年7月1日
day_01 github访问
摘要: import requests import re login_url='https://github.com/login' login_header={ 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 ...
阅读全文
posted @ 2019-07-01 20:32 非道版
阅读(120)
评论(0)
推荐(0)
day_01 爬虫小视频
摘要: 今日内容: 爬虫课程: 一爬虫基本原理 二requests请求库 一爬虫基本原理 1、什么是爬虫? 爬虫就是爬取数据。 2、什么是互联网? 由一堆网络设备,把一台台的计算机互联到一起称之为互联网。 3、互联网建立的目的 数据的传递与数据的共享。 4、什么是数据? 例如: 电商平台的商品信息(淘宝、京
阅读全文
posted @ 2019-07-01 14:44 非道版
阅读(150)
评论(0)
推荐(0)
公告