2019 年 7月 3 日随笔档案 - 长歌依梦

2019年7月3日

摘要： '''名字，详情页url，下载人数，app大小app_name,detail_url,download_num,app_size''' from bs4 import BeautifulSoup import requests import re '''爬虫三部曲'''# 1.发送请求 def get_page(url): response = requests.get(url)... 阅读全文

posted @ 2019-07-03 21:29 长歌依梦阅读(617) 评论(0) 推荐(0)

day03BS4搜索文档树

摘要： '''find:找第一个find_all:找所有标签查找与属性查找:name 属性匹配 name 标签名 attrs 属性查找匹配 text 文本匹配标签: - 字符串过滤器字符串全局匹配 - 正则过滤器 re模块匹配 - 列表过滤器 ... 阅读全文

posted @ 2019-07-03 19:26 长歌依梦阅读(459) 评论(0) 推荐(0)

BeautifulSoup4

摘要： 1.什么是BeautifulSoup4 BS4是一个解析库，可以通过某种（解析器）来帮我们提取想要的2.为什么要用BS4 它可以用简洁的语言帮我们快速提取想要的数据3.解析器的分类（1）html.parser (2)lxml html_doc = """ The Dormouse's story $37 Once upon a time th... 阅读全文

posted @ 2019-07-03 19:20 长歌依梦阅读(570) 评论(0) 推荐(0)

day03爬取京东商品信息

摘要：（一）初级爬取：（二）中级爬取（三）高级爬取阅读全文

posted @ 2019-07-03 18:35 长歌依梦阅读(143) 评论(0) 推荐(0)

day03元素交互操作

摘要：关于点击，清除关于ActionChans #方法一（瞬移） #方法二（慢移） #循环移动 JS代码阅读全文

posted @ 2019-07-03 18:33 长歌依梦阅读(89) 评论(0) 推荐(0)