会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dhcc
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
下一页
2024年7月12日
python 基础 6 解析之JsonPath
摘要: pip安装 pip install jsonpath jsonpath的使用 obj = json.load(open('json文件', 'r', encoding='utf‐8')) ret = jsonpath.jsonpath(obj, 'jsonpath语法') jsonpath与lxml
阅读全文
posted @ 2024-07-12 17:30 donghongchao
阅读(113)
评论(0)
推荐(0)
2024年7月11日
python 基础 6 解析之xpath
摘要: 解析 xpath使用 安装lxml库 pip install lxml ‐i https://pypi.douban.com/simple pip install lxml -i https://mirrors.aliyun.com/pypi/simple 导入lxml etree from lxm
阅读全文
posted @ 2024-07-11 20:11 donghongchao
阅读(9)
评论(0)
推荐(0)
python urllib 基础6 cookie 及代理(handler的使用)
摘要: cookie登录 编码反爬 cookie中携带者个人登录信息,如果有登录之后的cookie,那么我们可以携带者cookie进入到任何页面 # 适用的场景:数据采集的时候 需要绕过登陆 然后进入到某个页面 # 个人信息页面是utf-8 但是还报错了编码错误 因为并没有进入到个人信息页面 而是跳转到了登
阅读全文
posted @ 2024-07-11 15:49 donghongchao
阅读(60)
评论(0)
推荐(0)
python urllib 基础 5
摘要: ajax的post请求 import urllib.request import urllib.parse # url = 'https://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=cname' # # headers = { # 'user-
阅读全文
posted @ 2024-07-11 12:01 donghongchao
阅读(15)
评论(0)
推荐(0)
python urllib 基础4
摘要: import urllib import urllib.request import urllib.parse import json #分析获取数据 url = 'https://movie.douban.com/j/chart/top_list?type=24&interval_id=100%3
阅读全文
posted @ 2024-07-11 10:38 donghongchao
阅读(18)
评论(0)
推荐(0)
2024年7月10日
python urllib 基础 get ajax
摘要: get请求豆瓣电影 下载 import urllib.parse import urllib.request import json # url = 'https://movie.douban.com/j/chart/top_list?type=19&interval_id=100%3A90&act
阅读全文
posted @ 2024-07-10 23:47 donghongchao
阅读(12)
评论(0)
推荐(0)
python urllib 基础之 3
摘要: # #post请求百度之详细翻译 # import urllib.request # import urllib.parse # url = 'https://fanyi.baidu.com/sug' # data = { # 'kw': "spide" # } # print(data) # da
阅读全文
posted @ 2024-07-10 18:16 donghongchao
阅读(25)
评论(0)
推荐(0)
python urllib 基础2
摘要: 请求对象的定制 import urllib.request url=("https://www.baidu.com") heards = { 'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (K
阅读全文
posted @ 2024-07-10 15:50 donghongchao
阅读(12)
评论(0)
推荐(0)
python urllib 基础 1
摘要: url = 'http://www.baidu.com' #模拟浏览器向服务器发送请求 response = urllib.request.urlopen(url) # res = response.read().decode('utf-8') #print(res) #一个类型,六个方法 # pr
阅读全文
posted @ 2024-07-10 10:51 donghongchao
阅读(44)
评论(0)
推荐(0)
2024年7月4日
python爬虫 爬取豆瓣电影 1-10 ajax 数据
摘要: import urllib.parse import urllib.request def create_request(page): base_url = 'https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&
阅读全文
posted @ 2024-07-04 07:18 donghongchao
阅读(14)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
下一页
公告