2020 年 6月 4 日随笔档案 - udbful

2020年6月4日

摘要： https://python123.io/ws/demo.html <html><head><title>This is a python demo page</title></head> <body> <p class="title"><b>The demo python introduces s 阅读全文

posted @ 2020-06-04 23:17 udbful 阅读(261) 评论(0) 推荐(0)

13 Beautiful Soup库的基本元素

摘要：举例： """Beautiful Soup库的基本元素"""import requestsfrom bs4 import BeautifulSoupurl = "https://python123.io/ws/demo.html"r = requests.get(url)demo = r.texts 阅读全文

posted @ 2020-06-04 22:20 udbful 阅读(225) 评论(0) 推荐(0)

12 Beautiful Soup库的安装

摘要： BeautifulSoup库的安装 Pip install BeautifulSoup4 (anaconda第三方库中已安装BeautifulSoup库) 测试 1 """BeautifulSoup安装测试""" 2 3 4 import requests 5 from bs4 import Bea 阅读全文

posted @ 2020-06-04 17:02 udbful 阅读(332) 评论(0) 推荐(0)

11 实例5：IP地址归属地的自动查询

摘要： IP地址归属地的自动查询 1 """IP地址归属地查询""" 2 3 4 import requests 5 6 #url = "http://m.ip138.com/ip.asp?ip=" 7 url = "https://www.ip138.com/iplookup.asp?ip=" 8 try 阅读全文

posted @ 2020-06-04 10:34 udbful 阅读(276) 评论(0) 推荐(0)

10 实例4：用多线程对视频的爬取

摘要： 1 """使用多线程爬取梨视频视频数据""" 2 """https://www.cnblogs.com/zivli/p/11614103.html""" 3 4 5 import requests 6 import re 7 from lxml import etree 8 from multipr 阅读全文

posted @ 2020-06-04 10:25 udbful 阅读(248) 评论(0) 推荐(0)

9 实例3：网络图片的爬取和存储

摘要：网络图片的爬取和存储 1 """网络图片的爬取和存储""" 2 3 4 import requests 5 import os 6 7 url = "http://image.nationalgeographic.com.cn/2017/0211/20170211061910157.jpg" 8 r 阅读全文

posted @ 2020-06-04 10:22 udbful 阅读(180) 评论(0) 推荐(0)

8 实例2：百度360搜索关键词提交

摘要： 1 """百度搜索关键词提交""" 2 3 4 import requests 5 6 url = "https://www.baidu.com/s" 7 keyword = "Python" #中文也没问题 8 try: 9 kv = {'wd': 'keyword'} 10 r = reques 阅读全文

posted @ 2020-06-04 10:15 udbful 阅读(208) 评论(0) 推荐(0)

7 实例1：京东商品页面的爬取

摘要： 1 """实例1：京东商品页面的爬取""" 2 3 4 import requests 5 6 url = "https://item.jd.com/100012545852.html" 7 try: 8 # 更改头部信息 9 kv = {'user-agent': 'Mozilla/5.0'} 1 阅读全文

posted @ 2020-06-04 10:05 udbful 阅读(274) 评论(0) 推荐(0)

6 网络爬虫引发的问题及Robots协议

摘要： 6 网络爬虫引发的问题及Robots协议阅读全文

posted @ 2020-06-04 09:56 udbful 阅读(157) 评论(0) 推荐(0)

5 Requests库主要方法解析

摘要： Requests库主要方法解析 1 """Requests库主要方法解析""" 2 3 4 import requests 5 6 kv = {'key1': 'value1', 'key2': 'value2'} 7 r = requests.request('GET', 'http://pyth 阅读全文

posted @ 2020-06-04 09:53 udbful 阅读(144) 评论(0) 推荐(0)

4 HTTP协议及Requests库方法

摘要： 1 """HTTP及requests库方法""" 2 3 4 import requests 5 6 # requests库head()方法：得到头部信息 7 r = requests.head("http://httpbin.org/get") 8 9 print(r.headers) 10 pr 阅读全文

posted @ 2020-06-04 09:49 udbful 阅读(192) 评论(0) 推荐(0)

3 爬取网页的通用代码框架

摘要：爬取网页的通用代码框架 1 """通用代码框架""" 2 3 4 import requests 5 6 def getHTMLText(url): 7 try: 8 r = requests.get(url, timeout = 30) 9 r.raise_for_status() # 如果状态码阅读全文

posted @ 2020-06-04 09:24 udbful 阅读(147) 评论(0) 推荐(0)

2 Requests库的get()方法

摘要： Requests库的get()方法 """2requests之get方法""" import requests url = "https://www.baidu.com/" r = requests.get(url) # 200 print(r.status_code) # <class 'requ 阅读全文

posted @ 2020-06-04 09:21 udbful 阅读(176) 评论(0) 推荐(0)

1 requests库的安装

摘要： requests库的安装 Pip install requests (anaconda第三方库中已安装requests库) 测试： """requests库的安装测试""" import requests r = requests.get("https://www.baidu.com/") # 输出阅读全文

posted @ 2020-06-04 09:17 udbful 阅读(278) 评论(0) 推荐(0)

公告