摘要:
from urllib import request#打印错误信息 except Exceptionlist = [ "http://www.baidu11.com/", "http://map.baidu.com/", "https://www.cnblogs.com/fuguang/p/1060 阅读全文
posted @ 2019-03-27 15:40
fuguang
阅读(3351)
评论(0)
推荐(0)
摘要:
from urllib import requestimport urllibimport re#网页版有道翻译是ajax的post请求。#浏览器请求地址http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule#但是在 阅读全文
posted @ 2019-03-27 15:38
fuguang
阅读(355)
评论(0)
推荐(0)
摘要:
from urllib import requestimport urllib#爬贴吧网页文件到本地。首先在本地打开百度贴吧 搜索 java吧#第一页的内容是:http://tieba.baidu.com/f?ie=utf-8&kw=java&fr=search&red_tag=f074629728 阅读全文
posted @ 2019-03-27 14:04
fuguang
阅读(641)
评论(0)
推荐(0)
摘要:
#浏览器GET请求,发送的参数有中文时,需要编码再拼接参数发送from urllib import requestimport urlliburl = r"http://www.baidu.com/s?"#百度搜索 浏览器useragent时 地址栏为:#https://www.baidu.com/ 阅读全文
posted @ 2019-03-27 10:42
fuguang
阅读(322)
评论(0)
推荐(0)
摘要:
#简单例子:抓取网页全部内容后,根据正则表达式,获取符合条件的字符串列表from urllib import request#正则表达式import reurl = "http://www.baidu.com/"#读取并解码,针对中文 编码是encode()response = request.ur 阅读全文
posted @ 2019-03-27 09:37
fuguang
阅读(129)
评论(0)
推荐(0)

浙公网安备 33010602011771号