03 2019 档案
摘要:import requestsimport re#爬取豆瓣电影排名pageNum = int(input("要查看第几页电影分数:"))#已知豆瓣默认每页展示20条#url= "https://movie.douban.com/j/chart/top_list?type=11&interval_id
阅读全文
摘要:import re#正则表达式#compile函数,--将正则表达式转变为内部函数,提高执行效率strr = "python123456"pattern = "Python"res = re.compile(pattern)#当忽略匹配大小写时res2 = re.compile(pattern,re
阅读全文
摘要:from urllib import request#打印错误信息 except Exceptionlist = [ "http://www.baidu11.com/", "http://map.baidu.com/", "https://www.cnblogs.com/fuguang/p/1060
阅读全文
摘要:from urllib import requestimport urllibimport re#网页版有道翻译是ajax的post请求。#浏览器请求地址http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule#但是在
阅读全文
摘要:from urllib import requestimport urllib#爬贴吧网页文件到本地。首先在本地打开百度贴吧 搜索 java吧#第一页的内容是:http://tieba.baidu.com/f?ie=utf-8&kw=java&fr=search&red_tag=f074629728
阅读全文
摘要:#浏览器GET请求,发送的参数有中文时,需要编码再拼接参数发送from urllib import requestimport urlliburl = r"http://www.baidu.com/s?"#百度搜索 浏览器useragent时 地址栏为:#https://www.baidu.com/
阅读全文
摘要:#简单例子:抓取网页全部内容后,根据正则表达式,获取符合条件的字符串列表from urllib import request#正则表达式import reurl = "http://www.baidu.com/"#读取并解码,针对中文 编码是encode()response = request.ur
阅读全文