2019 年 3月随笔档案 - fuguang

python学习（七）--豆瓣爬取电影名，评分以及演员

摘要：import requestsimport re#爬取豆瓣电影排名pageNum = int(input("要查看第几页电影分数："))#已知豆瓣默认每页展示20条#url= "https://movie.douban.com/j/chart/top_list?type=11&interval_id 阅读全文

posted @ 2019-03-28 17:02 fuguang 阅读(991) 评论(0) 推荐(0)

python学习（六）--正则的一些例子

摘要：import re#正则表达式#compile函数，--将正则表达式转变为内部函数，提高执行效率strr = "python123456"pattern = "Python"res = re.compile(pattern)#当忽略匹配大小写时res2 = re.compile(pattern,re 阅读全文

posted @ 2019-03-28 17:01 fuguang 阅读(301) 评论(0) 推荐(0)

python学习（五）--打印错误信息

摘要：from urllib import request#打印错误信息 except Exceptionlist = [ "http://www.baidu11.com/", "http://map.baidu.com/", "https://www.cnblogs.com/fuguang/p/1060 阅读全文

posted @ 2019-03-27 15:40 fuguang 阅读(3347) 评论(0) 推荐(0)

python学习（四）--POST请求

摘要：from urllib import requestimport urllibimport re#网页版有道翻译是ajax的post请求。#浏览器请求地址http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule#但是在阅读全文

posted @ 2019-03-27 15:38 fuguang 阅读(354) 评论(0) 推荐(0)

python学习（三）--跟着例子写的贴吧网页爬取

摘要：from urllib import requestimport urllib#爬贴吧网页文件到本地。首先在本地打开百度贴吧搜索 java吧#第一页的内容是:http://tieba.baidu.com/f?ie=utf-8&kw=java&fr=search&red_tag=f074629728 阅读全文

posted @ 2019-03-27 14:04 fuguang 阅读(637) 评论(0) 推荐(0)

python学习（二）

摘要：#浏览器GET请求，发送的参数有中文时，需要编码再拼接参数发送from urllib import requestimport urlliburl = r"http://www.baidu.com/s?"#百度搜索浏览器useragent时地址栏为：#https://www.baidu.com/ 阅读全文

posted @ 2019-03-27 10:42 fuguang 阅读(317) 评论(0) 推荐(0)

python爬虫学习（一）

摘要：#简单例子：抓取网页全部内容后，根据正则表达式，获取符合条件的字符串列表from urllib import request#正则表达式import reurl = "http://www.baidu.com/"#读取并解码,针对中文编码是encode()response = request.ur 阅读全文

posted @ 2019-03-27 09:37 fuguang 阅读(128) 评论(0) 推荐(0)

fuguang

03 2019 档案

公告