欢迎来到Felix的博客

Do the right things! And talk is cheap,show me your code!
摘要: (1):分析网页 分析ajax的请求网址,和需要的参数。通过不断向下拉动滚动条,发现请求的参数中offset一直在变化,所以每次请求通过offset来控制新的ajax请求。 (2)上代码 a、通过ajax请求获取页面数据 b、分析ajax请求的返回结果,获取图片集的url c、得到图集url后获取图 阅读全文
posted @ 2018-04-06 22:39 寂静的天空 阅读(2547) 评论(2) 推荐(0) 编辑
摘要: 一:分析网站 目标站和目标数据目标地址:http://maoyan.com/board/4?offset=20目标数据:目标地址页面的电影列表,包括电影名,电影图片,主演,上映日期以及评分。 二:上代码 (1):导入相应的包 (2):分析网页 通过检查发现需要的内容位于网页中的<dd>标签内。通过翻 阅读全文
posted @ 2018-04-06 21:01 寂静的天空 阅读(646) 评论(0) 推荐(0) 编辑
摘要: 一:Selenium简介 selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit, 阅读全文
posted @ 2018-04-06 19:20 寂静的天空 阅读(881) 评论(0) 推荐(0) 编辑
摘要: 一:简介 PyQuery库是jQuery的Python实现,可以用于解析HTML网页内容,是一个非常强大又灵活的网页解析库。 --》官方文档地址 --》jQuery参考文档 二:初始化 初始化的时候一般有三种传入方式:传入字符串,传入url,传入文件。 (1):字符串初始化 注意: 由于PyQuer 阅读全文
posted @ 2018-04-06 15:56 寂静的天空 阅读(955) 评论(0) 推荐(0) 编辑
摘要: 一:beautifulsoup简介 beautifulsoup是一个非常强大的工具,爬虫利器。 beautifulSoup “美味的汤,绿色的浓汤” 一个灵活又方便的网页解析库,处理高效,支持多种解析器。利用它就不用编写正则表达式也能方便的实现网页信息的抓取。 二:常用解析库 Beautiful S 阅读全文
posted @ 2018-04-06 14:58 寂静的天空 阅读(2025) 评论(1) 推荐(0) 编辑
摘要: 一:什么是Requests Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其实urllib还是非常不方便的,而Requests它会比urllib更加方便,可以节约我们大量的 阅读全文
posted @ 2018-04-03 22:46 寂静的天空 阅读(552) 评论(0) 推荐(0) 编辑
摘要: 一:什么是爬虫 请求网站并提取数据的自动化程序。 二:爬虫基本流程 a.发起请求 通过HTTP库向目标站点发起请求,即发送一个Request,请求可以包含额外的headers等信息,等服务器响应。 b.获取响应内容 如果服务器能正常响应,会得到一个Response,Response的内容便是所要获取 阅读全文
posted @ 2018-04-03 15:22 寂静的天空 阅读(386) 评论(0) 推荐(0) 编辑
摘要: 什么是Urllib: python内置的HTTP请求库 urllib.request : 请求模块 urllib.error : 异常处理模块 urllib.parse: url解析模块 urllib.robotparser : robots.txt解析模块 GET请求方式 POST请求方式 超时t 阅读全文
posted @ 2018-04-03 15:17 寂静的天空 阅读(417) 评论(0) 推荐(0) 编辑
摘要: 1. 下载 下载链接:https://www.mongodb.com/download-center?jmp=nav#community 2. 安装 按提示安装即可 1. Complete:完整安装 2. Custom:自定义安装,可选择安装路径和安装组件 3. 配置 1. 安装完的目录结构 [C: 阅读全文
posted @ 2018-04-03 09:56 寂静的天空 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 一:基本概念 1、使用图(graphs)来表示计算任务 2、在被称之为会话(Session)的上下文(context)中执行图 3、使用tensor表示数据 4、通过变量(Variable)维护状态 5、使用feed和fetch可以为任意的操作赋值或者从其中获取数据 TensorFlow是一个编程系 阅读全文
posted @ 2018-03-28 21:01 寂静的天空 阅读(663) 评论(0) 推荐(0) 编辑
个人感悟: 一个人最好的镜子就是自己,你眼中的你和别人眼中的你,不是一回事。有人夸你,别信;有人骂你,别听。一根稻草,扔街上就是垃圾;捆上白菜就是白菜价;捆上大闸蟹就是大闸蟹的价。 一个人,不狂是没有出息的,但一直狂,肯定是没有出息的。雨打残花风卷流云,剑影刀光闪过后,你满脸冷酷的站在珠峰顶端,傲视苍生无比英武,此时我问你:你怎么下去? 改变自己就是改变自己的心态,该沉的时候沉下去,该浮的时候浮上来;不争名夺利,不投机取巧,不尔虞我诈;少说、多听、多行动。人每所谓穷通寿夭为命所系,岂不知造物之报施,全视人之自取。 座佑铭:每一个不曾起舞的日子,都是对生命的辜负。