欢迎来到Felix的博客

Do the right things! And talk is cheap,show me your code!
摘要: (1):分析网页 分析ajax的请求网址,和需要的参数。通过不断向下拉动滚动条,发现请求的参数中offset一直在变化,所以每次请求通过offset来控制新的ajax请求。 (2)上代码 a、通过ajax请求获取页面数据 b、分析ajax请求的返回结果,获取图片集的url c、得到图集url后获取图 阅读全文
posted @ 2018-04-06 22:39 寂静的天空 阅读(2547) 评论(2) 推荐(0) 编辑
摘要: 一:分析网站 目标站和目标数据目标地址:http://maoyan.com/board/4?offset=20目标数据:目标地址页面的电影列表,包括电影名,电影图片,主演,上映日期以及评分。 二:上代码 (1):导入相应的包 (2):分析网页 通过检查发现需要的内容位于网页中的<dd>标签内。通过翻 阅读全文
posted @ 2018-04-06 21:01 寂静的天空 阅读(651) 评论(0) 推荐(0) 编辑
摘要: 一:Selenium简介 selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit, 阅读全文
posted @ 2018-04-06 19:20 寂静的天空 阅读(881) 评论(0) 推荐(0) 编辑
摘要: 一:简介 PyQuery库是jQuery的Python实现,可以用于解析HTML网页内容,是一个非常强大又灵活的网页解析库。 --》官方文档地址 --》jQuery参考文档 二:初始化 初始化的时候一般有三种传入方式:传入字符串,传入url,传入文件。 (1):字符串初始化 注意: 由于PyQuer 阅读全文
posted @ 2018-04-06 15:56 寂静的天空 阅读(955) 评论(0) 推荐(0) 编辑
摘要: 一:beautifulsoup简介 beautifulsoup是一个非常强大的工具,爬虫利器。 beautifulSoup “美味的汤,绿色的浓汤” 一个灵活又方便的网页解析库,处理高效,支持多种解析器。利用它就不用编写正则表达式也能方便的实现网页信息的抓取。 二:常用解析库 Beautiful S 阅读全文
posted @ 2018-04-06 14:58 寂静的天空 阅读(2027) 评论(1) 推荐(0) 编辑
个人感悟: 一个人最好的镜子就是自己,你眼中的你和别人眼中的你,不是一回事。有人夸你,别信;有人骂你,别听。一根稻草,扔街上就是垃圾;捆上白菜就是白菜价;捆上大闸蟹就是大闸蟹的价。 一个人,不狂是没有出息的,但一直狂,肯定是没有出息的。雨打残花风卷流云,剑影刀光闪过后,你满脸冷酷的站在珠峰顶端,傲视苍生无比英武,此时我问你:你怎么下去? 改变自己就是改变自己的心态,该沉的时候沉下去,该浮的时候浮上来;不争名夺利,不投机取巧,不尔虞我诈;少说、多听、多行动。人每所谓穷通寿夭为命所系,岂不知造物之报施,全视人之自取。 座佑铭:每一个不曾起舞的日子,都是对生命的辜负。