随笔分类 -  Python爬虫

【爬虫】Python3搜索并获取电影网站的迅雷下载链接
摘要:用到的python第三方库:bs4、requests、execjs(在python中调用js脚本) 目标网站: www.beiwo.tv 通过分析网页源码发现,网页通过调用一个加密JS脚本来加密网页源码中的一段字符串从而获得迅雷电影链接,将分析网页得到的JS加密源码存放到encode.js文件中,通 阅读全文
posted @ 2017-09-14 20:57 Kevin_Zzzzz 阅读(1298) 评论(0) 推荐(0)
Python2.7 基于bs4与requests库的网页图片简单爬取
摘要:爬虫入门新手,自学笔记,如果理解有错误请指正。 BeautifulSoup库的find_all函数可以搜索返回的网页源码中参数对应的标签对象。 尝试打印一下获取的img标签内容。 我们可以看到一大堆img标签内容,比如 <img src="http://static.nipic.com/images 阅读全文
posted @ 2017-08-26 22:35 Kevin_Zzzzz 阅读(252) 评论(0) 推荐(0)