会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
1011sh
博客园
首页
新随笔
联系
订阅
管理
2017年8月17日
Python爬虫入门三之Urllib库的基本使用
摘要: 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来的,实质它是一段HTML代码,加 JS、CSS,如果把网页比作一个人,那么HTML便是他的骨架,JS便是他的肌肉,CSS便是它的衣服。所以最重要的
阅读全文
posted @ 2017-08-17 07:37 1011sh
阅读(104)
评论(0)
推荐(0)
2017年8月16日
Python爬虫入门二之爬虫基础了解
摘要: 1.什么是爬虫 爬虫,即网络爬虫,大家可以理解为在网络上爬行的一直蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来。想抓取什么?这个由你来控制它咯。 比如它在抓取一个网页,在这个网中他发现了一条道路,其实就是指向网页的超链接,那么它就可以爬到另一张
阅读全文
posted @ 2017-08-16 07:42 1011sh
阅读(133)
评论(0)
推荐(0)
2017年8月15日
Python爬虫入门一之综述
摘要: 首先爬虫是什么? 网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。 根据我的经验,要学习Python爬虫,我们要学习的共有以下几点: Python基础知识 Python中urllib和urllib2库的用
阅读全文
posted @ 2017-08-15 07:55 1011sh
阅读(229)
评论(0)
推荐(0)
公告