1011sh

2017年8月17日

摘要： 1.分分钟扒一个网页下来怎样扒网页呢？其实就是根据URL来获取它的网页信息，虽然我们在浏览器中看到的是一幅幅优美的画面，但是其实是由浏览器解释才呈现出来的，实质它是一段HTML代码，加 JS、CSS，如果把网页比作一个人，那么HTML便是他的骨架，JS便是他的肌肉，CSS便是它的衣服。所以最重要的阅读全文

posted @ 2017-08-17 07:37 1011sh 阅读(106) 评论(0) 推荐(0)

2017年8月16日

Python爬虫入门二之爬虫基础了解

摘要： 1.什么是爬虫爬虫，即网络爬虫，大家可以理解为在网络上爬行的一直蜘蛛，互联网就比作一张大网，而爬虫便是在这张网上爬来爬去的蜘蛛咯，如果它遇到资源，那么它就会抓取下来。想抓取什么？这个由你来控制它咯。比如它在抓取一个网页，在这个网中他发现了一条道路，其实就是指向网页的超链接，那么它就可以爬到另一张阅读全文

posted @ 2017-08-16 07:42 1011sh 阅读(137) 评论(0) 推荐(0)

2017年8月15日

Python爬虫入门一之综述

摘要：首先爬虫是什么？网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动的抓取万维网信息的程序或者脚本。根据我的经验，要学习Python爬虫，我们要学习的共有以下几点： Python基础知识 Python中urllib和urllib2库的用阅读全文

posted @ 2017-08-15 07:55 1011sh 阅读(231) 评论(0) 推荐(0)

公告