摘要: 写了一个从网页中抓取信息(如最新的头条新闻,新闻的来源,标题,内容等)的类,本文将介绍如何使用这个类来抓取网页中需要的信息。本文将以抓取博客园首页的博客标题和链接为例: 上图显示的是博客园首页的DOM树,显然只需提取出class为post_item的div,再重中提取出class为titlelnk的 阅读全文
posted @ 2017-11-23 18:24 WEB攻程狮 阅读(913) 评论(0) 推荐(0)