2019 年 11月 19 日随笔档案 - lanston

2019年11月19日

摘要： Scrapy提取数据有自己的一套机制，被称作选择器（selectors）,通过特定的Xpath或者CSS表达式来选择HTML文件的某个部分 Xpath是专门在XML文件中选择节点的语言，也可以用在HTML上。 CSS是一门将HTML文档样式化语言，选择器由它定义，并与特定的HTML元素的样式相关联。阅读全文

posted @ 2019-11-19 23:57 lanston 阅读(163) 评论(0) 推荐(0) 编辑

Scrapy——基本认识

摘要： Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。其可以应用在数据挖掘，信息处理或存储历史数据等一系列的程序中。其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的，也可以应用在获取API所返回的数据(例如 Amazon Associates Web Services ) 阅读全文

posted @ 2019-11-19 22:42 lanston 阅读(155) 评论(0) 推荐(0) 编辑

Scrapy——基本命令

摘要：命令的使用范围这里的命令分为全局的命令和项目的命令，全局的命令表示可以在任何地方使用，而项目的命令只能在项目目录下使用全局的命令有： startproject genspider settings runspider shell fetch view version 项目命令有： crawl c 阅读全文

posted @ 2019-11-19 22:41 lanston 阅读(181) 评论(0) 推荐(0) 编辑

lanston

公告