2018 年 11月 2 日随笔档案 - SilentKiller

2018年11月2日

摘要： scrapy engine（引擎）：负责spider，ItemPipeline，Downloader，Scheduler中间的通讯，信号，数据传递等 Scheduler（调度器）：它负责接受引擎发送过来的request请求，并按照一定的方式进行整理排列，入队，当引擎需要是交还给引擎 Download 阅读全文

posted @ 2018-11-02 12:15 SilentKiller 阅读(129) 评论(0) 推荐(0)

Scrapy

摘要：步骤 1.建立工程和 Spider 模版 scrapy startproject 名称 cd 名称 scrapy genspider 爬虫名称爬取的地址进一步修改 spiders/爬虫文件 2.编写 Spider 配置爬虫文件修改对返回页面的处理修改对新增URL爬取请求的处理 3.编写 I 阅读全文

posted @ 2018-11-02 12:00 SilentKiller 阅读(233) 评论(0) 推荐(0)

ndarray 数组的创建和变换

摘要： ndarray数组的创建方法 1.从python中的列表，元组等类型创建ndarray数组 x = np.array(list/tuple) x = np.array(list/tuple,dtype=np.float32) 当np.array() 不指定dtype时，Numpy 将根据数据情况关联阅读全文

posted @ 2018-11-02 11:49 SilentKiller 阅读(1558) 评论(0) 推荐(0)

Numpy (嵩老师.)

摘要： import numpy as np Numpy 一元函数对ndarray中的数据执行元素级运算的函数 np.abs(x) np.fabs(x) 计算数组各元素的绝对值 np.sqrt(x) 计算数组各元素的平方根 np.square(x) 计算数组各元素的的平方 np.log(x) np.log 阅读全文

posted @ 2018-11-02 11:40 SilentKiller 阅读(288) 评论(0) 推荐(0)

Numpy (嵩老师)

摘要：主题思想摘要：有损地去数据特征的过程基本统计（含排序）分步/累计统计数据特征相关性，周期性等数据挖掘（形成知识） IPython的%魔术命令 %magic 显示所有魔术命令 %hist IPython命令的输入历史 %db 异常发生后自动进入调试器 %reset 删除当前命名空间中的全部阅读全文

posted @ 2018-11-02 11:30 SilentKiller 阅读(204) 评论(0) 推荐(0)

Pandas

摘要： pandas 统计描述一个强大的分析结构化数据额的工具集基础是Numpy，提供了高性能矩阵的运算应用数据挖掘，数据分析如，学生成绩分析，股票数据分析等提供数据清洗功能 Series 类似一维数组的对象通过list构建Series import pandas as pdser_obj = 阅读全文

posted @ 2018-11-02 11:16 SilentKiller 阅读(258) 评论(0) 推荐(0)

SilentKiller

就命运而言，休论公道。

公告