摘要:
数据预处理 在本次数据分析过程中,缺失数据将被进一步划分成为三个部分,一类数据是数据为0的情况,一类是数据为空值的情况,一类是数据为特殊符号,例如“--”的数据。 针对不同的数据缺失情况,本次分析将会采用不同的处理方式: 1、针对数值为0的情况,需要进行实际的分析,回归到原始数据中去,判断该数据为0 阅读全文
posted @ 2021-11-17 23:08
付明旭
阅读(149)
评论(0)
推荐(0)
摘要:
阅读全文
posted @ 2021-11-17 22:38
付明旭
阅读(136)
评论(0)
推荐(0)
摘要:
简单的线性回归:Python预测某宝2021双十一销售额 import pandas as pdimport numpy as np df = pd.read_excel("./历史双十一销售额.xlsx") x = np.array(df.iloc[:, 0]).reshape(-1, 1)y = 阅读全文
posted @ 2021-11-17 22:22
付明旭
阅读(122)
评论(0)
推荐(0)
摘要:
一、 爬虫的原理: 网络爬虫(网络蜘蛛)(网络机器人)是一个自动下载网页的计算机程序或自动化脚本 1、通用网络爬虫(全网爬虫):爬行对象从url扩充至整个Web,适合为搜索引擎搜索广泛的主题,通常采用并行工作方式应对大量刷新页面,对爬取顺序要求低,对爬取速度与存储空间要求较高。 深度优先策略:由低到 阅读全文
posted @ 2021-11-17 21:53
付明旭
阅读(448)
评论(0)
推荐(0)
摘要:
文件读取: file=pd.read_csv(path,sep=’’,header,names) sep=>分隔符 header=>将某行作为列名,默认为infer表示自动识别,如果是none会添加默认列名(0,1,2,3...) names=>表示列名,nrows=>读取前几行,encoding= 阅读全文
posted @ 2021-11-17 21:46
付明旭
阅读(433)
评论(0)
推荐(0)
摘要:
绘制最简单的图形可以不用创建画布 创建子图=>添加标题/刻度/名称/范围=>绘制图形=>添加图例=>保存图形=>显示图形 创建子图:pl=plt.figure() pl.add_subplot() 指定范围: plt.xlim((0,1)) 指定刻度: plt.xticks([‘’,’’,’’ ]) 阅读全文
posted @ 2021-11-17 21:45
付明旭
阅读(403)
评论(0)
推荐(0)
摘要:
Numpy提供的两种基本对象:ndarray(数组对象) ufunc(通用函数对象) 数组属性:itemsize表示数组元素大小=>数据类型所占位数/8(每个字节长度为8) 数据初始化:linspace,logspace,zeros((1,2)),ones((1,2)),eye,(diag)=>对角 阅读全文
posted @ 2021-11-17 21:19
付明旭
阅读(323)
评论(0)
推荐(0)
浙公网安备 33010602011771号