05 2020 档案

摘要:##一、OLAP:在线分析处理 ###1.联机分析处理( On- Line Analytical Processing , OLAP ) : 是数据仓库系统最主要的应用,专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据要求快速灵活地进行大数据量的复杂查询处理,并以一种 阅读全文
posted @ 2020-05-28 15:38 旭东东 阅读(1211) 评论(0) 推荐(0)
摘要:##一、什么是大数据 ###1.大数据的定义 大数据( Big Data), 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 ###2.大数据的发展历程 ###3.大数据的主要 阅读全文
posted @ 2020-05-27 23:50 旭东东 阅读(519) 评论(0) 推荐(0)
摘要:R表达式中常用的符号 残差(Residuals) 残差是真实值与预测值之间的差,五个分位的值越小模型越精确 系数项与截距项(Coefficients & Intercept)和P值指标 残差标准误(Residual standard error) 残差的标准误差,越小越好 R方判定系数 模型拟合的质 阅读全文
posted @ 2020-05-24 19:05 旭东东 阅读(10764) 评论(0) 推荐(1)
摘要:一、函数名称 1.函数命令与功能相关 2.可以是字母数字组合,但必须是字母开头 二、函数声明 利用function函数来声明 myfun < function(选项参数){ 函数体 } 设计计算偏度与峰度函数 偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数 阅读全文
posted @ 2020-05-23 10:33 旭东东 阅读(7131) 评论(0) 推荐(0)
摘要:基础绘图函数 一、plot() 函数 1.绘制散点图(两个数值向量) 2.绘制直方图(数值向量转化为因子) 3.绘制箱线图(一个因子向量,一个数值向量) 4.绘制散列图(一个数值向量,一个因子向量) 5.绘制脊柱图(两个因子向量) ggplot2包 ggplot2包集成在tidyverse包内,使用 阅读全文
posted @ 2020-05-23 09:24 旭东东 阅读(1260) 评论(0) 推荐(0)
摘要:一、独立性检验 根据频数信息判断两类因子彼此相关或相互独立的假设检验。 p value p value就是Probability的值,它是一个通过计算得到的概率值,也就是在原假设为真时, 得到最大的或者超出所得到的检验统计量值的概率。 一般将p值定位到0.05,当 p 0.05,接受原假设。 1.卡 阅读全文
posted @ 2020-05-21 17:14 旭东东 阅读(2215) 评论(0) 推荐(1)
摘要:一、数学统计函数 概率论是统计学的基础,R有许多用于处理概率,概率分布以及随机变量的函数。R对每一个概率分布都有一个简称,这个名称用于识别与分布相联系的函数。这部分涉及到很多统计学基础的理论知识,比如随机试验,样本空间,对立与互斥,随机事件与必然事件,概率密度,概率分布等。 1.四种基本函数 后缀 阅读全文
posted @ 2020-05-16 19:19 旭东东 阅读(3849) 评论(0) 推荐(1)
摘要:一、reshape2包 数据:氮肥和磷肥的用量对植物生长的影响 将上图数据做成txt文件 1.melt() 函数,将宽数据转换为长数据 转换NP数据集 2.dcast() 函数,将长数据转换为宽数据 二、tidyr包 处理整洁的数据: 每一列代表一个变量 每一行代表一个观测 一个观测值对应的一个变量 阅读全文
posted @ 2020-05-13 22:17 旭东东 阅读(941) 评论(0) 推荐(0)
摘要:一、基本转换 读取Excel数据 methods(is) 函数可以查看所有 is 的方法。用于判断数据 methods(as) 函数可以查看所有的转换方法。 二、对大数据集,取数据子集 1.读数据 两种写法 2.随机抽样函数 sample() 对向量抽样 对数据框抽样,取子集 3.删除特定数据 原数 阅读全文
posted @ 2020-05-11 23:29 旭东东 阅读(4224) 评论(0) 推荐(0)
摘要:一、手动键入数据 1.将纸质数据通过列的方式键入数据 2.用edit()方法输入数据 fix()方法键入数据关闭视图窗口可直接保存 二、读入文件 1.读入本地文件 read.table("文件名+后缀 或 文件的绝对路径") head() 函数 默认输出文件前六行,或者head(x,n=10) 默认 阅读全文
posted @ 2020-05-10 22:50 旭东东 阅读(2835) 评论(0) 推荐(0)
摘要:一、get和post请求获取数据 获取网址源码 import urllib.request response = urllib.request.urlopen("https://www.baidu.com/") print(response.read().decode('utf 8')) get请求 阅读全文
posted @ 2020-05-06 11:52 旭东东 阅读(197) 评论(0) 推荐(0)
摘要:爬虫初识 基本流程 编码规范 引入模块 爬虫程序思路 阅读全文
posted @ 2020-05-05 19:41 旭东东 阅读(241) 评论(0) 推荐(0)
摘要:一、获取动态的值 结算 结算后可获得 0 积分,满1000积分即可参与抽奖! $(document).on("click"," btnn", function(){ if (parseInt($(".money pv").text()) = 1000) { window.open("./chouji 阅读全文
posted @ 2020-05-05 13:10 旭东东 阅读(124) 评论(0) 推荐(0)
摘要:一、查询表格中第 (1,1) 元素 二、修改价格,打九折 三、插入图表 1.代码 2.执行结果 阅读全文
posted @ 2020-05-04 16:26 旭东东 阅读(1568) 评论(0) 推荐(0)
摘要:一、类与对象和构造函数 class Point: def __init__(self,x,y): self.x = x self.y = y def move(self): print("move") def draw(self): print("draw") 创建一个对象 point1 = Poi 阅读全文
posted @ 2020-05-04 11:49 旭东东 阅读(177) 评论(0) 推荐(1)
摘要:一、你最喜欢的人 name = input('What is your name? ') favorite_person = input('What is your favorite person? ') print(name + ' likes ' +favorite_person) 二、你的年龄 阅读全文
posted @ 2020-05-03 17:58 旭东东 阅读(252) 评论(0) 推荐(0)