SPSS-回归
摘要:1、一元回归 一元线性回归分析、多元线性回归分析 【一元线性回归分析】 已经某变量取值,如果想要用它得到另一个变量的预测值 自变量或预测变量、因变量或标准变量 1. 目的:根据某自变量取值得到因变量的预测值 2. 所需数据: 因变量(连续变量)+自变量(连续变量、二分变量) 3. 假设条件: a.
阅读全文
posted @
2020-01-25 10:37
foremost
阅读(1363)
推荐(0)
SPPS-方差分析
摘要:方差分析 主体间单因素方差分析(ANOVA)用于比较两个或多个独立分组的因变量均值 1. 目的:检验两个或多个分组的因变量均值是否存在显著差异 2. 所需数据: 两个(或多个)不同分组(或分类)的主体间因子的自变量+连续因变量 3. 假设条件: a. 观测值独立 b. 各组总体的因变量取值服从正态分
阅读全文
posted @
2020-01-24 14:19
foremost
阅读(2388)
推荐(0)
SPPS-T检验
摘要:【推断统计】 1. 样本和总体 总体:目标事件的全体 样本:总体的一部分(总体的子集) 2. 推断统计: 用样本数据对总体进行归纳的统计过程 假定:样本对总体具有代表性 3. 假设检验: 两个假设:原假设+备择假设 原假设:表述为一个处理没有影响--(小概率事件)H0 备择假设:表述为该处理有影响
阅读全文
posted @
2020-01-23 22:42
foremost
阅读(1618)
推荐(0)
SPSS-图表
摘要:SPSS统计图的基础知识 标题区和注解区:位于图形的最上方和最下方; 坐标轴:用于表示响应变量的取值情况; 绘图区:被坐标轴包围,直接使用图形元素对数据进行呈现的区域; 图例区:位于整个图形的右侧。 直方图:观察数据分布“形状” 案例:CCSS_Sample.sav,绘制消费者信心值的直方图 分段直
阅读全文
posted @
2020-01-15 13:50
foremost
阅读(2619)
推荐(0)
SPSS-数据文件的合并与拆分&SPSS预分析
摘要:第五章 数据文件的合并与拆分 添加变量 多个数据文件的合并 变量的合并 练习: 1.将带权重的问卷录入数据.sav中的权重变量添加到问卷录入数据(整理后).sav文件中,并尽量保留数据。 操作流程:数据——合并文件——添加变量 2. a.Sav包括了id号为偶数的5位受访者的性别、年龄和身高,c.s
阅读全文
posted @
2020-01-14 22:37
foremost
阅读(4120)
推荐(0)
Spss基础知识
摘要:SPSS基础分析 SPSS基础分析 SPSS预分析 建模分析 案例分析 第一章 数据分析基础知识 什么是数据分析? 什么是数据分析? 统计学( Statistics ) 收集、处理、分析、解释数据,并从数据中得出结论来指导实际生活和生产。分为描述统计学和推断统计学。其中,描述性统计研究的是数据收集,
阅读全文
posted @
2020-01-13 21:47
foremost
阅读(2948)
推荐(0)
hive正则表达式
摘要:hive正则 正则表达式描述了一种字符串匹配的模式,可以用来检查一个字符串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。 正则表达式是由普通字符以及特殊字符组成的文字模式。 普通字符:包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号 ^ 匹配输入字符串的开始位
阅读全文
posted @
2020-01-12 14:22
foremost
阅读(16531)
推荐(0)
hive
摘要:hive基础 大数据特性与应用 分布式架构概念 Hadoop2.x系统介绍 掌握hive基础建表,以及表格式 了解hive查询 了解正则表达式 1、hive的简介‘’ hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类sql的查询功能 hive的本质:
阅读全文
posted @
2020-01-11 21:30
foremost
阅读(249)
推荐(0)
hadoop 大数据框架
摘要:1、hadoop 大数据框架 Hadoop 是一个应用Java语言实现的软件框架,廉价的计算机组成的集群运行海量数据的分布式并行计算框架,支持上千个节点和PB级别的数据。Hadoop是项目的总称 分布式: 大数据: 指无法在一定时间范围内用常规软件工具进行捕捉,管理和处理的数据集合。 1024MB=
阅读全文
posted @
2020-01-10 11:26
foremost
阅读(683)
推荐(0)
导入虚拟机
摘要:1空白处单击打开 shanghai hadoop 123456 root 123456 Hadoop hive 配置网络: 编辑 虚拟网络编辑器 nat模式 nat设置 网关ip # cd /etc/sysconfig/network-scripts/ #vi ifcfg-ens33 #servic
阅读全文
posted @
2020-01-10 11:25
foremost
阅读(422)
推荐(0)
大数据之Linux必知必会
摘要:Linux是一个功能强大的操作系统 它是一个自由软件,是免费的、源代码开发的 设计目标是建立不受任何商品化软件版权制约的、全世界都能自由使用的类unix兼容产品 内核官网:http://www.kernel.org/ VMware虚拟机安装 1.VMware简介 VMware 是一个虚拟PC的软件,
阅读全文
posted @
2020-01-09 16:54
foremost
阅读(606)
推荐(0)
R-第8天
摘要:1、table函数频数统计 注意路径是双斜线 \\ #读入csv文件 read.csv(file = "E:\\files\\DT\\BF\\R语言\\R第8天\\drink.csv", header = T) #读入.data文件 dr<-scan("E:\\files\\DT\\BF\\R语言\
阅读全文
posted @
2020-01-05 19:40
foremost
阅读(422)
推荐(0)
R-电商人力模型
摘要:1、练习题 #作业:构造6个数据框,每个数据框分别有三个变量, #id、type、score #id:是0-9,10-19,20-29…… #type:"A","B","C"…… #score:长度为10的随机数 #把这6个数据框写到一张表里,表名:pro library(RMySQL) conn<
阅读全文
posted @
2020-01-05 14:34
foremost
阅读(351)
推荐(0)
假设检验--A/Btest
摘要:这是两款键盘布局不一样的手机(A版本,B版本),你作为公司的产品经理,想在正式发布产品之前知道,哪个键盘布局对用户体验更好呢? 首先,我们需要设置目标,用来衡量各个版本的优劣,如果是电商网站,目标可以是点击率,注册率,页面停留时间等。 在这个键盘布局案例里,如果一个键盘布局对用户打字时拼错产生的影响
阅读全文
posted @
2020-01-03 14:25
foremost
阅读(1205)
推荐(0)
相关配对检验
摘要:其他类型假设检验如何实现? 配对相关样本检验项目实战:如何验证统计学现象? 双独立样本检验项目实战:键盘布局A/B测试 (二)相关配对检验 斯特鲁普效应 斯特鲁普效应是当有与原有认知不同的情况出现时,人们的反应时间会较长。 实验设计 通过网上的stroop实验做测试人的反应时间(https://fa
阅读全文
posted @
2020-01-03 13:50
foremost
阅读(1073)
推荐(0)
假设检验-单样本检验
摘要:假设检验时数据分析必须学习的方法 第一部分:误差思维和置信区间 什么是误差思维? 误差永远存在、不可避免随机干扰因素的影响 一个量在测量、计算或观察过程中由于某些错误或通常由于某些不可控制的因素的影响而造成的变化偏离标准值或规定值的数量 ,误差是不可避免的。只要有估计,就会有误差。 什么是置信区间?
阅读全文
posted @
2020-01-02 15:54
foremost
阅读(3065)
推荐(0)
推论统计分析-如何避免偏见和抽样分布
摘要:什么是总体和样本? 随机数random模块 # 导入 random(随机数) 模块 import random ''' 使用random 模块的 randint() 函数来生成随机数 语法是:random.randint(a,b) 函数返回数字 N , N 为a到b之间的数字(a <= N <= b
阅读全文
posted @
2019-12-28 23:46
foremost
阅读(546)
推荐(0)
推论统计分析1
摘要:推论统计学是数据分析、机器学习的基石 第一部分:总体的2种商业模式分式 什么是概率分布? 概率分布,是指用于表述随机变量取值的概率规律。事件的概率表示了一次试验中某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即随机试验的概率分布。如果试验结果用变
阅读全文
posted @
2019-12-28 13:49
foremost
阅读(565)
推荐(0)
共享单车数据分析
摘要:共享单车数据分析和共享单车用户行为分析PPT 从数据分析,到数据展示,完成一个完整数据分析项目的全部过程 共享单车由于其符合低碳出行理念,政府对这一新鲜事物也处于善意的观察期。 2017年12月,共享单车入选2017年民生热词榜。 2017年12月,ofo率先取消了免费月卡,月卡价格也已调整为20元
阅读全文
posted @
2019-12-26 10:48
foremost
阅读(3678)
推荐(0)
R-长尾词练习
摘要:一、 长尾关键词的特征 长尾关键词通常比较长,往往是2-3个词组成,甚至是短语,存在于内容页面,除了内容页的标题,还存在于内容中。 长尾关键词搜索量虽然非常少,而且不稳定。但是搜索量甚至超越热门目标关键词,并且在大中型网站中占据大量流量! 先在excel复制 读取长尾词 #读取长尾词 changwc
阅读全文
posted @
2019-12-20 22:02
foremost
阅读(282)
推荐(0)