随笔分类 -  数据分析

hive建表导入数据
摘要:hive中的表只能从本地、HDFS或者Hive的表中导入数据,不能直接插入数据; 其中在Hive的表中查询数据导入另外的表中的命令如下: HDFS上导入数据的命令为: 阅读全文

posted @ 2017-12-28 22:29 XLeer 阅读(539) 评论(0) 推荐(0)

5中常用的相关分析方法
摘要:一、折线图分析法和散列图分析法 二、协方差(两个参数)与协方差矩阵(参数大于两个) 三、相关系数法(可以直接用excel求相关系数) 四、一元回归(两个参数)和多元回归(多余两个参数) 五、信息熵及互信息 互信息指的是两个随机变量之间的关联程度,即给定一个随机变量后,另一个随机变量不确定性的削弱程度 阅读全文

posted @ 2016-07-01 21:43 XLeer 阅读(413) 评论(0) 推荐(0)

导航