摘要:
总结最近数据分析过程中遇到的一些问题的思考 1.问卷中多选题的录入与分析 2.数据分析流程的第一步:对所分析的样本数据本身的特征结构进行预分析 3.根据数据中的某个因素的几个水平来分析数据总体的差异性。 4.根据数据中的变量之间的相关性,了解数据的内部关系,并建立模型。 5.数据的降维处理。 6.结 阅读全文
posted @ 2021-07-08 19:55
BabyGo000
阅读(2887)
评论(0)
推荐(0)
摘要:
目录 1、数据采集 2、数据是否服从正态分布 3、T检验(T Test) 4、方差分析(ANOVA) 5、卡方检验(Chi-square Test) 6、灰色关联度分析(Grey Relation Analysis,GRA) 7、弗里德曼检验(Friedman Test) 8、箱图(Box) 1、数 阅读全文
posted @ 2021-07-08 19:54
BabyGo000
阅读(4590)
评论(0)
推荐(0)
摘要:
index="apachedata" sourcetype="access_combined_wcookie" "action=purchase" |top 3 productId[/code] 
评论(0)
推荐(0)
摘要:
**package** mllib.tree **import** org.apache.log4j.{Level, Logger} **import** org.apache.spark.mllib.evaluation.MulticlassMetrics **import** org.apach 阅读全文
posted @ 2021-07-08 19:25
BabyGo000
阅读(319)
评论(0)
推荐(0)
摘要:
Spark Streaming编程初级实践 一、安装Hadoop和Spark 具体的安装过程在我以前的博客里面有,大家可以通过以下链接进入操作: Hadoop的安装:https://blog.csdn.net/weixin_47580081/article/details/108647420 Sca 阅读全文
posted @ 2021-07-08 19:24
BabyGo000
阅读(1619)
评论(0)
推荐(0)
摘要:
Spark大数据分析与实战:RDD编程初级实践 一、安装Hadoop和Spark 具体的安装过程在我以前的博客里面有,大家可以通过以下链接进入操作: Hadoop的安装:https://blog.csdn.net/weixin_47580081/article/details/108647420 S 阅读全文
posted @ 2021-07-08 19:23
BabyGo000
阅读(582)
评论(0)
推荐(0)
摘要:
去年网上曾放出个2000W的开房记录的数据库, 不知真假。 最近在学习Spark, 所以特意从网上找来数据测试一下, 这是一个绝佳的大数据素材。 如果数据涉及到个人隐私,请尽快删除, 本站不提供此类数据。你可以写个随机程序生成2000W的测试数据, 以CSV格式。 Spark是UC Berkeley 阅读全文
posted @ 2021-07-08 19:22
BabyGo000
阅读(291)
评论(0)
推荐(0)
摘要:
做SEM的我们都知道,百度凤巢系统的后台其实功能很强大,有几大数据报告报表十分的有用,可以帮助我们更好的进行优化账户工作,也为我们优化操作提供了强有力的依据。 像搜索词报告、无效点击报告、地域报告、高级样式报告都是SEM数据分析的一个重要依据,那么今天我们就来讲讲其中的关键词报告。 对于数据分析中, 阅读全文
posted @ 2021-07-08 19:21
BabyGo000
阅读(305)
评论(0)
推荐(0)
摘要:
<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">今天继续和小伙伴们分享聚类算法和R语言的实现,上篇和大家分享了聚类中的距离、类间距离和最古典的层次聚类法,今天 阅读全文
posted @ 2021-07-08 19:20
BabyGo000
阅读(66)
评论(0)
推荐(0)
摘要:
图形展示是最高效且形象的数据描述手段,因此巧妙的图像展示是高质量数据分析报告的必备内容,因此强大的图形展示功能也是统计分析软件的必备功能。R语言提供了强大的吐血展示功能。今天我由简单到复杂分别和小伙伴们分享如何用R语言画出各位想要的图形。 首先罗列下所有可选图形: 1、直方图(hist());2、散 阅读全文
posted @ 2021-07-08 19:18
BabyGo000
阅读(542)
评论(0)
推荐(0)
浙公网安备 33010602011771号