摘要:
聚类分析:对样品或指标进行分类的一种分析方法,依据样本和指标已知特性进行分类。 本节主要介绍R语言层次聚类分析,一共包括3个部分,每个部分包括一个具体实战例子。 1、常规聚类过程: 一、首先用dist()函数计算变量间距离 dist.r = dis... 阅读全文
posted @ 2017-12-22 11:38
banlucainiao
阅读(240)
评论(0)
推荐(0)
摘要:
写在前面 在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种。当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家如果有需要收藏到书签中。 如果大家还知道哪些常用的命令,也可以在评论中回复我。... 阅读全文
posted @ 2017-12-22 11:21
banlucainiao
阅读(38)
评论(0)
推荐(0)
摘要:
使用numpy包: import numpy as npa=np.array(([1,2,3,4]))np.median(a)#中位数np.percentile(a,95)#95%分位数 参考: https://docs.scipy.org/doc/num... 阅读全文
posted @ 2017-12-22 11:02
banlucainiao
阅读(76)
评论(0)
推荐(0)
摘要:
在R语言中,经常会遇到变量名称和字符串相互转换的问题。比如说,进行1000次循环运算,并将运算结果存储在1000个变量中,如x_1, x_2, ... , x_1000。这时候可以使用assign()函数,示例如下: > a 错误: 找不到对象'a' > a... 阅读全文
posted @ 2017-12-22 10:34
banlucainiao
阅读(316)
评论(0)
推荐(0)
摘要:
一、数据的概括性度量 1、统计学概括: 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。统计学主要又分为描述统计学和推断统计学。... 阅读全文
posted @ 2017-12-22 10:03
banlucainiao
阅读(206)
评论(0)
推荐(0)