05 2016 档案
KS-检验(Kolmogorov-Smirnov test) -- 检验数据是否符合某种分布
摘要:Kolmogorov Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x) g(x)|,当实际观测值D D(n,α)则拒绝H0,否则则接受H0假设。 KS检验与t 检验之类的其他方法不同是K 阅读全文
posted @ 2016-05-16 00:40 Arkenstone 阅读(261516) 评论(3) 推荐(7)
R如何检验类别变量(nominal variable)与其他变量之间的相关性
摘要:1.使用Pearson积差相关系性进行检验的话可以判断两个变量之间的相关性是否显著以及相关性的强度 显著性检验 (significant test) 连续变量 vs 类别变量 (continuous variable VS nominal variable): ANOVA检验(R中可使用aov函数) 阅读全文
posted @ 2016-05-08 23:02 Arkenstone 阅读(16558) 评论(0) 推荐(0)
python数据分析师面试题选
摘要:以下题目均非原创,只是汇总 python数据分析部分 1. 如何利用SciKit包训练一个简单的线性回归模型 利用linear_model.LinearRegression()函数 2. 例举几个常用的python分析数据包及其作用 数据处理和分析:NumPy, SciPy, Pandas 机器学习 阅读全文
posted @ 2016-05-06 20:43 Arkenstone 阅读(40272) 评论(3) 推荐(2)
R %operator% 含义
摘要:%foo% is the syntax for a binary operator. In base R: %in%: ‘"%in%" 0’ %/% and %% perform integer division and modular division respectively, and are 阅读全文
posted @ 2016-05-05 13:02 Arkenstone 阅读(642) 评论(0) 推荐(0)