随笔分类 - 统计学
摘要:昨天在朋友圈发了一张截图,貌似很多朋友没有 get 到点,我也实在搞不懂 Yahoo 的这波操作。 默认排序是按照金牌总数,那必然是美国第一名了。不过习惯上不应该是按照金牌总数进行排名吗?毕竟金银铜牌所代表的分量是不一样的。 Yahoo 这张图最诡异的是什么?选择按照金牌总数排序,柱子只是换了位置,
阅读全文
摘要:Bookdown是著名R包作者谢益辉开发的,支持采用Rmarkdown (R代码可以运行)或普通markdown编写文档,然后编译成HTML, WORD, PDF, Epub等格式。 bookdown是个素颜版的 LaTeX ,满足了99%的需求,而使用难度大概只有 LaTeX 的1%,性价比极高。
阅读全文
摘要:机器学习深度研究:特征选择过滤法中几个重要的统计学概念————卡方检验、方差分析、相关系数、p值 问题引出 当我们拿到数据并对其进行了数据预处理,但还不能直接拿去训练模型,还需要选择有意义的特征(即特征选择),这样做有四个好处: 1、避免维度灾难 2、降低学习难度 3、减少过拟合 4、增强对特征和特
阅读全文
摘要:机器学习数学基础:学习线性代数,千万不要误入歧途!推荐一个正确学习路线 序言 写完《机器学习深度研究:机器学习中的高等数学/微积分及Python实现》,觉得十分对不起读者,写的自己都不满意。 就像前篇所说,这种极度基础的知识是最难介绍的,我也在思考如何转变方式,把问题讲清楚。但是头条是不支持数学公式
阅读全文
摘要:作者:Pier Paolo Ippolito@南安普敦大学 编译:机器学习算法与Python实战(微信公众号:tjxj666) 原文:https://towardsdatascience.com/probability distributions in data science cce6e64873
阅读全文
摘要:大家应该对李宏毅老师不陌生吧?李宏毅现任国立台湾大学电气工程系助理教授,研究重点是机器学习(尤其是深度学习方向)、口语理解和语音识别。他的人工智能系列公开课是Youtube上最火的人工智能系列课程。很多机器学习初学者都学习过他的《机器学习》公开课。李老师讲课通俗易懂、课程案例生动有趣(还记得宝可梦和
阅读全文
摘要:机器学习100天|Day1数据预处理 100天搞定机器学习|Day2简单线性回归分析 100天搞定机器学习|Day3多元线性回归 100天搞定机器学习|Day4-6 逻辑回归 100天搞定机器学习|Day7 K-NN 100天搞定机器学习|Day8 逻辑回归的数学原理 100天搞定机器学习|Day9
阅读全文
摘要:统计学习(Statistical learning)是目前人工智能领域最为活跃的一个分支,其理论基础是统计学习理论(Statistical learning theory,以下有时会简称SLT):一种以数理统计为数学基础,研究是否可以以及如何从经验数据中学习普遍概念的理论。 目前诸多机器学习相关的初
阅读全文
摘要:方差分析泛应用于商业、经济、医学、农业等诸多领域的数量分析研究中。例如商业广告宣传方面,广告效果可能会受广告式、地区规模、播放时段、播放频率等多个因素的影响,通过方差分析研究众多因素中,哪些是主要的以及如何产生影响等。而在经济管理中,方差分析常用于分析变量之间的关系,如人民币汇率对股票收益率的影响、...
阅读全文
摘要:访问矩阵元素>> A=[1,2,3;4,5,6;7,8,9];>> x=A(2,3)% 双下标访问x =6>> x=A(2)% 单下标访问x =4单下标访问时相当于访问A所转成的向量的元素。>> A(3:6)ans =7 2 5 8>>y4=A(:,1:2)%提取A的前两列元素y4 =1 24 57...
阅读全文
摘要:卡方检验的功能与意义SPSS的卡方检验是非参数检验方法的一种,其基本功能足通过样本的频数分布来推断总体是否服从某种理论分布或某种假设分布,这种检验过程是通过分析实际的频数与理论的频数之间的差别或是说吻合程度来完成的。相关数据随机抽取100名某地新生婴儿性别。研究该地区新生婴儿男女比例是否存在明显的差...
阅读全文
摘要:假设检验及R实现7.1假设检验概述对总体参数的具体数值所作的陈述,称为假设;再利用样本信息判断假设足否成立,这整个过程称为假设检验。7.1.1理论依据假设检验之所以可行,其理沦背景是小概率理论。小概率事件在一次试验中儿乎是不可能发生的,但是它一以发生,我们就有理由拒绝原假设:反之,小概率事件没有发生...
阅读全文
摘要:单一样本t检验的功能与意义spss的单一样本t检验过程是瑕设检验中最基本也是最常用的方法之一,跟所有的假没检验一样,其依剧的基木原理也是统计学中的‘小概率反证法”原理。通过单一样本t检验。我们可以实现样本均值和总体均值的比较,所以单一样本t检验过程也属于均值比较这一体系例:高校体检第一次体检男生平均...
阅读全文
摘要:处理缺失数据的高级方法15.1 处理缺失值的步骤一个完整的处理方法通常包含以下几个步骤:(1) 识别缺失数据;(2) 检查导致数据缺失的原因;(3) 删除包含缺失值的实例或用合理的数值代替(插补)缺失值。缺失数据的分类:(1) 完全随机缺失:若某变量的缺失数据与其他任何观测或未观测变量都不相关,则数...
阅读全文
摘要:在绑定属性时,如果我们直接把属性暴露出去,虽然写起来很简单,但是,没办法检查参数,导致可以把成绩随便改:s = Student()s.score = 9999为了限制score的范围,可以通过一个set_score()方法来设置成绩,再通过一个get_score()来获取成绩,这样,在set_sco...
阅读全文
摘要:第十一章中级绘图本章内容:二元变量和多元变量关系的可视化绘制散点图和折线图理解相关图学习马赛克图和关联图本章用到的函数有:plothexbinablinesiplotscatterplotscatterplot3dpairsplot3dscatterplotMatrixscatter3dcpairs...
阅读全文
摘要:功效分析功效分析可以帮助在给定置信度的情况下,判断检测到给定效应值时所需的样本量。反过来,它也可以帮助你在给定置信度水平情况下,计算在某样本量内能检测到给定效应值的概率。如果概率低得难以接受,修改或者放弃这个实验将是一个明智的选择。10.1假设检验速览在研究过程时,研究者通常关注四个量:样本大小、显...
阅读全文
摘要:面向对象编程面向对象编程——Object Oriented Programming,简称OOP,是一种程序设计思想。OOP把对象作为程序的基本单元,一个对象包含了数据和操作数据的函数。面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。为了简化程序设计,面向过程把函数继续切分为...
阅读全文
摘要:高阶函数Higher-orderfunction变量可以指向函数>>> abs #abs(-10)是函数调用,而abs是函数本身>>> f = abs #函数本身也可以赋值给变量>>> f #变量可以指向函数>>> f(-10) #变量调用函数10函数名也是变量>>> abs = 10>>> abs...
阅读全文
摘要:8.3回归诊断> fit par(mfrow=c(2,2))> plot(fit)为理解这些图形,我们来回顾一下oLs回归的统计假设。口正态性当预测变量值固定时,因变量成正态分布,则残差值也应该是一个均值为0的正态分布。正态Q-Q图(Normal Q-Q,右上)是在正态分布对应的值下,标准化残差的概...
阅读全文
浙公网安备 33010602011771号