随笔分类 - 数据算法相关
摘要:一、 统计学习概述 统计学习是指一组用于理解数据和建模的工具集。这些工具可分为有监督或无监督。1、监督学习:用于根据一个或多个输入预测或估计输出。常用于商业、医学、天体物理学和公共政策等领域。2、无监督学习:有输入变量,但没有输出变量,可以从这些数据中学习潜在关系和数据结构。以下简单的用3个数据集来
阅读全文
摘要:我们在学习期间都接触过自然常数e,也知道e ≈ 2.718,学过极限的同学应该也知道 那么大家知道e的含义是什么吗?为啥叫“自然常数”? e的含义可以用一个计算利息的例子来解释。 假如你有1块钱,银行抽风了一年利率100%。 如果一年结算一次,一年后就能得到1×(1+1)=2块钱。 如果半年结算一次
阅读全文
摘要:1、起源 CRISP-DM (cross-industry standard process for data mining), 即为"跨行业数据挖掘过程标准"。此KDD(knowledge discovery in database,KDD, 数据库知识发现)过程模型于1999年欧盟机构联合起草.
阅读全文
摘要:总结一下,在我看来,p.Value仅仅是在,假设检验,这理论框架下,对于证据力度的一个测量。而且,我们不大可能推翻假设检验这个框架,似乎也不必要,因为,这个框架非常合理,有广泛的应用场景,有强大的生命力。但是,p.Value确实有他的缺点,这个缺点是非常正常的,因为所有方法都有缺点。这是上面讨论的要
阅读全文
摘要:Chevalier Meirtz的总结如下: 如何区分类与回归,看的不是输入,而是输出的连续与否。例如:云青青兮欲雨。这个“云青青”就是输入,“青青”就是云的特征,而雨就是我们的预测输出。可以看到,在这个问题中,我们想得到的输出是天气,他是晴朗、阴天等天气状况的子集,是不连续的,所以这就是一个典型的
阅读全文
摘要:回归(Regression)是一种数学模型,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。通常Y1,Y2,…,Yi是因变量,X1、X2,…,Xk是自变量。 最简单的情形是一元线性回归,由大体上有线性关系的一个自变量和一个因
阅读全文

浙公网安备 33010602011771号