随笔分类 -  数据算法相关

该文被密码保护。
posted @ 2019-02-25 10:40 anovana 阅读(2) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2019-02-21 10:58 anovana 阅读(5) 评论(0) 推荐(0)
摘要:一、 统计学习概述 统计学习是指一组用于理解数据和建模的工具集。这些工具可分为有监督或无监督。1、监督学习:用于根据一个或多个输入预测或估计输出。常用于商业、医学、天体物理学和公共政策等领域。2、无监督学习:有输入变量,但没有输出变量,可以从这些数据中学习潜在关系和数据结构。以下简单的用3个数据集来 阅读全文
posted @ 2019-02-12 10:34 anovana 阅读(963) 评论(0) 推荐(0)
摘要:我们在学习期间都接触过自然常数e,也知道e ≈ 2.718,学过极限的同学应该也知道 那么大家知道e的含义是什么吗?为啥叫“自然常数”? e的含义可以用一个计算利息的例子来解释。 假如你有1块钱,银行抽风了一年利率100%。 如果一年结算一次,一年后就能得到1×(1+1)=2块钱。 如果半年结算一次 阅读全文
posted @ 2019-02-02 15:04 anovana 阅读(11526) 评论(0) 推荐(0)
摘要:1、起源 CRISP-DM (cross-industry standard process for data mining), 即为"跨行业数据挖掘过程标准"。此KDD(knowledge discovery in database,KDD, 数据库知识发现)过程模型于1999年欧盟机构联合起草. 阅读全文
posted @ 2018-03-07 09:58 anovana 阅读(2544) 评论(0) 推荐(1)
摘要:总结一下,在我看来,p.Value仅仅是在,假设检验,这理论框架下,对于证据力度的一个测量。而且,我们不大可能推翻假设检验这个框架,似乎也不必要,因为,这个框架非常合理,有广泛的应用场景,有强大的生命力。但是,p.Value确实有他的缺点,这个缺点是非常正常的,因为所有方法都有缺点。这是上面讨论的要 阅读全文
posted @ 2018-01-31 10:08 anovana 阅读(554) 评论(0) 推荐(0)
摘要:Chevalier Meirtz的总结如下: 如何区分类与回归,看的不是输入,而是输出的连续与否。例如:云青青兮欲雨。这个“云青青”就是输入,“青青”就是云的特征,而雨就是我们的预测输出。可以看到,在这个问题中,我们想得到的输出是天气,他是晴朗、阴天等天气状况的子集,是不连续的,所以这就是一个典型的 阅读全文
posted @ 2017-12-13 10:47 anovana 阅读(4873) 评论(0) 推荐(0)
摘要:回归(Regression)是一种数学模型,指研究一组随机变量(Y1 ,Y2 ,…,Yi)和另一组(X1,X2,…,Xk)变量之间关系的统计分析方法,又称多重回归分析。通常Y1,Y2,…,Yi是因变量,X1、X2,…,Xk是自变量。 最简单的情形是一元线性回归,由大体上有线性关系的一个自变量和一个因 阅读全文
posted @ 2017-12-13 10:32 anovana 阅读(413) 评论(0) 推荐(0)