随笔分类 -  Python - Algorithm

摘要:多元函数拟合。如 电视机和收音机价格多销售额的影响,此时自变量有两个。 python 解法: 拟合的各项评估结果和参数都打印出来了,其中结果函数为: f(sales) = β0 + β1*[TV] + β2*[radio] f(sales) = 2.9211 + 0.0458 * [TV] + 0. 阅读全文
posted @ 2018-01-31 18:27 驯龙高手 阅读(10525) 评论(0) 推荐(0)
摘要:通过 1至10 阶来拟合对比 均方误差及R评分,可以确定最优的“最大阶数”。 因为因变量 Y = 2*(X**4) + X**2 + 9*X + 2 ,自变量和因变量是完整的公式,看图很明显,degree >=4 的都符合,拟合函数都正确。(RMSE 最小,R平方非负且接近于1,则模型最好) 如果将 阅读全文
posted @ 2018-01-31 12:21 驯龙高手 阅读(6412) 评论(0) 推荐(1)
摘要:一元一阶线性拟合: 假设存在一条线性函数尽量能满足所有的点:y=ax+b .对所有点的的公式为: 残差值β = 实际值y - 估计值y,β 应尽量小,当 β = 0 时,则完全符合一元线性方程:y=ax+b 通过最小二乘法计算残差和最小: 根据微积分,当 Q 对 a、b 的一阶偏导数为了0时,Q 达 阅读全文
posted @ 2018-01-26 13:50 驯龙高手 阅读(27669) 评论(1) 推荐(3)
摘要:卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。(更多参考:卡方检验、卡方分布) 不讲过多理论,主要使用 python 实现卡方验证。之前 阅读全文
posted @ 2018-01-14 08:56 驯龙高手 阅读(1907) 评论(0) 推荐(0)
摘要:探索性数据分析,主要针对原始数据进行初次了解。了解数据的分布情况、了解分析方向、排除该单个变量的异常值 等。此脚本读取的是 SQL Server ,只需给定表名或视图名称,如果有数据,将输出每个字段符合要求的每张数据分布图。 显示图分为字符型(离散型)和数值型(连续型),示例结果如下: 阅读全文
posted @ 2018-01-12 16:11 驯龙高手 阅读(14018) 评论(0) 推荐(2)