随笔分类 -  sas数据分析

摘要:*模拟求导 步长一定要比阈值小,才能得出准确的结果;data Derivation (keep=interval slope); * function y = 1/x only concern about x>0; deltaX = 1e-6; *割线变为切线时x1减小的步长; x... 阅读全文
posted @ 2015-01-06 23:03 暴走的豆浆 阅读(843) 评论(0) 推荐(0)
摘要:理论和公式请看网易公开课中Andrew Ng的机器学习,或者coursera中Andrew Ng的机器学习对于多元线性回归要拟合最好的直线,要使得误差平方和最小,课本上的方法都是求偏导,并使其为0,然后求解线性方程组。但是还有很多其他方法可以达到上述效果,Andrew在大样本和小样本的情况下给出了两... 阅读全文
posted @ 2015-01-06 19:04 暴走的豆浆 阅读(1707) 评论(0) 推荐(0)
摘要:Y1 X1 Y2 X2 Y3 X3 Y4 X48.04 10 9.14 10 7.46 10 6.58 86.95 8 8.14 8 6.77 8 5.76 87.58 ... 阅读全文
posted @ 2015-01-02 19:11 暴走的豆浆 阅读(6064) 评论(0) 推荐(0)
摘要:数据预处理->数据探索->模型选择->残差检验、共线性争端,强影响点判断->模型修正(否->模型选择,是->模型预测)一:数据预处理二:数据探索看y是否服从正态分布(PP图)proc univariate data=reg.b_fitness; var Runtime -- Performan... 阅读全文
posted @ 2014-12-25 15:35 暴走的豆浆 阅读(6697) 评论(0) 推荐(1)
摘要:index: proc means | proc freq|proc univariate/*******************proc means*********************/PROC MEANS ;BY variable-1 variable-n>; CLASS variab... 阅读全文
posted @ 2014-12-23 19:54 暴走的豆浆 阅读(14437) 评论(0) 推荐(0)
摘要:相关分析是对进一步分析的很多帮助的一种分析方法,通过简单的散点图可以直观的看出两个变量之间的关系1:corr procedure解决两个连续变量间的关系2:列联表分析一般研究离散变量或定性变量间是否存在相关关系,通过proc freq实现2.1:两个定性变量(其中一个无序)之间有无关系可以通过卡方分... 阅读全文
posted @ 2014-12-22 23:08 暴走的豆浆 阅读(3794) 评论(0) 推荐(0)