摘要: 一、 COUNT函数 在实际统计应用中,需要计算观测值出现的次数,这项功能可以通过COUNT函数来实现,它有下面三种形式和功能: form you used 返回值 例子 COUNT(*) 整个表或组的行数 select count(*) as Count COUNT(column) 当参数中所选定的列没有缺失值时,输出表或者组中该变量的行数 select c... 阅读全文
posted @ 2014-08-16 13:42 chenyn68 阅读(9249) 评论(0) 推荐(0) 编辑
摘要: 一、Objectivesdisplay all rows, eliminate duplicate rows, and limit the number of rows displayedsubset rows using other conditional operators and cacula... 阅读全文
posted @ 2014-08-09 10:49 chenyn68 阅读(1318) 评论(0) 推荐(0) 编辑
摘要: SQL: Structured Query Language一、Objectives in this chapter:invoke the SQL procedureselect columnsdefine new columnsspecify the table(s) to readspecify... 阅读全文
posted @ 2014-08-07 01:12 chenyn68 阅读(525) 评论(0) 推荐(0) 编辑
摘要: 聚类(Clustering)分析有一个通俗的解释和比喻,那就是“物以类聚,人以群分”。针对几个特定的业务指标,可以将观察对象的群体按照相似性和相异性进行不同群组的划分。经过划分后,每个群组内部个对象间的相似度会很高,而在不同群组之间的对象彼此间将具有很高的相异度。 聚类技术一方面本身就是一种... 阅读全文
posted @ 2014-08-06 00:06 chenyn68 阅读(1402) 评论(0) 推荐(0) 编辑
摘要: 一、关联规则中的频繁模式 关联规则(Association Rule)是在数据库和数据挖掘领域中被发明并被广泛研究的一种重要模型,关联规则数据挖掘的主要目的是找出:【频繁模式】:Frequent Pattern,即多次重复出现的模式和并发关系(Cooccurrence Relationships)... 阅读全文
posted @ 2014-08-05 23:31 chenyn68 阅读(2106) 评论(0) 推荐(0) 编辑
摘要: 一、回归概述 回归(Regression)分析包括线性回归(Linear Regression),这里主要是指多元线性回归和逻辑斯蒂回归(Logistic Regression)。其中,在数据化运营中更多的使用逻辑斯蒂回归,它包括响应预测、分类划分等内容。 多元线性回归主要描述一个因变量如何随... 阅读全文
posted @ 2014-08-04 20:58 chenyn68 阅读(2835) 评论(0) 推荐(0) 编辑
摘要: 神经网络模型一、神经网络原理对网络模型的研究始于20世纪40年代,作为一门交叉学科,它是人类基于对其大脑神经认识的基础上,人工构造实现某种功能的网络模型。经过将近70年的发展,神经网络模型已成为机器学习的典型代表,它不依照任何概率分布,而是模仿人脑功能... 阅读全文
posted @ 2014-07-31 00:05 chenyn68 阅读(1902) 评论(0) 推荐(0) 编辑
摘要: 一、决策树基本概述 决策树(Decison Tree)之所以称为树是因为其建模过程类似一棵树的成长过程,即从根部开始,到树干,到分支,再到细枝末叶的分叉,最终胜出出一片片的树叶。在数据树里面,所分析的数据数据样本先是成为一个树根,然后经过层层分支,最终形成若干个节点,每个节点代表一个结论。从决策... 阅读全文
posted @ 2014-07-30 00:45 chenyn68 阅读(2842) 评论(0) 推荐(0) 编辑
摘要: 1 【例子】 2 3 data a; 4 arg='ABC.DEF(X=Y)'; 5 word=scan(arg,3); 6 put word; 7 run;/*word:X=Y*/ 8 9 data b;10 arg='ABC.DEF(X=Y)';11 word=scan(arg,-3);1... 阅读全文
posted @ 2014-07-26 10:07 chenyn68 阅读(10231) 评论(0) 推荐(1) 编辑
摘要: INPUT语句1 INPUT Food $; /*采用list-style input,字符型变量默认长度为8*/2 INPUT Food $1-10; /*采用column input,长度由列的数量决定*/3 INPUT Food $15.; /*采用formatted input,长度form... 阅读全文
posted @ 2014-07-25 22:31 chenyn68 阅读(6235) 评论(0) 推荐(0) 编辑