摘要: 一. 概念 关联分析用于发现隐藏在大型数据集中的有意义的联系。所发现的联系可以用关联规则(association rule)或频繁项集的形式表示。 项集:在关联分析中,包含0个或多个项的集合被称为项集(itemset)。如果一个项集包含k个项,则称它为k-项集。例如:{啤酒,尿布,牛奶,花生} 是一 阅读全文
posted @ 2016-08-16 21:15 DM_CC 阅读(19675) 评论(0) 推荐(4) 编辑
摘要: Linux操作系统是多用户操作系统,它允许多个用户同时登录到系统中,使用系统资源,为了使所有用户的工作都能顺利进行,保护每个用户的文件和进程,也为了系统自身的安全和稳定,必须建立起一种机制,使每个用户的权限都能得到规范。为此,首先区分不同的用户,这就产生了用户账户。 账户实际上就算一个用户在系统中的 阅读全文
posted @ 2016-12-07 11:44 DM_CC 阅读(883) 评论(0) 推荐(0) 编辑
摘要: R中有三种不同的循环结构: 1.repeat结构 它只是简单的重复同一个表达式:repeat expression,如果要跳出循环,可以使用break命令,若要跳至循环中的下一轮迭代,需要使用next命令;如果在循环中不包括break命令,R代码将会是一个无限循环。 因此,常用的结构如下: 举例如下 阅读全文
posted @ 2016-08-17 11:18 DM_CC 阅读(11798) 评论(0) 推荐(0) 编辑
摘要: 在R中通过RODBC包访问一个数据库是最方便的方式,这种方式允许R连接到任意一种拥有ODBC驱动的数据库。 下面以Oracle 11g 为例: 1.通过ODBC数据源管理器配置用户DSN:(通过控制面板,选择小图标查看方式,点击ODBC,出现如下窗口,第一次需要进行配置,点击添加按钮进行配置即可) 阅读全文
posted @ 2016-07-27 21:20 DM_CC 阅读(5988) 评论(1) 推荐(0) 编辑
摘要: R语言中的机器学习程序包主要如下所示: 阅读全文
posted @ 2016-07-27 20:06 DM_CC 阅读(1838) 评论(0) 推荐(0) 编辑
摘要: R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框、列表、因子。 1.标量:标量是只包含一个元素的向量 > a <- 1; # 数值型 > b <- "China"; # 字符型 > c <- TRUE; # 逻辑型 2.向量:向量用于存储数值型、字符型或逻辑型数据的一维数组。通过 阅读全文
posted @ 2016-07-26 21:10 DM_CC 阅读(668) 评论(0) 推荐(0) 编辑