摘要: 1、数据插入 INSERT INTO table_name (列1, 列2,...) VALUES(值1, 值2,....),(第二条),(第三条)... 注:1)如果表中的每一列均有数据插入,则可不用指定任何表名:INSERT INTO 表名称 VALUES (值1, 值2,....)2)若要插入多行数据可以结合UNION ALL语句。 2、数据修改 update set =新值 ... 阅读全文
posted @ 2016-08-28 11:42 萱草yy 阅读(286) 评论(0) 推荐(0) 编辑
摘要: 1、创建基本表 create table ([列级完整性约束条件] [,[列级完整性约束条件] ......... ... 阅读全文
posted @ 2016-08-28 11:41 萱草yy 阅读(628) 评论(0) 推荐(0) 编辑
摘要: SQL语言共分为四大类:数据查询语言DQL,数据操纵语言DML,数据定义语言DDL,数据控制语言DCL。 1. 数据查询语言DQL 数据查询语言DQL基本结构是由SELECT子句,FROM子句,WHERE子句组成的查询块: SELECT <字段名表> FROM <表或视图名> WHERE <查询条件 阅读全文
posted @ 2016-08-28 11:40 萱草yy 阅读(1168) 评论(0) 推荐(0) 编辑
摘要: 第1章 简介 1.3图形的语法 第2章从qplot开始入门 1、基本用法:qplot(x,y,data) x是自变量横轴,y是因变量纵轴,data是数据框 2、图形参数 colour=I("red"),shape,size=I(2),alpha=I(1/20) colour是(外框)颜色,fill是 阅读全文
posted @ 2016-05-27 20:59 萱草yy 阅读(3627) 评论(0) 推荐(0) 编辑
摘要: 平时在一些数据处理中,经常会把原始数据取对数后进一步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:1. 缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用数据类型的取值范围,这时取对数,就把数值缩小了,例如TF-IDF计算时,由于在大规模语料库中,很多词的频率是非常大的数字。2. 取对数后,可以... 阅读全文
posted @ 2016-05-27 20:33 萱草yy 阅读(3465) 评论(0) 推荐(0) 编辑
摘要: 时间序列分析之ARIMA模型预测__R篇 之前一直用SAS做ARIMA模型预测,今天尝试用了一下R,发现灵活度更高,结果输出也更直观。现在记录一下如何用R分析ARIMA模型。 1. 处理数据 1.1. 导入forecast包 forecast包是一个封装的ARIMA统计软件包,在默认情况下,R没有预 阅读全文
posted @ 2016-05-27 20:23 萱草yy 阅读(37135) 评论(3) 推荐(2) 编辑
摘要: 本文转载自cador《使用R语言进行异常检测》本文结合R语言,展示了异常检测的案例,主要内容如下:(1)单变量的异常检测(2)使用LOF(local outlier factor,局部异常因子)进行异常检测(3)通过聚类进行异常检测(4)对时间序列进行异常检测一、单变量异常检测本部分展示了一个单变量异常检测的例子,并且演示了如何将这种方法应用在多元数据上。在该例中,单变量异常检测通过boxplot... 阅读全文
posted @ 2016-05-27 20:21 萱草yy 阅读(4844) 评论(0) 推荐(1) 编辑
摘要: R语言学习笔记:日期处理1、取出当前日期Sys.Date()[1] "2014-10-29"date() #注意:这种方法返回的是字符串类型[1] "Wed Oct 29 20:36:07 2014"2、在R中日期实际是double类型,是从1970年1月1日以来的天数typeof(Sys.Date())[1] "double"3、转换为日期用as.Date()可以将一个字符串转换为日期值,默认格... 阅读全文
posted @ 2016-05-27 20:19 萱草yy 阅读(1649) 评论(0) 推荐(0) 编辑
摘要: 朴素贝叶斯分类器的应用笔记:分类问题:设C={c1,c2...}为分类,F={F1,F2,F3...}为样本特征则求概率P(C|F1,F2,F3...)对应最大的C取值求解:计算P=P(F1,F2,F3|C)*P(C)的最大值对应C取值假设F中各个特征独立则P=P(F1|C)*P(F2|C)*P(F3|C)*P(C)作者: 阮一峰 日期: 2013年12月16日生活中很多场合需要用到分类,比如新闻... 阅读全文
posted @ 2016-05-10 22:37 萱草yy 阅读(1442) 评论(0) 推荐(0) 编辑
摘要: 数据分析是指采用准确适宜的分析方法和工具来分析经过处理的数据,提取有价值的信息,从而形成有效的结论并通过可视化技术展现出来的过程。数据分析的方法有:基本分析方法:主要以基础的统计分析为主高级分析方法:以计量经济建模理论为主数据挖掘类:以数据仓库、机器学习等符合技术为主普遍使用的数据分析工具有:Excel、SPSS、SAS、Eview、R语言、MATLAB、Stata(强大)和Weka等。数据挖掘工... 阅读全文
posted @ 2016-05-04 10:11 萱草yy 阅读(1160) 评论(0) 推荐(0) 编辑