上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 26 下一页
摘要: ggplot2图形系统的核心理念是把绘图与数据分离,把数据相关的绘图与数据无关的绘图分离,按图层作图。ggplot2可以把绘图拆分成多个图层,且能够按照顺序创建多重图形。 使用ggplot2包创建图形时,每个图形都是由函数ggplot()创建的,提供绘图的数据和映射: 数据(data):数据框对象 阅读全文
posted @ 2018-03-17 20:41 悦光阴 阅读(14472) 评论(0) 推荐(7) 编辑
摘要: SQL Server 扩展事件(Extended Event)是用于服务器的常规事件处理系统,是追踪SQL Server系统运行状态的神器,同时也是一个日志记录工具,扩展事件完全可以取代SQL追踪(SQL Trace),扩展事件的设计功能: 由于扩展事件引擎不识别事件,因此,引擎可以将任何事件绑定到 阅读全文
posted @ 2018-03-11 21:50 悦光阴 阅读(2873) 评论(2) 推荐(3) 编辑
摘要: 列表(List)是R中最复杂的数据类型,一般来说,列表是数据对象的有序集合,但是,列表的各个元素(item)的数据类型可以不同,每个元素的长度可以不同,是R中最灵活的数据类型。列表项可以是列表类型,因此,列表被认为是递归变量,与之相对,向量,数组,矩阵,数据框被认为是原子变量。 一,创建列表 列表由 阅读全文
posted @ 2018-03-09 11:32 悦光阴 阅读(7128) 评论(1) 推荐(3) 编辑
摘要: 数据结构用于存储数据,不同的数据结构对应不同的操作方法,对应不同的分析目的,应选择合适的数据结构。在处理数据时,为了便于检查数据对象,可以通过函数attributes(x)来查看数据对象的属性,str(x)函数用于查看R对象的内部结构,通过print(x)函数,显示数据对象存储的内容,该函数把数据打 阅读全文
posted @ 2018-03-07 08:09 悦光阴 阅读(2302) 评论(0) 推荐(6) 编辑
摘要: 准备数据是数据分析的第一步,由数据构成集合,我们称作数据集,数据集的结构是行列式的,行表示观测,列表示变量。把数据读入到R中,转换为合适的数据结构,能够提高数据分析的效率。在数据分析中,常用的存储数据的结构有标量、向量、因子和数据框,另外,还有矩阵和列表,多样化的数据结构赋予了R灵活处理数据的能力, 阅读全文
posted @ 2018-03-06 08:30 悦光阴 阅读(4964) 评论(1) 推荐(5) 编辑
摘要: 在实际分析数据之前,必须对数据进行清理和转化,使数据符合相应的格式,提高数据的质量。数据处理通常包括增加新的变量、处理缺失值、类型转换、数据排序、数据集的合并和获取子集等。 一,增加新的变量 通常需要根据数据框中的现有列,按照特定的公式、业务逻辑,向数据框中新增变量,常用的操作符是: 算术运算符是: 阅读全文
posted @ 2018-03-05 12:04 悦光阴 阅读(9586) 评论(1) 推荐(2) 编辑
摘要: R是专门用于数据分析和统计的脚本语言,广泛应用在每一个需要统计和数据分析的领域。使用R做数据建模、数据统计和分析是一个发现未知和惊喜的旅程,前提,你必须迈出第一步,去学习R语言。R是一种解释型语言,这意味着代码在运行之前不需要编译,在学习R语言时,首先需要安装R,访问网站 https://www.r 阅读全文
posted @ 2018-03-02 10:29 悦光阴 阅读(2993) 评论(0) 推荐(3) 编辑
摘要: 在master数据库中,SQL Server提供系统扩展的存储过程,其中有一些存储过程的命名以xp_开头,用于处理操作系统的文件。 一,判断文件是否存在 存储过程sys.xp_fileexist 用于判断文件是否存在,参数是文件(file)的路径或目录的路径: exec master.sys.xp_ 阅读全文
posted @ 2018-02-23 12:55 悦光阴 阅读(5541) 评论(2) 推荐(7) 编辑
摘要: 在关系型数据库中,表与表之间存在引用关系,也就是说,数据列C1引用其他表的数据列C2中存在的值,引用关系通过外键(Foreign Key )约束实现。如果表(TableA)中的列C1被其他表引用,那么,我们把表(TableA)称作参考表,或引用表(Referenced Table),该列C1是其他表 阅读全文
posted @ 2018-02-22 12:19 悦光阴 阅读(1854) 评论(0) 推荐(4) 编辑
摘要: 一般来说,数据排序有两种方式:使用Sort组件,使用TSQL命令Order by。使用Sort组件排序,对SSIS来说,是一种阻塞性的操作,这意味着,SSIS组件必须等到所有的数据都加载到内存之后,才能按照特定的字段对数据执行排序操作。然而,如果使用TSQL命令的Order by子句,在关系引擎中执 阅读全文
posted @ 2018-02-09 18:30 悦光阴 阅读(708) 评论(1) 推荐(3) 编辑
摘要: 在SQL Server中,创建数据表,需要为表设置合适的属性和约束,例如,自增列,非空,主键等,以满足业务的需求,一般来说,数据表存储的实体都应该唯一标识,使用ID列或GUID列来充当候选主键是可以的,相应地,数据表的列(Column)有两个特殊的属性: RowGUIDCol:用于标识UniqueI 阅读全文
posted @ 2018-02-07 11:12 悦光阴 阅读(2810) 评论(0) 推荐(4) 编辑
摘要: 常用的转换函数是 cast 和 convert,用于把表达式得出的值的类型转换成另一个数据类型,如果转换失败,该函数抛出错误,导致整个事务回滚。在SQL Server 2012版本中,新增两个容错的转换函数:try_cast 和 try_convert,如果转换操作失败,该函数返回null,不会导致 阅读全文
posted @ 2018-02-02 22:31 悦光阴 阅读(4487) 评论(0) 推荐(4) 编辑
摘要: 树形层次结构(Hierarchy)经常出现在有结构的数据中,T-SQL新增数据类型HierarchyID, 其长度可变,用于存储层次结构中的路径。HierarchyID表示的层次结构是树形的,由应用程序来生成和分配 HierarchyID的值,建立父子节点之间的关系。 HierarchyID数据类型 阅读全文
posted @ 2018-01-31 15:31 悦光阴 阅读(3375) 评论(0) 推荐(4) 编辑
摘要: 你是否跟我一样,来自遥远的农村、小城镇,大学毕业之后,想都不想,就来到繁华的大城市?不管是北漂,还是沪漂,抑或是X漂,总之,漂的一族,要面临的问题很多,而最主要的问题肯定是找工作和住房。我到上海打拼,看重的是工作机会多,裙带关系少,只要肯努力,总能找到一份不错的工作,用心好好干,能力和薪资都能得到提 阅读全文
posted @ 2018-01-19 10:22 悦光阴 阅读(5208) 评论(54) 推荐(19) 编辑
摘要: 验证是一个事件,该事件在Package执行时,第一个被触发,验证能够避免SSIS引擎执行一个有异常的Package或Task。延迟验证(DelayValidation)是把验证操作延迟到Package真正运行(run-time)时开始执行,当禁用延迟验证时,一旦验证操作返回错误(Error)或警告( 阅读全文
posted @ 2018-01-18 16:38 悦光阴 阅读(793) 评论(0) 推荐(3) 编辑
摘要: 全文索引不同于常见的聚集索引或非聚集索引,这些索引的内部实现是平衡树(B-Tree)结构,而全文索引在物理上是由一系列的内部表(Internal tables)构成的,这些内部表称作全文索引片段(Fragment),每一个索引片段也叫做一个倒转索引(Inverted index),也就是说,每一个倒 阅读全文
posted @ 2017-12-26 19:06 悦光阴 阅读(1496) 评论(0) 推荐(2) 编辑
摘要: SQL Server 的全文搜索(Full-Text Search)是基于分词的文本检索功能,依赖于全文索引。全文索引不同于传统的平衡树(B-Tree)索引和列存储索引,它是由数据表构成的,称作倒转索引(Invert Index),存储分词和行的唯一键的映射关系。倒转索引是在创建全文索引或更新全文索 阅读全文
posted @ 2017-12-15 18:51 悦光阴 阅读(7288) 评论(0) 推荐(6) 编辑
摘要: 传统的存储数据的方式是逐行存储(Row Store),每一个Page存储多行数据,而列存储(Column Store)把数据表中的每一列单独存储在Page集合中,这意味着,Page集合中存储的是某一列的数据,而不是一行的所有列的数据。 列存储索引适合于数据仓库中,主要执行大容量数据加载和只读查询,与 阅读全文
posted @ 2017-12-14 10:49 悦光阴 阅读(11103) 评论(3) 推荐(10) 编辑
摘要: 授予内存(Grant Memory)是专门用于执行排序操作和哈希操作的内存,由于排序操作(Sort)需要临时存储排序的中间结果集,哈希连接(Hash Join)和哈希聚合(Hash Aggregation)需要创建临时的哈希表,这些数据都需要全部缓存或部分缓存到内存中,因此,在查询请求(Reques 阅读全文
posted @ 2017-12-08 08:25 悦光阴 阅读(1053) 评论(0) 推荐(3) 编辑
摘要: SSISDB 系列随笔汇总: SSISDB1:使用SSISDB管理Package SSISDB2:SSIS工程的操作实例 SSISDB3:Package的执行实例 SSISDB4:当前正在运行的Package及其Executable SSISDB5:使用TSQL脚本执行Package SSISDB6 阅读全文
posted @ 2017-12-07 10:58 悦光阴 阅读(1226) 评论(2) 推荐(3) 编辑
上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 26 下一页