摘要:当SQL Server 引擎接收到用户发出的查询请求时,SQL Server执行优化器将查询请求(Request)和Task绑定,并为Task分配一个Workder,SQL Server申请操作系统的进程(Thread)来执行Worker。如果以并行的方式执行Request,SQL Server根据 阅读全文
posted @ 2015-10-24 21:26 悦光阴 阅读 (2123) 评论 (0) 编辑
摘要:numpy模块内置的函数能够对数组进行复杂而高效的操作,这些函数中都有一个参数axis(轴)。在数组中,轴表示维度,对于二维数组,axis参数的取值通常有: 当axis为None,表示把数组展开为一维数组; 当axis为0时,表示按照列(第一维)进行计算; 当axis=1时,表示按照行(第二维)进行 阅读全文
posted @ 2019-10-10 10:35 悦光阴 阅读 (94) 评论 (0) 编辑
摘要:数据处理的目的是为了数据分析,下面分享常用的数据分析中会用到的函数。 一,分组和聚合 groupby用于对数据分组,分组之后可以直接调用聚合函数求值;agg()函数把分组和调用聚合函数集成到一个函数来实现: 二,窗口 rolling()是指按照窗口滚动求值,expanding()是指依次递增1,计算 阅读全文
posted @ 2019-10-09 10:33 悦光阴 阅读 (100) 评论 (0) 编辑
摘要:DataFrame的这些操作和Series很相似,这里简单介绍一下。 一,应用 apply()函数应用于轴级别,applymap应用于元素级别: 定义一个函数fun,使用apply()函数把fun应用到由DataFrame对象的列构成的一维数组上,通常fun函数是由聚合函数构成的。 定义一个函数fo 阅读全文
posted @ 2019-10-08 13:43 悦光阴 阅读 (160) 评论 (0) 编辑
摘要:测试的版本:SQL Server 2017 内存优化表上可以创建哈希索引(Hash Index)和内存优化非聚集(NONCLUSTERED)索引,这两种类型的索引也是内存优化的,称作内存优化索引,和基于硬盘的传统索引有很大的区别: 索引结构存储在内存中,没有索引碎片和填充因子 对索引所作的更新不会写 阅读全文
posted @ 2019-09-27 12:50 悦光阴 阅读 (328) 评论 (0) 编辑
摘要:对数据框中的数据进行处理,使数据格式满足业务需求。 一,增加列或删除列 向数据框中增加新列或删除列,各有两种方法。 1,简单方法 通过为一个新列赋值来向数据框中增加新列,新列始终处于列的末尾: 通过del 命令来删除数据框中的列: 2,插入新列 使用insert()函数向数据框中插入新列,可以指定新 阅读全文
posted @ 2019-09-26 18:15 悦光阴 阅读 (187) 评论 (0) 编辑
摘要:索引是DataFrame和Series的行标签,并且可以有一个或多个索引。如果DataFrame和Series有一个索引,称作单级别索引;如果有多个索引,称作多级别索引。索引类似于DataFrame和Sereis的一列数据,可以有多种数据类型。索引的类型有:整数索引(Numeric Index)、分 阅读全文
posted @ 2019-09-26 10:11 悦光阴 阅读 (46) 评论 (0) 编辑
摘要:对序列进行数据数据, 一,删除序列中的重复值 当序列中存在重复值时,可以删除重复值,使序列中的值是唯一的: 参数keep:有效值是first(保留第一个,删除后面出现的重复值),last(保留最后一个,删除前面出现的重复值),false(不保留,把重复的数据删除),默认值是保留第一个, 二,标记序列 阅读全文
posted @ 2019-09-25 11:13 悦光阴 阅读 (141) 评论 (0) 编辑
摘要:序列内置一些函数,用于循环对序列的元素执行操作。 一,应用函数 对序列的各个原始应用函数: 参数注释: func:应用的函数,可以是自定义的函数,或NumPy函数 convert_dtype:默认值是True,尝试把func应用的结果转换为更好的数据类型,如果设置为False,把结果转换为dtype 阅读全文
posted @ 2019-09-24 10:59 悦光阴 阅读 (115) 评论 (0) 编辑
摘要:对序列进行处理,包括对序列进行排序、追加一个序列、对序列值进行替换、对序列的值进行更新,并处理序列中出现的缺失值。 一,序列的排序 按照值或索引对序列进行排序: 参数注释: axis:对Series而言,只能是0 ascending:默认值是True,按照升序排序;如果设置为False,按照降序排序 阅读全文
posted @ 2019-09-23 10:19 悦光阴 阅读 (48) 评论 (0) 编辑
摘要:序列(Series)是一维的,由一组有序的数据以及与之相关的索引组成,能够保存任何类型的数据(整数,字符串,浮点数,Python对象等)的一维数组。轴标签和下标统称为索引,可以通过索引来访问Series对象中的元素。 一,创建序列 序列的构造函数定义是: 构造函数的参数: data:传递给序列的数据 阅读全文
posted @ 2019-09-20 10:39 悦光阴 阅读 (67) 评论 (0) 编辑
摘要:pandas是基于NumPy构建的模块,含有使数据分析更快更简单的操作工具和数据结构,包含序列Series和数据框DataFrame两种最主要数据结构,Index也是pandas中非常重要的数据结构。 一,数据结构 数据框(DataFrame)类似于二维的关系表,每列的数据类型是相同的,列与列的数据 阅读全文
posted @ 2019-09-19 11:07 悦光阴 阅读 (72) 评论 (0) 编辑
摘要:Python中的json对象实际是一个字典结构,用于存储和交换信息,导入json模块: 1,把字符串转换为json json的load()方法用于把josn格式的字符串转换为json对象,这实际上是一个字典结构: 2,把字典转换为json字符串 json的dumps()函数用于把字典结构转换为jso 阅读全文
posted @ 2019-09-18 11:22 悦光阴 阅读 (31) 评论 (0) 编辑
摘要:DAX中用于处理文本的函数,和其他语言很相似。 一,文本连接 文本连接也可以使用操作符 & 来实现,也可以使用函数CONCATENATE来实现: 把整个表中的所有行,使用分隔符拼接为一个字符串,返回值是一个字符串,不常用: 按照分隔符,对多个字符串进行连接,返回一个字符串: 例如,对DimDate表 阅读全文
posted @ 2019-09-11 11:08 悦光阴 阅读 (162) 评论 (0) 编辑
摘要:表连接是指两张表根据关联字段,组合成一个数据集。表连接不仅可以利用数据模型中已有的关系,而且可以利用DAX表达式基于表的任意列定义连接条件。因此,在DAX中,实现表与表之间的连接,有两种方式: 第一种方式:利用数据模型中的现有关系,以便查询包含在不同表中的数据。 第二种方式:编写 DAX 表达式创建 阅读全文
posted @ 2019-09-10 15:57 悦光阴 阅读 (309) 评论 (0) 编辑
摘要:DAX有三个用于生成分组聚合数据的函数,这三个函数有两个共同的特征:分组列和扩展列。 分组列是用于分组的列,只能来源于基础表中已存的列,分组列可以来源于同一个表,也可以来源于相关的列。 扩展列是由name和expression对构成的,name是字符串,expression是包含聚合函数的表达式。 阅读全文
posted @ 2019-09-09 16:45 悦光阴 阅读 (135) 评论 (0) 编辑