共 27 页: 上一页 1 2 3 4 5 6 下一页 末页
摘要:pandas是基于NumPy构建的模块,含有使数据分析更快更简单的操作工具和数据结构,包含序列Series和数据框DataFrame两种最主要数据结构,Index也是pandas中非常重要的数据结构。 一,数据结构 数据框(DataFrame)类似于二维的关系表,每列的数据类型是相同的,列与列的数据 阅读全文
posted @ 2019-09-19 11:07 悦光阴 阅读 (97) 评论 (0) 编辑
摘要:Python中的json对象实际是一个字典结构,用于存储和交换信息,导入json模块: 1,把字符串转换为json json的load()方法用于把josn格式的字符串转换为json对象,这实际上是一个字典结构: 2,把字典转换为json字符串 json的dumps()函数用于把字典结构转换为jso 阅读全文
posted @ 2019-09-18 11:22 悦光阴 阅读 (40) 评论 (0) 编辑
摘要:DAX中用于处理文本的函数,和其他语言很相似。 一,文本连接 文本连接也可以使用操作符 & 来实现,也可以使用函数CONCATENATE来实现: 把整个表中的所有行,使用分隔符拼接为一个字符串,返回值是一个字符串,不常用: 按照分隔符,对多个字符串进行连接,返回一个字符串: 例如,对DimDate表 阅读全文
posted @ 2019-09-11 11:08 悦光阴 阅读 (195) 评论 (0) 编辑
摘要:表连接是指两张表根据关联字段,组合成一个数据集。表连接不仅可以利用数据模型中已有的关系,而且可以利用DAX表达式基于表的任意列定义连接条件。因此,在DAX中,实现表与表之间的连接,有两种方式: 第一种方式:利用数据模型中的现有关系,以便查询包含在不同表中的数据。 第二种方式:编写 DAX 表达式创建 阅读全文
posted @ 2019-09-10 15:57 悦光阴 阅读 (372) 评论 (0) 编辑
摘要:DAX有三个用于生成分组聚合数据的函数,这三个函数有两个共同的特征:分组列和扩展列。 分组列是用于分组的列,只能来源于基础表中已存的列,分组列可以来源于同一个表,也可以来源于相关的列。 扩展列是由name和expression对构成的,name是字符串,expression是包含聚合函数的表达式。 阅读全文
posted @ 2019-09-09 16:45 悦光阴 阅读 (197) 评论 (0) 编辑
摘要:阻塞就是常说的等待,是指事务A等待特定的资源得到满足之后,才能继续执行下去。发生阻塞的另外一种情况是被其他事务阻塞。阻塞对性能的影响,有时会比死锁更严重,这是因为死锁持续的时间非常短,SQL Server 一旦探测到死锁的发生,就会立即杀死一个进程,以结束死锁,使其他进程能够正常运行下去。然而,阻塞 阅读全文
posted @ 2019-08-20 07:27 悦光阴 阅读 (95) 评论 (0) 编辑
摘要:并发,在操作系统中,是指一个很短的时间段中有几个程序都处于已启动运行到运行完毕之间,并发程序之间有相互制约关系,直接制约体现为一个程序需要另一个程序的计算结果,间接制约体现为多个程序竞争同一资源,如处理机、缓冲区、数据等。在数据库系统中,并发主要是指资源的争用,当两个进程同时在访问或更新同一个数据时 阅读全文
posted @ 2019-08-19 11:29 悦光阴 阅读 (444) 评论 (0) 编辑
摘要:数据库引擎的工作流程可以归纳为接收请求、执行请求和返回结果。数据库引擎每接收到一个新的查询请求(Query Request),查询优化器就会执行以下工作流程: 编译请求:对TSQL语句进行语法解析,编译请求,生成TSQL语句表示的逻辑结构。 查询优化:根据TSQL语句的逻辑结构,生成多个预估的执行方 阅读全文
posted @ 2019-08-16 16:51 悦光阴 阅读 (364) 评论 (0) 编辑
摘要:Windows 任务调度程序(Task Scheduler)可以定时执行程序,本文分享使用Task Scheduler定时执行Python脚本的两种方法。 在控制面版->管理员工具中打开 Task Scheduler : 在Task Scheduler Library中创建一个新的文件夹demo,右 阅读全文
posted @ 2019-08-08 17:33 悦光阴 阅读 (417) 评论 (0) 编辑
摘要:K临近分类是一种监督式的分类方法,首先根据已标记的数据对模型进行训练,然后根据模型对新的数据点进行预测,预测新数据点的标签(label),也就是该数据所属的分类。 一,kNN算法的逻辑 kNN算法的核心思想是:如果一个数据在特征空间中最相邻的k个数据中的大多数属于某一个类别,则该样本也属于这个类别( 阅读全文
posted @ 2019-07-31 09:40 悦光阴 阅读 (572) 评论 (0) 编辑
摘要:sklearn.preprocessing包提供了几个常用的转换函数,用于把原始特征向量转换为更适合估计器的表示。 转化器(Transformer)用于对数据的处理,例如标准化、降维以及特征选择等,提供的函数大致是: fit(x,y):该方法接受输入和标签,计算出数据变换的方式。 transform 阅读全文
posted @ 2019-07-30 15:55 悦光阴 阅读 (490) 评论 (0) 编辑
摘要:分类属于监督学习算法,是指根据已有的数据和标签(分类)进行学习,预测未知数据的标签。分类问题的目标是预测数据的类别标签(class label),可以把分类问题划分为二分类和多分类问题。二分类是指在两个类别中选择一个类别,在二分类问题中,其中一个类别称作正类(positive class),另一个类 阅读全文
posted @ 2019-07-28 22:23 悦光阴 阅读 (189) 评论 (0) 编辑
摘要:统计函数用于创建聚合,对数据进行统计分析。在使用统计函数时,必须考虑到数据模型,表之间关系,数据重复等因素,一般都会搭配过滤函数实现数据的提取和分析。 统计量一般是:均值、求和、计数、最大值、最小值、求中位数、求分位数、方差和标准差等。 一,求均值 均值分为几何均值和算术均值,几何平均数是n个变量值 阅读全文
posted @ 2019-07-25 12:01 悦光阴 阅读 (908) 评论 (0) 编辑
摘要:CALCULATE()函数是DAX中最复杂的函数,用于计算由指定过滤器修改的上下文中的表达式。 第一个参数是用于计算聚合值的度量,后面的参数是可选的过滤器,共有两种类型: 返回布尔值的逻辑表达式 返回表值的表达式 CALCULATE函数的复杂之处在于可变的计算上下文。如果数据已被过滤,则CALCUL 阅读全文
posted @ 2019-07-23 13:20 悦光阴 阅读 (607) 评论 (0) 编辑
摘要:过滤器函数允许你操纵筛选上下文以创建动态的计算,是DAX中最复杂和最强大的一类函数,本文记录我对一些常见的过滤器函数的总结。 一,筛选上下文的构成 DAX中的筛选上下文由三部分构成:交叉过滤构成的过滤,查询上下文中每行的列值构成的过滤,外部切片器构成的显式过滤。 1,交叉过滤器 在数据模型中创建关系 阅读全文
posted @ 2019-07-23 11:03 悦光阴 阅读 (958) 评论 (0) 编辑
共 27 页: 上一页 1 2 3 4 5 6 下一页 末页