摘要: DAX 系列 DAX 第一篇:数据模型 DAX 第二篇:计算上下文 DAX 第三篇:筛选上下文(ALL,Filter) DAX 第四篇:行上下文 DAX 第五篇:CALCULATE函数详解 DAX 第六篇:上下文转换 DAX 第七篇:迭代函数 DAX 第八篇:ALLSELECTED函数和影子筛选上下 阅读全文
posted @ 2020-12-30 17:03 悦光阴 阅读(1356) 评论(0) 推荐(1) 编辑
摘要: 数据框和序列结构中都有轴标签,轴标签的信息存储在Index对象中,轴标签的最重要的作用是: 唯一标识数据,用于定位数据 用于数据对齐 获取和设置数据集的子集。 本文重点关注如何对序列(Series)和数据框(DataFrame)进行切片(slice),切块(dice)、如何获取和设置子集。 下表列出 阅读全文
posted @ 2020-12-15 10:36 悦光阴 阅读(1355) 评论(0) 推荐(0) 编辑
摘要: 数据框类似于二维的关系表,包含一组有序的列,列与列之间的数据类型可以是不同的,但是单个列的数据类型是相同的。数据框的每一列或每一行都可以认为是一个Series。 DataFrame中面向行和面向列的操作基本上是相同的,把行和列称作轴(axis),DataFrame是按照轴进行操作的,axis=0表示 阅读全文
posted @ 2019-04-05 16:20 悦光阴 阅读(16638) 评论(0) 推荐(2) 编辑
摘要: 当SQL Server 引擎接收到用户发出的查询请求时,SQL Server执行优化器将查询请求(Request)和Task绑定,并为Task分配一个Workder,SQL Server申请操作系统的进程(Thread)来执行Worker。如果以并行的方式执行Request,SQL Server根据 阅读全文
posted @ 2015-10-24 21:26 悦光阴 阅读(4744) 评论(0) 推荐(6) 编辑
摘要: OpenCV下载地址:http://opencv.org/downloads.html,根据操作系统选择合适的安装包。本文使用的是OpenCV-3.4.16的Windows版本,Visual Studio是VS2022版本。我把OpenCV解压到D:\Program Files (x86)\open 阅读全文
posted @ 2022-09-01 17:17 悦光阴 阅读(17) 评论(0) 推荐(0) 编辑
摘要: 通过groupby分组数据之后,可以对每个分组的数据进行聚合运算、转换操作,或应用函数。 一,聚合操作 对拆分之后的数据进行聚合,对于DataFrame进行聚合操作,主要使用aggregate()函数,可以简写为agg(): DataFrameGroupBy.aggregate(func=None, 阅读全文
posted @ 2022-08-13 17:38 悦光阴 阅读(171) 评论(0) 推荐(0) 编辑
摘要: 在清理文本数据时,对pandas Series(序列)可以使用map函数,所有的字符串都可以应用字符串函数或正则表达式,但是如果存在NA,就会报错。为了解决这个问题,Series有一些可以跳过NA值的字符串操作方法,这可以通过Series的str属性来访问。 s1 = pd.Series(['Mou 阅读全文
posted @ 2022-08-12 12:28 悦光阴 阅读(78) 评论(0) 推荐(0) 编辑
摘要: merge是按照列值或索引值进行连接,concat是按照轴进行拼接。 一,merge 数据库风格的连接是merge, DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, 阅读全文
posted @ 2022-08-11 17:04 悦光阴 阅读(49) 评论(0) 推荐(0) 编辑
摘要: 操纵索引包括:重索引、设置索引、替换轴的索引、重置索引 一,重索引 (reindex) 重索引是指数据框按照新的索引进行排列,如果已存的索引和新索引不匹配,那么使用NA来填充。 DataFrame.reindex(labels=None, index=None, columns=None, axis 阅读全文
posted @ 2022-08-11 12:07 悦光阴 阅读(42) 评论(0) 推荐(0) 编辑
摘要: Series和DataFrame可以按照索引进行排序,也可以按照值来排序,对值也可以进行排名。 一,按照索引排序(sort by index) 对于一个Series或DataFrame,可以按照索引进行排序,使用sort_index()函数来实现索引的排序: DataFrame.sort_index 阅读全文
posted @ 2022-08-10 16:35 悦光阴 阅读(129) 评论(0) 推荐(0) 编辑
摘要: pandas的pivot和pivot_table 用于表格数据的行列互换,而melt用于unpivot 表格数据。 1,pivot 有如下数据集: import pandas as pd import numpy as np table = {"Item":['Item0','Item0','Ite 阅读全文
posted @ 2022-08-09 10:45 悦光阴 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 在使用pandas进行数据整理时,经常会用到stack和unstack两个函数。stack直译过来是堆叠,堆积,unstack是展开,解释为把列索引和行索引的互换,如下图所示,stack用于把列索引转换为行索引,而unstack用于把行索引转换为列索引。因此,可以把stack和unstack的功能解 阅读全文
posted @ 2022-08-04 11:19 悦光阴 阅读(95) 评论(0) 推荐(0) 编辑
摘要: 对DataFrame 和 Series 进行分组之后,会返回一个数据类型为GroupBy的对象。对数据进行分组之后,能够得到一个分组键和一个分组数据,一个分组对应的分组键是唯一的,分组是具有相同分组键的行或列的列表。 分组运算分为三个过程: 分组:根据一个或多个字段把数据集(DataFrame或Se 阅读全文
posted @ 2022-08-01 16:06 悦光阴 阅读(156) 评论(0) 推荐(0) 编辑
摘要: 异常检测通过自动检测时间序列数据中的异常来增强折线图,并且提供了异常解释,以帮助用户进行根本原因的分析。异常检测只能用于Line Chart中,并且必须有Date字段作为X坐标轴,实际上,PowerBI按照时间序列,用SR-CNN算法来检测数据的异常,即微软的时序异常检测服务(Time-Series 阅读全文
posted @ 2022-07-19 20:06 悦光阴 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 关键因素(Key Influencer)图表能够帮助用户分析KPI的因素,并按照因素的重要性进行排名,也就是说,该图表可以查看哪些因素会影响到KPI,并计算出因素的相对重要性。使用Key Influencer Visual,不仅可以查看单个因素的影响,还可以查看多个因素构成的组合(称作Segment 阅读全文
posted @ 2022-07-12 18:33 悦光阴 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 原文:【机器学习笔记】:一文让你彻底理解准确率,精准率,召回率,真正率,假正率,ROC/AUC 作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到)。其实,理解它并不是非常难,但是 阅读全文
posted @ 2022-06-02 10:14 悦光阴 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 函数ADDCOLUMNS和SELECTCOLUMNS的功能相似,都是迭代函数,在行下文中计算表达式,并返回一个表,但是从数据沿袭的角度来看: 在ADDCOLUMNS函数中,添加的列不具有数据沿袭的能力。 在SELECTCOLUMNS函数中,SELECTCOLUMNS 保留简单列引用的数据沿袭,对列执 阅读全文
posted @ 2022-05-25 11:15 悦光阴 阅读(207) 评论(0) 推荐(0) 编辑
摘要: 自动存在是 DAX 中内置的一项技术,其唯一的目标是避免无用计算,换句话说,它是 DAX 的过滤机制使用的一种优化技术,目的是减少计算值的工作量。 例如,假设有人构建了一份按大陆和国家/地区划分的报告。 在一个数据库中,一个人可能有两大洲和五个国家: 在这些数据上,可以运行一个简单的查询,如下所示: 阅读全文
posted @ 2022-05-23 17:49 悦光阴 阅读(76) 评论(0) 推荐(0) 编辑
摘要: 数据沿袭实际上存在DAX中的每个角落,它的设计如此好,以至于很多开发人员在不知情的情况使用。 DAX使用数据沿袭来维护关于列值来源的信息。数据沿袭实际上是一个标签(Tag),分配给表中的每一列,此Tag用于标识数据模型中的原始列,即列的值源自于该列。通过数据沿袭,DAX可以利用现有的关系来过滤数据模 阅读全文
posted @ 2022-05-22 19:01 悦光阴 阅读(119) 评论(0) 推荐(0) 编辑
摘要: 在筛选上下文中,一列可能是由于应用了过滤器而被直接筛选,也可能是由于关系的传递,其他列被筛选而导致该列被间接筛选。因此,可以把数据模型中的筛选分为直接过滤和交叉过滤。 一,判断直接过滤和交叉过滤 直接过滤:当过滤器直接作用到表中的一列上时,该列是被直接过滤的。直接过滤是由外部的切片器和查询上下文中的 阅读全文
posted @ 2022-05-19 13:28 悦光阴 阅读(82) 评论(0) 推荐(1) 编辑
摘要: 表值函数 VALUES, DISTINCT 都用于返回一列的唯一值,唯一的区别是处理表种空行的行为不同。 当关系代表的约束无效时,数据模型会再关系的“一”端的任何表中自动创建一个空行,这就是空值的由来,也就是说,在一个1:M的关系中,如果“多”端在“一”端没有对应的值,那么数据模型默认把BLANK作 阅读全文
posted @ 2022-05-18 21:40 悦光阴 阅读(206) 评论(0) 推荐(0) 编辑
摘要: 按照以下的步骤来启用远程桌面连接,可以允许同时连接多人。 Step1:登录Windows 服务器“”,打开“Start”(按下Windows键),输入“Edit group policy” 或 “gpedit.msc”来加载“Local Group Policy Editor” Step2:导航到C 阅读全文
posted @ 2022-05-12 20:50 悦光阴 阅读(487) 评论(0) 推荐(0) 编辑
摘要: 在表格数据模型中,用户可以创建关系,并可以沿着关系的方向自动进行交叉过滤。但是在计算列中,必须通过RELATED 和 RELATEDTABLE函数来检索相关联的表。当使用CALCULATE函数时,可以直接使用现有的活跃关系来进行过滤,并不需要显示调用RELATED 和 RELATEDTABLE函数来 阅读全文
posted @ 2022-05-03 21:34 悦光阴 阅读(128) 评论(0) 推荐(0) 编辑
摘要: Power BI报表的用户,肯定会被Q&A的功能惊艳到,在查看报表时,仅仅通过输入文本就可以探索数据,并且结果是可视化的,更令人惊艳的时,结果几乎是实时显示出来的。这使得Q&A Visual就像一个搜索引擎,输入你想查询的问题,Q&A返回一个可视化的结果。 在用户开始输入问题之前,Q&A会显示一些建 阅读全文
posted @ 2022-04-11 22:03 悦光阴 阅读(539) 评论(0) 推荐(2) 编辑