随笔分类 -  PowerBI和数据分析

摘要:SUMMARIZECOLUMNS是一个专门用于查询和计算表的函数,主要包含分组列和扩展列。 分组列是用于分组的列,只能来源于基础表中已有的列,分组列可以来源于同一个表,也可以来源于相关的列。 扩展列是由name和expression对构成的,name是字符串,expression是包含聚合函数的表达 阅读全文
posted @ 2019-09-09 16:45 悦光阴 阅读(5848) 评论(0) 推荐(0)
摘要:迭代是指逐行遍历表,访问一行叫做一次迭代,而每一次迭代得到的结果会作为下一次迭代的初始值。迭代函数至少拥有两个参数: 第一个参数:要遍历的行集 第二个参数:对同一行的不同字段要执行计算的表达式。 一,迭代函数计算的过程 最常见的迭代函数是SUMX函数,第一个参数Sales是要迭代的表或表值表达式,第 阅读全文
posted @ 2019-07-25 12:01 悦光阴 阅读(8338) 评论(0) 推荐(2)
摘要:CALCULATE()函数是DAX中最重要和最复杂的函数,用于计算处在筛选上下文中的表达式的值。 CALCULATE(<expression>,<filter1>,<filter2> … ) 第一个参数是用于计值的表达式,在计值之前,CALCULATE将首先计算<filter>参数,并与现有的外部筛 阅读全文
posted @ 2019-07-23 13:20 悦光阴 阅读(17254) 评论(0) 推荐(3)
摘要:Visual上的任何一行或一列都是一个过滤上下文,切片器也是一个过滤上下文,或者报表上其他类型的过滤器,甚至Visual之间的交互,这些过滤上下文共同构成了一个单元格的过滤上下文。总的来说,报表的每个元素都可以创建过滤上下文,并且报表的每个单元格都有不同的过滤上下文。总结来说,筛选上下文是在报表中创 阅读全文
posted @ 2019-07-23 11:03 悦光阴 阅读(10188) 评论(0) 推荐(2)
摘要:计算上下文是DAX表达式求值的环境,任何DAX表达式都是在上下文中求值的。行上下文和筛选上下文是DAX中仅有的上下文类型,把这两种上下文称为计算上下文。计算上下文用于限定公式计算的环境,当上下文变化时,相同的公式会计算出不同的结果。 在PowerBI中创建的计算列是在行上下文中执行计算,创建的度量( 阅读全文
posted @ 2019-07-19 13:30 悦光阴 阅读(3879) 评论(0) 推荐(2)
摘要:DAX的全称是Data Analysis eXpression,直译过来就是数据分析表达式,是在Microsoft Power BI,SSAS和Power Pivoting for Excel中使用的查询语言。本文用Power BI来学习数据模型。 一,理解数据模型 数据模型是由一组表和关系构成的结 阅读全文
posted @ 2019-07-18 10:21 悦光阴 阅读(3274) 评论(0) 推荐(3)
摘要:PowerBI的数据模型是表格模型,只能基于单个列创建关系,不支持基于多列的关系。但是,可以通过把相关的多个列组合成一个计算列,以它作为主键来创建关系。在数据模型中创建的关系,称作物理关系,物理关系会存储到数据模型中,虚拟关系只存在于DAX代码中,相比虚拟关系,利用物理关系的查询性能会更高。 一,使 阅读全文
posted @ 2018-10-31 18:33 悦光阴 阅读(14767) 评论(0) 推荐(3)
摘要:相关分析是数据分析的一个基本方法,可以用于发现不同变量之间的关联性,关联是指数据之间变化的相似性,这可以通过相关系数来描述。发现相关性可以帮助你预测未来,而发现因果关系意味着你可以改变世界。 一,协方差和相关系数 如果随机变量X和Y是相互独立的,那么协方差 Cov(X,Y) = E{ [X-E(X) 阅读全文
posted @ 2018-10-23 10:55 悦光阴 阅读(15187) 评论(4) 推荐(1)
摘要:令狐冲在华山学艺时,虽然勤学苦练,但是终不得法,在机缘巧合之下,得到风清扬老前辈的真传,练成独孤九剑之后,才名震江湖。虽然笑傲江湖的故事情节是虚构的,但从令狐冲蜕变的过程可以看出,练武需要秘籍。数据分析也有一本传世秘籍,只有六字,这就是《数据化管理》中提到的六字箴言、数据分析的三板斧:对比、细分、溯 阅读全文
posted @ 2018-09-18 14:11 悦光阴 阅读(2939) 评论(2) 推荐(5)
摘要:数据分析离不开对关键指标的跟踪,指标是衡量事物好坏的一个指数。数据指标有很多,然而,并不是所有的指标都是好的,虚荣指标(Vanity Metrics)看上去很美,让你感觉良好,但这类指标说到底是肤浅的,甚至带有欺诈性,例如,你会关注网站的访问量,但却忽略了跳离率、用户的浏览时间等,这很容易让你掉进虚 阅读全文
posted @ 2018-09-05 10:40 悦光阴 阅读(2893) 评论(0) 推荐(4)
摘要:数据分析,先有数据,而后有分析,认识数据是分析数据的前提。在现实世界中,数据一般都是有缺失的、异构的、有量纲的。认识数据,不仅要了解数据的属性(维)、类型和量纲,还要了解数据的分布特性。洞察数据的特征,检验数据的质量,有助于后续的分析工作,否则,没有可信的数据,数据分析的结果将是空中楼阁。 一,检验 阅读全文
posted @ 2018-09-03 10:10 悦光阴 阅读(3554) 评论(4) 推荐(4)
摘要:在数据质量得到保证的前提下,通过绘制图表、计算某些统计量等手段对数据的分布特征和贡献度进行分析(帕累托分析),分布分析能够揭示数据的分布特征和分布类型,对于定量数据,可以做出频率分布表、绘制频率分布直方图显示分布特征;对于定性数据,可用饼图和条形图显示分布情况。帕累托分析在频率分布直方图的基础上,绘 阅读全文
posted @ 2018-08-20 14:20 悦光阴 阅读(9038) 评论(0) 推荐(2)
摘要:对于成功的数据分析而言,把握数据整体的性质是至关重要的,使用统计量来检查数据特征,主要是检查数据的集中程度、离散程度和分布形状,通过这些统计量可以识别数据集整体上的一些重要性质,对后续的数据分析,有很大的参考作用。 一,基本统计量 用于描述数据的基本统计量主要分为三类,分别是中心趋势统计量、散布程度 阅读全文
posted @ 2018-08-17 11:32 悦光阴 阅读(18479) 评论(1) 推荐(0)
摘要:数据质量通常是指数据值的质量,包括准确性、完整性和一致性。数据的准确性是指数据不包含错误或异常值、完整性是指数据不包含缺失值、一致性是数据在各个数据源中都是相同的。广义的数据质量还包括数据整体的有效性,例如,数据整体是否是可信的、数据的取样是否合理等。本文的数据质量分析,是指对原始数据值的质量进行分 阅读全文
posted @ 2018-08-10 10:26 悦光阴 阅读(12682) 评论(1) 推荐(0)
摘要:PowerBI的查询编辑器使用Power Query M公式语言来定义查询模型,它是一种富有表现力的数据糅合(Mashup)语言,一个M查询可以计算(Evalute)一个表达式,得到一个值。 对于开发者来说,M公式常用于Power Query编辑器中,用于添加计算列,并对数据进行处理。开发者只需要知 阅读全文
posted @ 2018-07-10 13:29 悦光阴 阅读(8582) 评论(0) 推荐(0)
摘要:PowerBI 将要解锁增量刷新(Incremental refresh)功能,这是一个令人期待的更新,使得PowerBI可以加载大数据集,并能减少数据的刷新时间和资源消耗,该功能目前处于预览状态,只对 Power BI Premium 版本开放预览。 增量刷新只是加快了数据集刷新的速度,对于具有潜 阅读全文
posted @ 2018-07-04 12:53 悦光阴 阅读(11071) 评论(2) 推荐(1)
摘要:钻取是指沿着层次结构(维度的层次)查看数据,钻取可以变换分析数据的粒度。钻取分为下钻(Drill-down)和上钻(Drill-up),上钻是沿着数据的维度结构向上聚合数据,在更大的粒度上查看数据的统计信息,而下钻是沿着数据的维度向下,在更小的粒度上查看更详细的数据。举个例子,当前的粒度是月份,按照 阅读全文
posted @ 2018-06-30 12:11 悦光阴 阅读(18103) 评论(0) 推荐(1)
摘要:R是一种专门用于数据分析和统计的脚本语言,广泛应用在每一个需要统计和数据分析的领域。PowerBI支持R脚本,两者强强结合,使PowerBI的功能更加强大。PowerBI Desktop默认没有安装R,在使用R脚本之前,必须向PowerBI Desktop中安装R引擎。用户可以使用R脚本加载数据、对 阅读全文
posted @ 2018-05-03 15:41 悦光阴 阅读(4725) 评论(2) 推荐(2)
摘要:在PowerBI的查询编辑器(Query Editor)中,用户可以使用M语言修改Query,或修改Query字段的类型,或向Query中添加数据列(Column),对Query进行修改会导致PowerBI相应地更新数据模型(Data Model),这跟使用DAX表达式修改Data Model有本质 阅读全文
posted @ 2018-04-24 11:21 悦光阴 阅读(8675) 评论(0) 推荐(5)
摘要:PowerBI版本在持续的更新,这使得报表设计能够实现更多新的功能,您可以访问 PowerBI Blog查看PowerBI的最新更新信息,本文总结了PowerBI新版本的重要更新和设计技巧。 我的PowerBI开发系列的文章目录:PowerBI开发 一,同步切片 开发人员在设计报表时,根据分析的需要 阅读全文
posted @ 2018-04-23 13:59 悦光阴 阅读(4196) 评论(0) 推荐(4)