上一页 1 2 3 4 5 6 ··· 28 下一页
摘要: merge是按照列值或索引值进行连接,concat是按照轴进行拼接。 一,merge 数据库风格的连接是merge, DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, 阅读全文
posted @ 2022-08-11 17:04 悦光阴 阅读(957) 评论(0) 推荐(0)
摘要: 操纵索引包括:重索引、设置索引、替换轴的索引、重置索引 一,重索引 (reindex) 重索引是指数据框按照新的索引进行排列,如果已存的索引和新索引不匹配,那么使用NA来填充。 DataFrame.reindex(labels=None, index=None, columns=None, axis 阅读全文
posted @ 2022-08-11 12:07 悦光阴 阅读(2747) 评论(0) 推荐(0)
摘要: Series和DataFrame可以按照索引进行排序,也可以按照值来排序,对值也可以进行排名。 一,按照索引排序(sort by index) 对于一个Series或DataFrame,可以按照索引进行排序,使用sort_index()函数来实现索引的排序: DataFrame.sort_index 阅读全文
posted @ 2022-08-10 16:35 悦光阴 阅读(2992) 评论(0) 推荐(0)
摘要: pandas的pivot和pivot_table 用于表格数据的行列互换,而melt用于unpivot 表格数据。 1,pivot 有如下数据集: import pandas as pd import numpy as np table = {"Item":['Item0','Item0','Ite 阅读全文
posted @ 2022-08-09 10:45 悦光阴 阅读(1159) 评论(0) 推荐(0)
摘要: 在使用pandas进行数据整理时,经常会用到stack和unstack两个函数。stack直译过来是堆叠,堆积,unstack是展开,解释为把列索引和行索引的互换,如下图所示,stack用于把列索引转换为行索引,而unstack用于把行索引转换为列索引。因此,可以把stack和unstack的功能解 阅读全文
posted @ 2022-08-04 11:19 悦光阴 阅读(1301) 评论(0) 推荐(0)
摘要: 对DataFrame 和 Series 进行分组之后,会返回一个数据类型为GroupBy的对象。对数据进行分组之后,能够得到一个分组键和一个分组数据,一个分组对应的分组键是唯一的,分组是具有相同分组键的行或列的列表。 分组运算分为三个过程: 分组:根据一个或多个字段把数据集(DataFrame或Se 阅读全文
posted @ 2022-08-01 16:06 悦光阴 阅读(7921) 评论(0) 推荐(2)
摘要: 异常检测通过自动检测时间序列数据中的异常来增强折线图,并且提供了异常解释,以帮助用户进行根本原因的分析。异常检测只能用于Line Chart中,并且必须有Date字段作为X坐标轴,实际上,PowerBI按照时间序列,用SR-CNN算法来检测数据的异常,即微软的时序异常检测服务(Time-Series 阅读全文
posted @ 2022-07-19 20:06 悦光阴 阅读(840) 评论(0) 推荐(0)
摘要: 关键因素(Key Influencer)图表能够帮助用户分析KPI的因素,并按照因素的重要性进行排名,也就是说,该图表可以查看哪些因素会影响到KPI,并计算出因素的相对重要性。使用Key Influencer Visual,不仅可以查看单个因素的影响,还可以查看多个因素构成的组合(称作Segment 阅读全文
posted @ 2022-07-12 18:33 悦光阴 阅读(1894) 评论(0) 推荐(1)
摘要: 原文:【机器学习笔记】:一文让你彻底理解准确率,精准率,召回率,真正率,假正率,ROC/AUC 作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到)。其实,理解它并不是非常难,但是 阅读全文
posted @ 2022-06-02 10:14 悦光阴 阅读(715) 评论(0) 推荐(0)
摘要: 函数ADDCOLUMNS和SELECTCOLUMNS的功能相似,都是迭代函数,在行下文中计算表达式,并返回一个表。当需要切换到过滤器上下文时,需要用到CALCULATE函数。 从数据沿袭的角度来看: ADDCOLUMNS函数:新添加的列不具有数据沿袭的能力。 SELECTCOLUMNS函数:SELE 阅读全文
posted @ 2022-05-25 11:15 悦光阴 阅读(1822) 评论(0) 推荐(0)
摘要: 自动存在是 DAX 中内置的一项技术,其唯一的目标是避免无用计算,换句话说,它是 DAX 的过滤机制使用的一种优化技术,目的是减少计算值的工作量。 例如,假设有人构建了一份按大陆和国家/地区划分的报告。 在一个数据库中,一个人可能有两大洲和五个国家: 在这些数据上,可以运行一个简单的查询,如下所示: 阅读全文
posted @ 2022-05-23 17:49 悦光阴 阅读(342) 评论(0) 推荐(0)
摘要: 数据沿袭实际上存在DAX中的每个角落,它的设计如此好,以至于很多开发人员在不知情的情况使用。 DAX使用数据沿袭来维护关于列值来源的信息。数据沿袭实际上是一个标签(Tag),分配给表中的每一列,此Tag用于标识数据模型中的原始列,即列的值源自于该列。通过数据沿袭,DAX可以利用现有的关系来过滤数据模 阅读全文
posted @ 2022-05-22 19:01 悦光阴 阅读(567) 评论(0) 推荐(0)
摘要: 在筛选上下文中,一列可能是由于应用了过滤器而被直接筛选,也可能是由于关系的传递,其他列被筛选而导致该列被间接筛选。因此,可以把数据模型中的筛选分为直接过滤和交叉过滤。 一,判断直接过滤和交叉过滤 直接过滤:当过滤器直接作用到表中的一列上时,该列是被直接过滤的。直接过滤是由外部的切片器和查询上下文中的 阅读全文
posted @ 2022-05-19 13:28 悦光阴 阅读(707) 评论(0) 推荐(1)
摘要: 表值函数 VALUES, DISTINCT 都用于返回一列的唯一值,唯一的区别是:VALUES()会额外添加一个BLANK。当使用VALUES函数从一个关联表中获取唯一值时,如果某一个值在关系中缺失,那么VALUES()函数会返回BLANK()。 当关系代表的约束无效时,数据模型会再关系的“一”端的 阅读全文
posted @ 2022-05-18 21:40 悦光阴 阅读(2904) 评论(0) 推荐(0)
摘要: 按照以下的步骤来启用远程桌面连接,可以允许同时连接多人。 Step1:登录Windows 服务器“”,打开“Start”(按下Windows键),输入“Edit group policy” 或 “gpedit.msc”来加载“Local Group Policy Editor” Step2:导航到C 阅读全文
posted @ 2022-05-12 20:50 悦光阴 阅读(1194) 评论(0) 推荐(0)
摘要: 在表格数据模型中,用户可以创建关系,并可以沿着关系的方向自动进行交叉过滤。但是在计算列中,必须通过RELATED 和 RELATEDTABLE函数来检索相关联的表。当使用CALCULATE函数时,可以直接使用现有的活跃关系来进行过滤,并不需要显示调用RELATED 和 RELATEDTABLE函数来 阅读全文
posted @ 2022-05-03 21:34 悦光阴 阅读(876) 评论(0) 推荐(0)
摘要: Power BI报表的用户,肯定会被Q&A的功能惊艳到,在查看报表时,仅仅通过输入文本就可以探索数据,并且结果是可视化的,更令人惊艳的时,结果几乎是实时显示出来的。这使得Q&A Visual就像一个搜索引擎,输入你想查询的问题,Q&A返回一个可视化的结果。 在用户开始输入问题之前,Q&A会显示一些建 阅读全文
posted @ 2022-04-11 22:03 悦光阴 阅读(1097) 评论(0) 推荐(2)
摘要: numpy使用save(), savez()和load()函数来保存和加载numpy的二进制文件。 一,保存文件 save()和savez()的区别是前者是非压缩的,而后者是压缩存储。 1,save()函数 def save(file, arr, allow_pickle=True, fix_imp 阅读全文
posted @ 2022-01-05 14:47 悦光阴 阅读(1127) 评论(0) 推荐(0)
摘要: 数组的统计函数用于对数组做统计运算。 一,统计方法 NumPy内置数据分析常用的统计量: mean():计算元素的均值 median():计算中位数 var():计算元素的方差 std() :计算元素标准差 max():计算元素的最大值 min():计算元素的最小值 ptp():计算元素的取值范围, 阅读全文
posted @ 2022-01-05 14:21 悦光阴 阅读(1044) 评论(0) 推荐(0)
摘要: 1,查找最大值或最小值所在的索引 按照特定的轴查找最大值或最小值的索引 numpy.argmax(a, axis=None, out=None, *, keepdims=<no value>) numpy.argmin(a, axis=None, out=None, *, keepdims=<no 阅读全文
posted @ 2022-01-05 14:18 悦光阴 阅读(869) 评论(0) 推荐(0)
上一页 1 2 3 4 5 6 ··· 28 下一页