悦光阴

2024年3月21日

摘要： GROUPBY函数的作用是根据输入的表进行数据聚合，输入的表可以是表表达式，也就是说，GRUOPBY的参数可以是一个动态查询返回的表，也就是说GROUPBY函数主要用于嵌套聚合的情况。 GROUPBY (<table> [, <groupBy_columnName> [, <groupBy_colu 阅读全文

posted @ 2024-03-21 18:11 悦光阴阅读(16) 评论(0) 推荐(0) 编辑

2023年11月13日

Newtonsoft.Json 入门介绍

摘要：本人是C#小白，这里摘抄并整理了两位大神的文章： Newtonsoft.Json笔记 -JToken、JObject、JArray详解 Json 基于类 Newtonsoft.Json.Linq.JToken的应用简介简单介绍如何使用Newtonsoft.Json类库和操作Json对象，这里主要介阅读全文

posted @ 2023-11-13 17:44 悦光阴阅读(501) 评论(0) 推荐(1) 编辑

2023年6月12日

PowerBI 开发第23篇：共享数据集

摘要：简单来说，如果多个Report共用一个Dataset，那么这个Dataset是共享数据集。每当共享Dataset刷新后，任何引用这个Dataset的Report都会自动刷新，这也是共享数据集的一个优点。共享数据集的一个重要作用，是把后端（建立数据集）的任务从整个报表开发流程中分离出来，后端只需要把阅读全文

posted @ 2023-06-12 15:59 悦光阴阅读(325) 评论(0) 推荐(0) 编辑

2023年5月4日

DAX：概述EARLIEST和EARLIER函数

摘要： EARLIEST和EARLIER函数只用于行上下文中，并且主要用于计算列的行上下文中。行上下文的作用是迭代，逐行扫描表，并且不会筛选数据。 EARLIER函数用于访问外层行上下文，即使用外层行上下文，而不是最内层的行上下文检索列的值。 EARLIER(<column>, <number>) EARL 阅读全文

posted @ 2023-05-04 18:40 悦光阴阅读(211) 评论(0) 推荐(0) 编辑

2023年4月20日

DAX：概述ALL函数

摘要：简单的说，当ALL用作表函数时，忽略应用到表上的任何过滤器，并返回数据表；当ALL用作CALCULATE和CALCULATETABLE函数中修饰器时，ALL函数从扩展表中移除已经应用的过滤上下文。注意自动存在（auto-eixist）对ALL()函数的影响。正常情况下，包含 ALL() 函数的阅读全文

posted @ 2023-04-20 15:11 悦光阴阅读(402) 评论(0) 推荐(0) 编辑

2022年12月12日

DAX：LOOKUPVALUE 函数

摘要： LOOKUPVALUE函数用于根据一个或多个搜索条件，从另一个表中获取一个或0个值。LOOKUPVALUE运行在行上下文中，根据当前表中的当前行，从另一个表中查找条件相等的行，查找不需要两个表之间存在关系，搜索结果也不受过滤条件的影响。当两个表之间存在关系时，考虑使用RELATED函数，因为RELA 阅读全文

posted @ 2022-12-12 10:29 悦光阴阅读(660) 评论(0) 推荐(0) 编辑

2022年12月9日

DAX：GROUPBY函数

摘要： DAX 中的 SUMMARIZE 函数功能强大，但同时也很难使用，它可用于执行表之间的分组和连接。不幸的是，它在计算聚合值时存在一些众所周知的性能问题。除了性能之外，SUMMARIZE 的计算限制是它无法聚合在查询本身内动态计算的值。一，SUMMARIZE函数的限制例如，考虑以下查询，它应该为每阅读全文

posted @ 2022-12-09 11:20 悦光阴阅读(557) 评论(0) 推荐(0) 编辑

2022年12月8日

DAX：【翻译】SUMMARIZE的秘密

摘要：作为一个查询函数，SUMMARIZE 执行三个操作：它可以按表本身或相关表的任何列对表进行分组；它可以创建新列，在行上下文和过滤上下文中计算表达式；它可以产生不同级别的小计（subtotal）。在 SUMMARIZE 的三个主要操作中，只有第一个是安全的。另外两个操作——创建新列和计算小计阅读全文

posted @ 2022-12-08 15:51 悦光阴阅读(389) 评论(0) 推荐(0) 编辑

2022年9月1日

OpenCV：配置环境 Visual Studio

摘要：前言：最近想学习计算机视觉，于是在朋友的推荐下选择OpenCV进行学习，用一个合集来记录本人的学习笔记。 OpenCV下载地址：http://opencv.org/downloads.html，根据操作系统选择合适的安装包。本文使用的是OpenCV-3.4.16的Windows版本，Visual S 阅读全文

posted @ 2022-09-01 17:17 悦光阴阅读(440) 评论(0) 推荐(0) 编辑

2022年8月13日

pandas 数据分组——聚合agg、转换 transform和应用apply

摘要：通过groupby分组数据之后，可以对每个分组的数据进行聚合运算、转换操作，或应用函数。一，聚合操作对拆分之后的数据进行聚合，对于DataFrame进行聚合操作，主要使用aggregate()函数，可以简写为agg()： DataFrameGroupBy.aggregate(func=None, 阅读全文

posted @ 2022-08-13 17:38 悦光阴阅读(1926) 评论(1) 推荐(0) 编辑

2022年8月12日

pandas Series矢量化的字符串函数——Series.str

摘要：在清理文本数据时，对pandas Series（序列）可以使用map函数，所有的字符串都可以应用字符串函数或正则表达式，但是如果存在NA，就会报错。为了解决这个问题，Series有一些可以跳过NA值的字符串操作方法，这可以通过Series的str属性来访问。 s1 = pd.Series(['Mou 阅读全文

posted @ 2022-08-12 12:28 悦光阴阅读(393) 评论(0) 推荐(0) 编辑

2022年8月11日

pandas merge 和 concat

摘要： merge是按照列值或索引值进行连接，concat是按照轴进行拼接。一，merge 数据库风格的连接是merge， DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, 阅读全文

posted @ 2022-08-11 17:04 悦光阴阅读(723) 评论(0) 推荐(0) 编辑

pandas reindex、set_index 和 reset_index

摘要：操纵索引包括：重索引、设置索引、替换轴的索引、重置索引一，重索引（reindex）重索引是指数据框按照新的索引进行排列，如果已存的索引和新索引不匹配，那么使用NA来填充。 DataFrame.reindex(labels=None, index=None, columns=None, axis 阅读全文

posted @ 2022-08-11 12:07 悦光阴阅读(908) 评论(0) 推荐(0) 编辑

2022年8月10日

pandas 排序和排名 —— sort_index、sort_values、rank

摘要： Series和DataFrame可以按照索引进行排序，也可以按照值来排序，对值也可以进行排名。一，按照索引排序（sort by index) 对于一个Series或DataFrame，可以按照索引进行排序，使用sort_index()函数来实现索引的排序： DataFrame.sort_index 阅读全文

posted @ 2022-08-10 16:35 悦光阴阅读(1495) 评论(0) 推荐(0) 编辑

2022年8月9日

pandas 长宽格式的转换——pivot、pivot_table和melt

摘要： pandas的pivot和pivot_table 用于表格数据的行列互换，而melt用于unpivot 表格数据。 1，pivot 有如下数据集： import pandas as pd import numpy as np table = {"Item":['Item0','Item0','Ite 阅读全文

posted @ 2022-08-09 10:45 悦光阴阅读(694) 评论(0) 推荐(0) 编辑

2022年8月4日

pandas 轴索引互换——stack和unstack

摘要：在使用pandas进行数据整理时，经常会用到stack和unstack两个函数。stack直译过来是堆叠，堆积，unstack是展开，解释为把列索引和行索引的互换，如下图所示，stack用于把列索引转换为行索引，而unstack用于把行索引转换为列索引。因此，可以把stack和unstack的功能解阅读全文

posted @ 2022-08-04 11:19 悦光阴阅读(917) 评论(0) 推荐(0) 编辑

2022年8月1日

pandas 数据分组——groupby

摘要：对DataFrame 和 Series 进行分组之后，会返回一个数据类型为GroupBy的对象。对数据进行分组之后，能够得到一个分组键和一个分组数据，一个分组对应的分组键是唯一的，分组是具有相同分组键的行或列的列表。分组运算分为三个过程：分组：根据一个或多个字段把数据集（DataFrame或Se 阅读全文

posted @ 2022-08-01 16:06 悦光阴阅读(4920) 评论(0) 推荐(2) 编辑

2022年7月19日

PowerBI 开发第22篇：异常检测（Anomaly Detection)

摘要：异常检测通过自动检测时间序列数据中的异常来增强折线图，并且提供了异常解释，以帮助用户进行根本原因的分析。异常检测只能用于Line Chart中，并且必须有Date字段作为X坐标轴，实际上，PowerBI按照时间序列，用SR-CNN算法来检测数据的异常，即微软的时序异常检测服务（Time-Series 阅读全文

posted @ 2022-07-19 20:06 悦光阴阅读(466) 评论(0) 推荐(0) 编辑

2022年7月12日

PowerBI开发第21篇：关键因素（Key Influencer）

摘要：关键因素（Key Influencer）图表能够帮助用户分析KPI的因素，并按照因素的重要性进行排名，也就是说，该图表可以查看哪些因素会影响到KPI，并计算出因素的相对重要性。使用Key Influencer Visual，不仅可以查看单个因素的影响，还可以查看多个因素构成的组合（称作Segment 阅读全文

posted @ 2022-07-12 18:33 悦光阴阅读(975) 评论(0) 推荐(1) 编辑

2022年6月2日

【转】评估分类模型的指标：ROC/AUC

摘要：原文：【机器学习笔记】：一文让你彻底理解准确率，精准率，召回率，真正率，假正率，ROC/AUC 作者：xiaoyu 微信公众号：Python数据科学知乎：python数据分析师 ROC/AUC作为机器学习的评估指标非常重要，也是面试中经常出现的问题（80%都会问到）。其实，理解它并不是非常难，但是阅读全文

posted @ 2022-06-02 10:14 悦光阴阅读(400) 评论(0) 推荐(0) 编辑

请不要假装很努力，因为结果不会陪你演戏。

公告