随笔列表第9页 - 悦光阴

2019年9月20日

摘要：序列是一维数组，只有一个维度（或称作轴）是行（row），在访问序列时，只需要设置一个索引。序列(Series)是由一组相同类型的数据，以及一组与之相关的行标签（索引）组成，序列要求存储的数据类型是相同的。在创建序列时，如果没有设置索引，那么pandas自动为序列创建了一个从0开始到N-1的序号，称阅读全文

posted @ 2019-09-20 10:39 悦光阴阅读(8935) 评论(0) 推荐(1) 编辑

2019年9月19日

pandas 数据结构和数据类型

摘要： pandas是基于NumPy构建的模块，是数据分析必不可少的包之一，通常情况下，引入pandas的约定，只要在代码中看到pd，就要联想到pandas： import pandas as pd pandas包含两种最主要数据结构：序列（Series）和数据框（DataFrame）。对于这两个数据结构，阅读全文

posted @ 2019-09-19 11:07 悦光阴阅读(16096) 评论(0) 推荐(2) 编辑

2019年9月11日

DAX 第六篇：上下文转换

摘要：关于计值上下文的规则：筛选上下文用于筛选数据。行上下文用于迭代，其中的筛选上下文为空，除非遇到CALCULATE函数。一，CALCULATE函数根据行上下文创建筛选上下文 CALCULATE函数的强大之处：根据行上下文创建筛选上下文。如果在行上下文中执行CALCULATE函数，对每一次迭代，阅读全文

posted @ 2019-09-11 11:08 悦光阴阅读(4566) 评论(0) 推荐(0) 编辑

2019年9月10日

DAX：连接和关系

摘要：表连接是指两张表根据关联字段，组合成一个数据集。表连接不仅可以利用数据模型中已有的关系，而且可以利用DAX表达式基于表的任意列定义连接条件。因此，在DAX中，实现表与表之间的连接，有两种方式：第一种方式：利用数据模型中的现有关系，以便查询包含在不同表中的数据。第二种方式：编写 DAX 表达式创建阅读全文

posted @ 2019-09-10 15:57 悦光阴阅读(3765) 评论(0) 推荐(1) 编辑

2019年9月9日

DAX：表值函数 SUMMARIZECOLUMNS

摘要： SUMMARIZECOLUMNS是一个专门用于查询和计算表的函数，主要包含分组列和扩展列。分组列是用于分组的列，只能来源于基础表中已有的列，分组列可以来源于同一个表，也可以来源于相关的列。扩展列是由name和expression对构成的，name是字符串，expression是包含聚合函数的表达阅读全文

posted @ 2019-09-09 16:45 悦光阴阅读(5168) 评论(0) 推荐(0) 编辑

2019年8月20日

性能调优12：阻塞

摘要：阻塞就是常说的等待（wait），是指事务A等待特定的资源得到满足之后，才能继续执行下去。发生阻塞的另外一种情况是被其他事务阻塞。阻塞对性能的影响，有时会比死锁更严重，这是因为死锁持续的时间非常短，SQL Server 一旦探测到死锁的发生，就会立即杀死一个进程，以结束死锁，使其他进程能够正常运行下去阅读全文

posted @ 2019-08-20 07:27 悦光阴阅读(1089) 评论(0) 推荐(0) 编辑

2019年8月19日

SQL Server 并发控制第二篇：隔离级别和锁（1）

摘要： SQL Server 并发控制第一篇：并发模式和事务 SQL Server 并发控制第二篇：隔离级别和锁（1） SQL Server 并发控制第三篇：隔离级别和行版本（2）隔离级别定义事务处理数据读取操作的隔离程度，在悲观并发模式下，隔离级别只会影响读操作申请的共享锁（Shared Lock 阅读全文

posted @ 2019-08-19 11:29 悦光阴阅读(2157) 评论(0) 推荐(3) 编辑

2019年8月16日

性能调优11：查询统计

摘要：数据库引擎的工作流程可以归纳为接收请求、执行请求和返回结果。数据库引擎每接收到一个新的查询请求（Query Request），查询优化器就会执行以下工作流程：编译请求：对TSQL语句进行语法解析，编译请求，生成TSQL语句表示的逻辑结构。查询优化：根据TSQL语句的逻辑结构，生成多个预估的执行方阅读全文

posted @ 2019-08-16 16:51 悦光阴阅读(1048) 评论(0) 推荐(2) 编辑

2019年8月8日

Windows 任务调度程序定时执行Python脚本

摘要： Windows 任务调度程序（Task Scheduler）可以定时执行程序，本文分享使用Task Scheduler定时执行Python脚本的两种方法。在控制面版->管理员工具中打开 Task Scheduler ：在Task Scheduler Library中创建一个新的文件夹demo，右阅读全文

posted @ 2019-08-08 17:33 悦光阴阅读(15260) 评论(0) 推荐(3) 编辑

2019年7月31日

分类模型第3篇：knn分类

摘要： K最邻近（k-Nearest Neighbors，KNN）分类是一种监督式的分类方法，首先根据已标记的数据对模型进行训练，然后根据模型对新的数据点进行预测，预测新数据点的标签（label），也就是该数据所属的分类。一，knn算法的逻辑 knn算法的核心思想是：如果一个数据在特征空间中最相邻的k个数阅读全文

posted @ 2019-07-31 09:40 悦光阴阅读(16955) 评论(0) 推荐(3) 编辑

2019年7月30日

数据预处理第6篇：数据预处理（标准化、归一化、分类数据编码和离散化）

摘要： sklearn.preprocessing包提供了几个常用的转换函数，用于把原始特征向量转换为更适合估计器的表示。转化器(Transformer)用于对数据的处理，例如标准化、降维以及特征选择等，提供的函数大致是： fit(x,y):该方法接受输入和标签，计算出数据变换的方式。 transform 阅读全文

posted @ 2019-07-30 15:55 悦光阴阅读(7800) 评论(0) 推荐(3) 编辑

2019年7月28日

分类模型第1篇：分类模型概述

摘要：机器学习主要用于解决分类、回归和聚类问题，分类属于监督学习算法，是指根据已有的数据和标签（分类的类别）进行学习，预测未知数据的标签。分类问题的目标是预测数据的类别标签（class label），可以把分类问题划分为二分类和多分类问题。二分类是指在两个类别中选择一个类别，在二分类问题中，其中一个类别称阅读全文

posted @ 2019-07-28 22:23 悦光阴阅读(4280) 评论(0) 推荐(1) 编辑

2019年7月25日

DAX 第七篇：迭代函数

摘要：迭代是指逐行遍历表，访问一行叫做一次迭代，而每一次迭代得到的结果会作为下一次迭代的初始值。迭代函数至少拥有两个参数：第一个参数：要遍历的行集第二个参数：对同一行的不同字段要执行计算的表达式。一，迭代函数计算的过程最常见的迭代函数是SUMX函数，第一个参数Sales是要迭代的表或表值表达式，第阅读全文

posted @ 2019-07-25 12:01 悦光阴阅读(7858) 评论(0) 推荐(2) 编辑

2019年7月23日

DAX 第五篇：CALCULATE函数详解

摘要： CALCULATE()函数是DAX中最重要和最复杂的函数，用于计算处在筛选上下文中的表达式的值。 CALCULATE(<expression>,<filter1>,<filter2> … ) 第一个参数是用于计值的表达式，在计值之前，CALCULATE将首先计算<filter>参数，并与现有的外部筛阅读全文

posted @ 2019-07-23 13:20 悦光阴阅读(14359) 评论(0) 推荐(3) 编辑

DAX 第三篇：筛选上下文和 Filter函数

摘要： Visual上的任何一行或一列都是一个过滤上下文，切片器也是一个过滤上下文，或者报表上其他类型的过滤器，甚至Visual之间的交互，这些过滤上下文共同构成了一个单元格的过滤上下文。总的来说，报表的每个元素都可以创建过滤上下文，并且报表的每个单元格都有不同的过滤上下文。总结来说，筛选上下文是在报表中创阅读全文

posted @ 2019-07-23 11:03 悦光阴阅读(9139) 评论(0) 推荐(2) 编辑

2019年7月19日

DAX 第二篇：概述计算上下文

摘要：计算上下文是DAX表达式求值的环境，任何DAX表达式都是在上下文中求值的。行上下文和筛选上下文是DAX中仅有的上下文类型，把这两种上下文称为计算上下文。计算上下文用于限定公式计算的环境，当上下文变化时，相同的公式会计算出不同的结果。在PowerBI中创建的计算列是在行上下文中执行计算，创建的度量（阅读全文

posted @ 2019-07-19 13:30 悦光阴阅读(3179) 评论(0) 推荐(2) 编辑

2019年7月18日

DAX 第一篇：数据模型

摘要： DAX是一种专门用于计算数据模型的业务公式的语言，本文以Power BI的关系来学习数据模型。一，理解数据模型数据模型是由一组表和关系构成的结构，表和表之间由关系链接，如下图所示的产品数据模型：表格是组织数据的二维结构，由行和列构成，其本身是一个最简单的数据模型。当要描述更复杂的数据模型时，就阅读全文

posted @ 2019-07-18 10:21 悦光阴阅读(2499) 评论(0) 推荐(2) 编辑

2019年7月17日

Git 第二篇：基本操作

摘要： Git 基本操作系列博客： Git 第一篇：简单介绍 Git 第二篇：基本操作 Git 第三篇：VS Code使用Git管理代码 Git 第四篇：使用VS2013和git进行代码管理 Git的基本操作主要是创建本地库、增加内容，提交修改，并把修改同步到远程库，常用的命令是git clone、git 阅读全文

posted @ 2019-07-17 13:47 悦光阴阅读(1633) 评论(0) 推荐(1) 编辑

2019年7月11日

正则表达式第四篇：贪婪和懒惰匹配

摘要：转载：Python正则表达式之三：贪婪默认情况下，正则表达式进行贪婪匹配。所谓“贪婪”，是指当匹配到多种长度的字符串时，选择最长的；而“懒惰”，是指在匹配多种长度的字符串时，选择最短的。默认情况下，正则表达在匹配字符时，会把字符消耗掉；可以使用环视结构来匹配位置，使得正则不消耗字符，即正则在匹配阅读全文

posted @ 2019-07-11 19:02 悦光阴阅读(2558) 评论(0) 推荐(2) 编辑

2019年7月5日

spaCy 第三篇：依存分析

摘要：句法是指句子的各个组成部分的相互关系，句法分析分为句法结构分析（syntactic structure parsing）和依存关系分析(dependency parsing)。句法结构分析用于获取整个句子的句法结构，依存分析用于获取词汇之间的依存关系，目前的句法分析已经从句法结构分析转向依存句法分析阅读全文

posted @ 2019-07-05 13:12 悦光阴阅读(12740) 评论(0) 推荐(2) 编辑

悦光阴

请不要假装很努力，因为结果不会陪你演戏。

公告