上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 26 下一页
摘要: 表连接是指两张表根据关联字段,组合成一个数据集。表连接不仅可以利用数据模型中已有的关系,而且可以利用DAX表达式基于表的任意列定义连接条件。因此,在DAX中,实现表与表之间的连接,有两种方式: 第一种方式:利用数据模型中的现有关系,以便查询包含在不同表中的数据。 第二种方式:编写 DAX 表达式创建 阅读全文
posted @ 2019-09-10 15:57 悦光阴 阅读(2678) 评论(0) 推荐(1) 编辑
摘要: DAX有三个用于生成分组聚合数据的函数,这三个函数有两个共同的特征:分组列和扩展列。 分组列是用于分组的列,只能来源于基础表中已存的列,分组列可以来源于同一个表,也可以来源于相关的列。 扩展列是由name和expression对构成的,name是字符串,expression是包含聚合函数的表达式。 阅读全文
posted @ 2019-09-09 16:45 悦光阴 阅读(3306) 评论(0) 推荐(0) 编辑
摘要: 阻塞就是常说的等待(wait),是指事务A等待特定的资源得到满足之后,才能继续执行下去。发生阻塞的另外一种情况是被其他事务阻塞。阻塞对性能的影响,有时会比死锁更严重,这是因为死锁持续的时间非常短,SQL Server 一旦探测到死锁的发生,就会立即杀死一个进程,以结束死锁,使其他进程能够正常运行下去 阅读全文
posted @ 2019-08-20 07:27 悦光阴 阅读(672) 评论(0) 推荐(0) 编辑
摘要: SQL Server 并发控制 第一篇:并发模式和事务 SQL Server 并发控制 第二篇:隔离级别和锁(1) SQL Server 并发控制 第三篇:隔离级别和行版本(2) 隔离级别定义事务处理数据读取操作的隔离程度,在悲观并发模式下,隔离级别只会影响读操作申请的共享锁(Shared Lock 阅读全文
posted @ 2019-08-19 11:29 悦光阴 阅读(1673) 评论(0) 推荐(2) 编辑
摘要: 数据库引擎的工作流程可以归纳为接收请求、执行请求和返回结果。数据库引擎每接收到一个新的查询请求(Query Request),查询优化器就会执行以下工作流程: 编译请求:对TSQL语句进行语法解析,编译请求,生成TSQL语句表示的逻辑结构。 查询优化:根据TSQL语句的逻辑结构,生成多个预估的执行方 阅读全文
posted @ 2019-08-16 16:51 悦光阴 阅读(827) 评论(0) 推荐(2) 编辑
摘要: Windows 任务调度程序(Task Scheduler)可以定时执行程序,本文分享使用Task Scheduler定时执行Python脚本的两种方法。 在控制面版->管理员工具中打开 Task Scheduler : 在Task Scheduler Library中创建一个新的文件夹demo,右 阅读全文
posted @ 2019-08-08 17:33 悦光阴 阅读(11146) 评论(0) 推荐(2) 编辑
摘要: K最邻近(k-Nearest Neighbors,KNN)分类是一种监督式的分类方法,首先根据已标记的数据对模型进行训练,然后根据模型对新的数据点进行预测,预测新数据点的标签(label),也就是该数据所属的分类。 一,knn算法的逻辑 knn算法的核心思想是:如果一个数据在特征空间中最相邻的k个数 阅读全文
posted @ 2019-07-31 09:40 悦光阴 阅读(13122) 评论(0) 推荐(2) 编辑
摘要: sklearn.preprocessing包提供了几个常用的转换函数,用于把原始特征向量转换为更适合估计器的表示。 转化器(Transformer)用于对数据的处理,例如标准化、降维以及特征选择等,提供的函数大致是: fit(x,y):该方法接受输入和标签,计算出数据变换的方式。 transform 阅读全文
posted @ 2019-07-30 15:55 悦光阴 阅读(4141) 评论(0) 推荐(2) 编辑
摘要: 机器学习主要用于解决分类、回归和聚类问题,分类属于监督学习算法,是指根据已有的数据和标签(分类的类别)进行学习,预测未知数据的标签。分类问题的目标是预测数据的类别标签(class label),可以把分类问题划分为二分类和多分类问题。二分类是指在两个类别中选择一个类别,在二分类问题中,其中一个类别称 阅读全文
posted @ 2019-07-28 22:23 悦光阴 阅读(2091) 评论(0) 推荐(0) 编辑
摘要: 统计函数用于创建聚合,对数据进行统计分析。在使用统计函数时,必须考虑到数据模型,表之间关系,数据重复等因素,一般都会搭配过滤函数实现数据的提取和分析。 统计量一般是:均值、求和、计数、最大值、最小值、求中位数、求分位数、方差和标准差等。 一,求均值 均值分为几何均值和算术均值,几何平均数是n个变量值 阅读全文
posted @ 2019-07-25 12:01 悦光阴 阅读(5688) 评论(0) 推荐(2) 编辑
摘要: CALCULATE()函数是DAX中最复杂的函数,用于计算由指定过滤器修改的上下文中的表达式。 第一个参数是用于计算聚合值的度量,后面的参数是可选的过滤器,共有两种类型: 返回布尔值的逻辑表达式 返回表值的表达式 CALCULATE函数的复杂之处在于可变的计算上下文。如果数据已被过滤,则CALCUL 阅读全文
posted @ 2019-07-23 13:20 悦光阴 阅读(5470) 评论(0) 推荐(1) 编辑
摘要: 过滤器函数允许你操纵筛选上下文以创建动态的计算,是DAX中最复杂和最强大的一类函数,本文记录我对一些常见的过滤器函数的总结。 一,筛选上下文的构成 DAX中的筛选上下文由三部分构成:交叉过滤构成的过滤,查询上下文中每行的列值构成的过滤,外部切片器构成的显式过滤。 1,交叉过滤器 在数据模型中创建关系 阅读全文
posted @ 2019-07-23 11:03 悦光阴 阅读(6074) 评论(0) 推荐(1) 编辑
摘要: 计算上下文是计算公式的环境,任何DAX表达式都是在上下文中求值的。行上下文和筛选上下文是DAX中仅有的上下文类型,把这两种上下文称为计算上下文。计算上下文用于限定公式计算的环境,当上下文变化时,相同的公式会计算出不同的结果。 一,计算上下文 在PowerBI中创建的计算列是在行上下文中执行计算,创建 阅读全文
posted @ 2019-07-19 13:30 悦光阴 阅读(2041) 评论(0) 推荐(0) 编辑
摘要: DAX是一种专门用于计算数据模型的业务公式的语言,本文以Power BI的关系来学习数据模型。 一,理解数据模型 数据模型是由一组表和关系构成的结构,表和表之间由关系链接,如下图所示的产品数据模型: 表格是组织数据的二维结构,由行和列构成,其本身是一个最简单的数据模型。当要描述更复杂的数据模型时,就 阅读全文
posted @ 2019-07-18 10:21 悦光阴 阅读(1351) 评论(0) 推荐(2) 编辑
摘要: Git 基本操作系列博客: Git 第一篇:简单介绍 Git 第二篇:基本操作 Git 第三篇:VS Code使用Git管理代码 Git 第四篇:使用VS2013和git进行代码管理 Git的基本操作主要是创建本地库、增加内容,提交修改 ,并把修改同步到远程库,常用的命令是git clone、git 阅读全文
posted @ 2019-07-17 13:47 悦光阴 阅读(1267) 评论(0) 推荐(0) 编辑
摘要: 转载:Python正则表达式之三:贪婪 默认情况下,正则表达式进行贪婪匹配。所谓“贪婪”,是指当匹配到多种长度的字符串时,选择最长的;而非贪婪,就是在匹配多种长度的字符串时,选择最短的。 默认情况下,正则表达在匹配字符时,会把字符消耗掉;可以使用环视结构来匹配位置,使得正则不消耗字符,即正则在匹配文 阅读全文
posted @ 2019-07-11 19:02 悦光阴 阅读(1278) 评论(0) 推荐(1) 编辑
摘要: 句法是指句子的各个组成部分的相互关系,句法分析分为句法结构分析(syntactic structure parsing)和依存关系分析(dependency parsing)。句法结构分析用于获取整个句子的句法结构,依存分析用于获取词汇之间的依存关系,目前的句法分析已经从句法结构分析转向依存句法分析 阅读全文
posted @ 2019-07-05 13:12 悦光阴 阅读(7059) 评论(0) 推荐(1) 编辑
摘要: datetime模块中包含五种基本类型:date、time、datetime、timedelta和tzinfo,tz是time zone的缩写,tzinfo用于表示时区信息,timedelta 表示两个datetime之间的差值。时间戳是指某一个特定的时刻,通常使用datetime对象来表示。 一, 阅读全文
posted @ 2019-06-27 11:05 悦光阴 阅读(1256) 评论(0) 推荐(1) 编辑
摘要: 常用的数据存储介质是数据库和csv文件,pandas模块包含了相应的API对数据进行输入和输出: 对于格式化的平面文件:read_table() 对于csv文件:read_csv()、to_csv() 对于SQL查询:read_sql、to_sql() 一,平面文件 把按照界定符分割的格式化文件读取 阅读全文
posted @ 2019-06-21 19:25 悦光阴 阅读(9677) 评论(0) 推荐(1) 编辑
摘要: 在Python语言中,从SQL Server数据库读写数据,通常情况下,都是使用sqlalchemy 包和 pymssql 包的组合,这是因为大多数数据处理程序都需要用到DataFrame对象,它内置了从数据库中读和写数据的函数:read_sql()和to_sql(),这两个函数支持的连接类型是由s 阅读全文
posted @ 2019-06-04 13:54 悦光阴 阅读(5143) 评论(0) 推荐(1) 编辑
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 26 下一页