2020年11月23日
摘要:转置即旋转数据表的横纵方向,常用来改变数据布局,以便用新的角度观察。有些转置算法比较简单,比如行转列、列转行、双向转置;有些算法变化较多,比如动态转置、转置时跨行计算、关联转置等。这些转置算法对日常工作多有助益,值得我们学习讨论。 基础转置 行转列和列转行是最简单的转置算法,形式上互为逆运算,具体请 阅读全文
posted @ 2020-11-23 08:55 拾光石艺 阅读(110) 评论(0) 推荐(0) 编辑
摘要:在数据处理业务中,经常要把文件结构相同或近似相同的数据文件合并成一个文件,或者将一个比较大的数据文件拆分成小的数据文件。本文将介绍文本文件和 Excel 文件合并及拆分会遇到的几种情况,并提供用 esProc SPL 编写的代码示例。esProc 是专业的数据计算引擎,SPL 中有完善的文件导入、导 阅读全文
posted @ 2020-11-23 08:48 拾光石艺 阅读(125) 评论(0) 推荐(0) 编辑
摘要:用 Excel 处理数据时,经常会涉及到多页 sheet 数据之间的关联运算需求,用 vlookup 可以完成部分简单关联,但较复杂的情况时仍然不太方便,常常需要多次操作才能完成。另外,当要做关联的文件比较多,需要批量处理时,虽然可以借助 VBA 来实现,但 VBA 不是个专门为结构化计算设计,实现 阅读全文
posted @ 2020-11-23 08:45 拾光石艺 阅读(150) 评论(0) 推荐(0) 编辑
摘要:用 Excel 处理数据时,有时需要对字符串进行拆分。对于比较简单的拆分,使用 Excel 函数可以顺利完成,但碰到一些特殊需求,或者拆分的规则比较复杂时,则很难用 Excel 实现了。这里列出一些拆分需求示例,分析拆分难点,并提供 SPL 解决代码。SPL 是专业计算引擎 esProc 使用的语言 阅读全文
posted @ 2020-11-23 08:42 拾光石艺 阅读(628) 评论(0) 推荐(0) 编辑
摘要:期望结果: 按照成绩划分区间段来分组时,定义好值的划分区间后,只需用 pseg 函数便可以将分数分好段,然后统计出各段人次即可。 SPL 代码如下: A B 1 =clipboard().import@t() /从剪贴板导入分数表 2 =[0,60,90] /定义分数分段区间 3 =["C","B" 阅读全文
posted @ 2020-11-23 08:25 拾光石艺 阅读(104) 评论(0) 推荐(0) 编辑
  2020年11月16日
摘要:1. 最大值 / 最小值 最大值 / 最小值可以理解为 TopN 查询中,N 等于 1 时的情况,因为很常用所以单独拿出来讲一下。取最大值 / 最小值是很常见的需求,例如一班数学最高分是多少,员工年龄最小的是几岁等等。但是有时候我们并不关心具体的值,而是关心最大值 / 最小值出现的位置,这种需求常用 阅读全文
posted @ 2020-11-16 14:25 拾光石艺 阅读(42) 评论(0) 推荐(0) 编辑
摘要:分组后的计算都类似,仍然采用 groups 函数,分组并同时计算出各洲的 GDP 总量,然后再求一遍各洲的 GDP 总量占全球 GDP 的百分比值。 SPL 代码如下: A B 1 =clipboard().import@t() /从剪贴板导入带标题的考试成绩表 2 =A1.groups(Area; 阅读全文
posted @ 2020-11-16 14:19 拾光石艺 阅读(73) 评论(0) 推荐(0) 编辑
  2020年11月9日
摘要:商业工作中最常见的数据是表格式数据,比如订单记录、人员信息、销售合同等,用专业的术语来说叫做结构化数据。职场人员处理表格式数据时,最常用的工具是Excel,这是因为Excel提供了简单易用的公式和界面友好的操作,可以完成大多数任务。但有时遇到较特殊困难的运算,以及要反复执行的动作或涉及大批量文件的处 阅读全文
posted @ 2020-11-09 09:17 拾光石艺 阅读(105) 评论(0) 推荐(0) 编辑
  2020年11月6日
摘要:职场人员使用 Excel 进行数据处理已经成为家常便饭。不过相信大家一定有过很无助的情况,比如复杂计算、重复计算、自动处理等,再遇上个死机没保存,整个人崩溃掉也不是完全不可能。 如果学会了程序语言,这些问题就都不是事了。那么,该学什么呢? 无数培训机构和网上资料都会告诉我们:Python! Pyth 阅读全文
posted @ 2020-11-06 11:53 拾光石艺 阅读(38) 评论(0) 推荐(0) 编辑
  2020年10月27日
摘要:有些报表查询出的数据行数可达千万甚至上亿,这类报表通常被叫做大报表,大多数情况下都是些清单明细数据报表,也有少量分组报表。 针对大报表,如果像常规报表一样,将数据一次性全取再交给前端呈现是不可行的。一是等待时间太长,用户体验差;二是很可能导致内存溢出造成应用崩溃。 那么,目前的报表产品是如何解决这一 阅读全文
posted @ 2020-10-27 11:47 拾光石艺 阅读(71) 评论(0) 推荐(0) 编辑