dairui130

导航

2019年3月3日 #

excel查找某一列的值在、不在另一列中

摘要: 统计中遇到找出一列的值不在另一列的需求: 找出A列中不在B列的值 方法如下: 使用countif函数 比如找出A列中不在B列的值: 在C1中输入 下拉单元格,在首行添加筛选 筛选的方法,在我另一篇博客中。 得到如下结果 结果为1则表示,A列的值在B中。0则表示不在B中。 阅读全文

posted @ 2019-03-03 20:19 dairui130 阅读(16487) 评论(1) 推荐(0)

kafka的分区

摘要: 待做 阅读全文

posted @ 2019-03-03 17:18 dairui130 阅读(91) 评论(0) 推荐(0)

hive的 order by & distribute by & cluter by

摘要: 我们应该都清楚order by 的含义: 根据某个字段对输出的数据排序,因为只有一个reducer,所以查询效率较慢。 那么hive中,另外两个排序,distribute by和cluster by的含义是什么呢? distribute by 分区排序 直接上例子,hive中有张工资表:salary 阅读全文

posted @ 2019-03-03 17:17 dairui130 阅读(327) 评论(0) 推荐(0)

什么是码表,什么是维度表?

摘要: 整理业务库的库表字段和字段含义的时候,遇到了码表的概念,码表是什么,和维度表又是什么关系呢? 首先,码表没有明确的定义。 百度搜索码表,可以看到和数据处理相关的解释是:码表是 编码表(或代码表)的简称。 编码表: 是一种代码说明表格。 用来帮助用户明确无解释数据和字符 代码的含义。 例如:性别码表的 阅读全文

posted @ 2019-03-03 15:20 dairui130 阅读(11188) 评论(0) 推荐(0)

Spark streaming java代码

摘要: 待做 阅读全文

posted @ 2019-03-03 11:15 dairui130 阅读(139) 评论(0) 推荐(0)

Mysql分库分表

摘要: 待做 阅读全文

posted @ 2019-03-03 11:14 dairui130 阅读(123) 评论(0) 推荐(0)