摘要: 1)什么是布隆过滤器? 布隆过滤器(英语:Bloom Filter)是 1970 年由布隆提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。主要用于判断一个元素是否在一个集合中。通常我们会遇到很多要判断一个元素是否在某个集合中的业务场景,一般想到的是将集合中所有元素保存起来,然后通过比较确 阅读全文
posted @ 2021-03-17 19:45 trine 阅读(173) 评论(0) 推荐(0)
摘要: https://www.notion.so/f4599c6a942e46478e8cdb135ed3475d?v=eb20867de6a146d9ae849f43af3ffefc 阅读全文
posted @ 2021-03-02 20:17 trine 阅读(91) 评论(0) 推荐(0)
摘要: 维度建模中,事实表分为三类:事务事实表,周期快照事实表,累计事实表,他们维度一致,但功能要求和描述的业务事实存在巨大差异。 1. 事务事实表 事务事实表记录事务层面的事实,保存最为原子的数据,其数据在事务发生后发生,粒度为每一行数据。其一旦提交不能修改,增量更新。 事实表一般围绕着度量来建立,当度量 阅读全文
posted @ 2021-03-02 15:30 trine 阅读(4249) 评论(0) 推荐(1)
摘要: 介绍 TBLPROPERTIES用途:向表中添加自定义或预定义的元数据属性,并设置它们的赋值。在hive建表时,可设置TBLPROPERTIES参数修改表的元数据,也能通过ALTER语句对其修改。 使用SHOW TBLPROPERTIES可查看表的元数据。 用法 ALTER TABLE table_ 阅读全文
posted @ 2021-03-02 09:51 trine 阅读(5064) 评论(0) 推荐(0)
摘要: 给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 该题思路如下: 该题采用回溯方法可解决,主要问题为重复排序去重,如**2*2**中,如果按常规方式,可能会将22视为2'2与22',此时可以选择合适的判定策略-串的连续判断,即如abc,当a未被使用时,b也不能被使用,c 阅读全文
posted @ 2021-03-01 22:06 trine 阅读(54) 评论(0) 推荐(0)
摘要: 因为最近常用linux系统,故开此博文记录常用命令。 1)cd命令 常用命令,用于切换当前目录,它的参数是要切换到的目录的路径,可以是绝对路径,也可以是相对路径。如: cd /root/Docements # 切换到目录/root/Docements cd ./path # 切换到当前目录下的pat 阅读全文
posted @ 2021-03-01 20:46 trine 阅读(69) 评论(0) 推荐(0)