肥仔佳文猪 - 博客园

2021年3月10日

摘要： 1.数据不一致由于企业内数据存在不一致，导致企业大量浪费时间，金钱和人力。花费时间和精力用于判断企业内一个客户的真正地址或者其他基础信息到底是什么，并不能增加企业的收入，恰恰相反，没有一个好的存储机制用来保存比对过的客户数据，这种一致性处理数据的过程常常会发生多次。 2.数据冗余大多数企业没有专阅读全文

posted @ 2021-03-10 16:25 肥仔佳文猪阅读(752) 评论(0) 推荐(0)

2021年3月9日

kylin聚合组的使用案例

摘要：在使用kylin聚合组进行优化的时候，往往不知道怎么使用。这里有2个小案例可以参考。 1。需要对某个维度进行隔离。如果有些维度，你不想要它和其他维度一起出现，你就可以单独给它建一个聚合组，并且在其他聚合组里不要把它加进来。这样的话，这个维度就只会单独出现，实现了“隔离”。 2.如果你事先知道了阅读全文

posted @ 2021-03-09 20:02 肥仔佳文猪阅读(267) 评论(0) 推荐(0)

kylin剪枝优化的两种方式

摘要： 1.衍生维度。在kylin中，如果某些维度都属于同一种类型，且数量较多，可以考虑做成衍生维度。衍生维度就是将一批维度做成一张维度表，只在源表中保留这张表的外键，这样预处理的时候，就只会处理这个外键，而不会去处理维度表中的维度，降低cuboid的数量。衍生维度用于在有效维度内将维度表上的非主键维阅读全文

posted @ 2021-03-09 19:53 肥仔佳文猪阅读(404) 评论(0) 推荐(0)

kylin优化的思想

摘要： kylin的核心优势在于使用额外的空间存储预计算的结果，以换取查询时间的缩减。所以我们要对额外的空间进行优化，并且在空间优化之后，cuboid无法完全命中时，对查询时间进行优化。空间优化的思路就是试图减少额外空间占用，最常用的就是剪枝优化。去掉那些多余的cuboid，减少预聚合的数量查询时间优阅读全文

posted @ 2021-03-09 19:25 肥仔佳文猪阅读(93) 评论(0) 推荐(0)

kylin的rowkey优化之调整rowkey顺序

摘要：在以hbase为存储的cuboid中，会有很多计算好的数据行，这每个行的key都是由维度值按顺序生成的rowkey 而这个顺序，在我们做cube设计的时候是可以调整的。具体调整路径是：cube designer -> advanced setting -> rowkey kylin会根据你设计的维阅读全文

posted @ 2021-03-09 15:57 肥仔佳文猪阅读(449) 评论(0) 推荐(0)

kylin的rowkey优化之按维度分片

摘要：我们知道，系统会对cuboid的数据进行分片处理。但是默认的分片策略是随机的，如果group by a,b 的查询命中了某个cuboid，但是a=1 and b=1 的两条数据在不同的机器上存储，那就要将这两条数据返回到存储引擎的driver(hbase里是coprocessor)，再根据逻辑做阅读全文

posted @ 2021-03-09 15:41 肥仔佳文猪阅读(214) 评论(0) 推荐(0)

2021年3月5日

主题划分

摘要：两类主题的划分：面向业务、面向分析。面向业务：解耦复杂业务。我们将实体关系模型进行变种处理为实体与业务过程模型。实体定义为业务过程的参与体；业务过程定义是由多个实体作用的结果，实体与业务过程都带有自己特有的属性。面向分析：在DWA进行应用，例如销售分析域、组织分析域。阅读全文

posted @ 2021-03-05 15:50 肥仔佳文猪阅读(345) 评论(0) 推荐(0)

模型设计流程

摘要：阅读全文

posted @ 2021-03-05 15:20 肥仔佳文猪阅读(83) 评论(0) 推荐(0)

2021年3月2日

内啡肽的作用

摘要：内啡肽在痛苦的时候会分泌多巴胺在快乐的时候会分泌多巴胺会带来渴望内啡肽会带来镇静内啡肽可以刺激人的生长，刺激自身持续不断的分泌内啡肽，简言之就是有受虐倾向的人阅读全文

posted @ 2021-03-02 20:37 肥仔佳文猪阅读(2203) 评论(0) 推荐(0)

2021年2月7日

关于元数据的定义

摘要：元数据主要记录了数据仓库模型的定义、各层级间的映射关系、监控数据仓库的数据状态及ETL的任务运行状态。那么针对元数据，我们又可以分为技术元数据和业务元数据。那么我们首先来讲技术元数据，其实理解技术元数据你可以理解为是存储数据仓库系统技术细节的数据，是用于开发和管理数据仓库使用的数据。包括：分阅读全文

posted @ 2021-02-07 21:54 肥仔佳文猪阅读(551) 评论(0) 推荐(0)

公告