上一页 1 2 3 4 5 6 7 8 ··· 24 下一页
摘要: ​ Superset终于迎来了又一个重大的版本更新。使用superset已经近三年的时间了,其为我们提供了数据可视化的解决方案。也成为了最好的商用BI的替代方案。 ​ 在Github上本次更新已经发布。 Pip相关软件包也已经发布。 ​ 2.0版本主要更新: 默认启用Explore控制面板中的拖放界 阅读全文
posted @ 2022-07-20 11:09 独孤风 阅读(1968) 评论(0) 推荐(0) 编辑
摘要: 开源数据质量管理工具预研——Griffin VS Deequ VS Great expectations VS Qualitis。 概述 ​ 数据质量监控(DQC)是最近很火的一个话题,也是数据治理中最重要的一环。有一句话说得好。数据质量未必是数据治理中最重要的一部分,但是数据质量可能是让数据治理工 阅读全文
posted @ 2022-07-18 09:48 独孤风 阅读(2693) 评论(0) 推荐(1) 编辑
摘要: 提到格里芬—Griffin,大家想到更多的是篮球明星或者战队名,但在大数据领域Apache Griffin(以下简称Griffin)可是数据质量领域响当当的一哥。先说一句:Griffin是大数据质量监控领域唯一的Apache项目,懂了吧。 ​ 在不重视数据质量的大数据发展时期,Griffin并不能引 阅读全文
posted @ 2022-07-15 13:20 独孤风 阅读(3429) 评论(0) 推荐(0) 编辑
摘要: ​ 元数据管理平台Datahub最近的热度越来越高。已经更新到了0.8.40的版本,来咨询我的小伙伴也越来越多,特别是安装过程有很多问题。 ​ 考虑到有些企业部分数据服务是部署在内网的,那么离线安装Datahub就显得非常重要了。 而且对于在线安装遇到很多问题的情况,或者是网络不好的情况,用离线安装 阅读全文
posted @ 2022-07-07 15:50 独孤风 阅读(1455) 评论(0) 推荐(0) 编辑
摘要: ​ 关注DTCC有几年了,还是在当中学到了很多的干货。今年我的大部分时间也都是投入在了数据治理的学习和数据治理工具的调研中。也非常渴望有这种机会去了解一下国内顶尖公司这方面的前沿技术与应用。 DTCC是什么? ​ DTCC数据库大会是国内顶尖的数据领域技术峰会,每年都会举办。所探讨的技术方向往往是未 阅读全文
posted @ 2022-06-30 19:02 独孤风 阅读(350) 评论(0) 推荐(0) 编辑
摘要: 对大数据和数据分析感兴趣的同学,如何入门一直是一个大问题。 而对于找工作的同学,笔试和面试环节也一直是一个让人头疼的问题。 其实企业也很头疼,不进行笔试,怕被面试者忽悠。进行笔试可能又把某些大牛筛出去了。 但是不管怎么说,有些硬技能还是需要的,比如做大数据来说,如果只是了解各种组件的使用,是远远不够 阅读全文
posted @ 2022-06-29 11:14 独孤风 阅读(1053) 评论(0) 推荐(0) 编辑
摘要: 实时数仓以端到端低延迟、SQL标准化、快速响应变化、数据统一为目标。美团外卖数据智能组总结的最佳实践是:一个通用的实时生产平台跟一个通用交互式实时分析引擎相互配合,同时满足实时和准实时业务场景。两者合理分工,互相补充,形成易开发、易维护且效率高的流水线,兼顾开发效率与生产成本,以较好的投入产出比满足 阅读全文
posted @ 2022-03-18 09:22 独孤风 阅读(799) 评论(0) 推荐(0) 编辑
摘要: ​ 今天来聊聊大数据相关的证书,提到证书就不得不说含金量。我们都知道注册会计师,注册电气工程师,注册消防工程师等等,相信都听过其他同学朋友有在考的,这种证书含金量就很高,而且可以挂靠的方式极大的提高收入水平。 一、大数据证书 ​ 那么问题来了,大数据有没有这种高含金量的证书呢?我也查了工信部的网站, 阅读全文
posted @ 2022-03-11 13:07 独孤风 阅读(905) 评论(1) 推荐(0) 编辑
摘要: 前言 ​ 每个组织都有自己的数据管理方式。有的公司准备自研并制定了长期计划,有的公司使用最新的数据管理工具和技术,有的公司则是为了满足监管机构的要求。这几种的思路完全不一样。 ​ 要让公司成为真正的数据驱动型组织,不仅仅需要制定数据策略或推出更新的软件技术。关键在于数据的整体治理和管理,解决这个问题 阅读全文
posted @ 2022-03-10 09:04 独孤风 阅读(1048) 评论(0) 推荐(2) 编辑
摘要: ​ 用户画像是大数据顶层应用中最重要的一环,搭建一套适合本公司体系的用户画像尤为重要。但是,用户画像的资料往往理论居多,实践少,更少有工程化的实战案例。 ​ 本文档结合了常见的用户画像架构,使用Elasticsearch作为底层存储支撑,用户画像的检索和可视化效率得到了大幅度的提升。文档从用户画像的 阅读全文
posted @ 2022-01-12 10:08 独孤风 阅读(801) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 24 下一页