上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 42 下一页
摘要: 最近几年,ELT(Extract, Load, Transform)这个词在数据圈里挺火。有些人甚至说,有了ELT,ETL(Extract, Transform, Load)就该退出历史舞台了。作为一个干了十多年ETL的老兵,我觉得有必要说道说道。 先说说这两个概念。ETL是先把数据抽取出来,经过处 阅读全文
posted @ 2024-09-24 11:07 谷云科技RestCloud 阅读(76) 评论(0) 推荐(0)
摘要: ETL项目的重要性及其复杂性 在我十多年的数据仓库建设经验中,ETL(Extract, Transform, Load)一直是最具挑战性的环节之一。简单来说,ETL就是将分散在各个业务系统中的数据抽取出来,经过清洗转换,最后加载到数据仓库中的过程。这个过程看似简单,实则暗藏玄机。 为什么说ETL如此 阅读全文
posted @ 2024-09-23 11:12 谷云科技RestCloud 阅读(196) 评论(0) 推荐(0)
摘要: ETL与Kafka为何需要集成? 随着企业对实时流数据的处理要求越来越高,很多企业都把实时流数(日志、实时CDC采集数据、设备数据…)先推入到kafka中,再通过ETL对kafka中的数据进行消费通过ETL强大的数据的转换、清洗功能来进行数据的集成与分发。 实时数据流的处理对于企业洞察市场动态、优化 阅读全文
posted @ 2024-09-20 10:07 谷云科技RestCloud 阅读(130) 评论(0) 推荐(0)
摘要: 数据集成、数据治理已经成为推动企业数字化转型的核心动力,现在的企业比任何时候都需要一个更为强大的新一代数据集成工具来处理、整合并转化多种数据源。 而ETL(数据提取、转换、加载)作为数据管理的关键步骤,已在企业数据架构中扮演重要角色。然而,随着数据量的爆炸性增长、数据复杂性的提升、敏捷化任务开发、多 阅读全文
posted @ 2024-09-19 12:10 谷云科技RestCloud 阅读(118) 评论(0) 推荐(0)
摘要: 1.ETL选型前言 市面上ETL工具国内外加起来估计得有30种之多,其中近20款工具都花时间试用过,现在把试用后总结出来的经验分享一下,目前很多企业在选择ETL工具时不知道怎么选择适合自己的工具也不可能一款一款的去试用,试用成本非常高,而且不同企业数据量,对数据质量的要求,技术开发人员的水平都不一样 阅读全文
posted @ 2024-09-18 18:00 谷云科技RestCloud 阅读(1058) 评论(0) 推荐(0)
摘要: 背景 很多企业都购买了商业智能(BI)来加速数字化转型,但是发现仅仅依赖BI效果往往不太好。虽然通过BI,企业能够快速分析和可视化数据,然而,BI并不是一个万能工具,它虽然能帮助企业解读数据,但其有效性高度依赖于数据的质量和一致性,很多企业直接用BI连接生产系统的数据进行分析,极大影响了生产系统的性 阅读全文
posted @ 2024-09-14 16:41 谷云科技RestCloud 阅读(82) 评论(0) 推荐(0)
摘要: 流数据处理和批数据处理之间的区别主要在于数据的处理方式、时间性、架构设计和适用场景。虽然批处理系统和流处理系统都可以处理数据,但它们处理数据的方式和目的不同,以我们来对“流数据处理”和“批数据处理”进行差异分析。 1、流数据处理 vs. 批数据处理 流数据处理(Stream Processing) 阅读全文
posted @ 2024-09-13 11:28 谷云科技RestCloud 阅读(104) 评论(0) 推荐(0)
摘要: 一、标准化轻量级数据中台落地探索 尽管数据中台在近些年的热度有所下降,但大中型企业依然对其建设非常重视。企业通过数据中台的搭建,旨在构建统一的数据开发、管理和应用规范,创造标准统一的数据资产,夯实数据互通的基础,突破数据壁垒,实现数据迅速助力业务需求的目标,这个需求始终存在。尽管项目名称过去可能是" 阅读全文
posted @ 2024-09-12 11:13 谷云科技RestCloud 阅读(221) 评论(0) 推荐(0)
摘要: 前言 MySQL数据迁移至另一MySQL数据库的过程,不仅是数据复制或移动的操作那么简单,它还涉及到一系列策略性考量和技术优化,旨在实现数据的高效、安全传输,以及确保目标系统的高性能运行。其深远意义在于为企业的数字化转型提供强有力的数据支撑,确保业务连续性与竞争力。 ETLCloud作为一款全域数据 阅读全文
posted @ 2024-09-10 12:08 谷云科技RestCloud 阅读(59) 评论(0) 推荐(0)
摘要: 在现代企业数据架构中,数据整合是至关重要的一个环节,它不仅关乎数据的准确性与一致性,还直接影响到数据分析的有效性和业务决策的精确性。Doris(原名 Palo)与 Hive 是两大在大数据处理领域内广泛应用的数据存储与分析系统,它们各有千秋,适用于不同的场景。将Doris数据整合至Hive数据库,旨 阅读全文
posted @ 2024-09-04 11:56 谷云科技RestCloud 阅读(130) 评论(0) 推荐(0)
上一页 1 ··· 18 19 20 21 22 23 24 25 26 ··· 42 下一页