大数据 - 第8页 - 网站分类

一文搞懂DevOps、DataOps、MLOps、AIOps：所有“Ops”的比较

引言近年来，“Ops”一词在 IT 运维领域的使用迅速增加。IT 运维正在向自动化过程转变，以改善客户交付。传统的应用程序开发采用 DevOps 实施持续集成（CI）和持续部署（CD）。但对于数据密集型的机器学习和人工智能（AI）应用，精确的交付和部署过程可能并不适用。本文将定义不同的“Ops” ...

袋鼠云产品功能更新报告10期｜智能进化，近百项功能升级加速数智化转型

欢迎查阅袋鼠云第10期产品功能更新报告。本期，我们精心推出了72项新增和优化功能，致力于在数字化浪潮中为您提供更高效、更智能的服务。我们相信，这些新特性将为您的业务注入新活力，确保您在数字化转型的每一步都坚实而有力。以下为袋鼠云产品功能更新报告第10期内容，更多探索，请继续阅读。离线开发平台新 ...

【入门教程】5分钟教你快速学会集成Java springboot ~

介绍 Apache DolphinScheduler是一个分布式易扩展的开源分布式调度系统，支持海量数据处理，具有任务流程调度、任务流程编排、任务监控告警、工作流引擎等功能。本文将介绍如何将Apache DolphinScheduler集成到 Java Springboot 项目中，以实现更灵活和 ...

2.6倍！WhaleTunnel 客户POC实景对弈DataX

作为阿里早期的开源产品，DataX是一款非常优秀的数据集成工具，普遍被用于多个数据源之间的批量同步，包括类似Apache DolphinScheduler的Task类型也对DataX进行了适配和增强，可以直接在DolphinScheduler里面利用通用的数据源调用DataX进行数据批量同步。作为 ...

Apache DolphinScheduler 社区5月月报更新！

各位热爱 DolphinScheduler 的小伙伴们，社区5月份月报更新啦！这里将记录 DolphinScheduler 社区每月的重要更新，欢迎关注，期待下个月你也登上Merge Star月度榜单哦~ 月度Merge Star 感谢以下小伙伴5月份为 Apache DolphinSchedule ...

Apache SeaTunnel社区5月月报更新！

各位热爱 SeaTunnel 的小伙伴们，社区 5 月份月报来啦！ SeaTunnel 正在迅猛发展，积极投入社区项目建设的小伙伴将促进SeaTunnel不断提升数据同步的高可扩展性、高性能及高可靠性。欢迎关注每月月报更新，期待在下个月的Merge Star月度榜单看到你的身影哦~ SeaTunne ...

从人工向智能化转变，企业级指标管理平台建设实战

随着大数据技术和人工智能的发展，企业逐渐意识到构建一个集中化的指标管理平台的必要性。这样的平台旨在解决几个核心问题：首先，确保所有部门都能通过统一的入口提交指标需求，实现需求的透明化管理；其次，建立完善的指标管理体系，涵盖从需求定义、模型设计、数据集成、开发实施到应用监控的全链条；第三，通过自动化和 ...

深入探索令牌桶限流的原理与实践

在当今的互联网时代，随着用户数量和请求量的不断增加，系统的性能和稳定性面临着巨大的挑战。限流算法作为保障系统稳定性的重要手段之一，被广泛应用于各种服务和应用中。限流的核心目的是对某一时间窗口内的请求数进行限制，保持系统的可用性和稳定性，防止因流量暴增而导致的系统运行缓慢或宕机。常见限流算法对比常 ...

恭喜社区迎来新PMC成员！

恭喜Apache SeaTunnel社区又迎来一位PMC Member@liugddx！在社区持续活跃的两年间，大家经常看到这位开源爱好者出现在社区的各种活动中，为项目和社区发展添砖加瓦。如今成为项目PMC Member，意味着在社区中的责任更重了，他有什么感想呢？对于社区未来的发展，他希望从哪些角 ...

Dolphinscheduler不重启加载Oracle驱动

转载自刘茫茫看山问题背景某天我们的租户反馈数据库连接缺少必要的驱动，我们通过日志查看确实是缺少部分数据库的驱动，因为DolphinScheduler默认只带了Oracle和MySQL的驱动，并且需要将pom文件中的test模式去掉才可以在打包的时候引入。我们的任务量比较大，在3.0存在容错机制的 ...

Apache DolphinScheduler(2.x和3.x版本) 本地环境搭建教程一览

在迅速变化的技术领域，本地环境的搭建和调试对于软件开发的效率和效果至关重要。本文将详细介绍如何为Apache DolphinScheduler搭建一个高效的本地开发环境，包括2.x和3.x版本的设置方法。无论您是初学者还是有经验的开发者，本指南都将帮助您快速启动并运行，有效地进行本地代码调试。依 ...

构建无服务器数仓（三）EMR Serverless 操作要点、优化以及开放集成测试

引言在数据驱动的世界中，企业正在寻求可靠且高性能的解决方案来管理其不断增长的数据需求。本系列博客从一个重视数据安全和合规性的 B2C 金融科技客户的角度来讨论云上云下混合部署的情况下如何利用亚马逊云科技云原生服务、开源社区产品以及第三方工具构建无服务器数据仓库的解耦方法。本篇博客着重探讨 EMR ...

DolphinScheduler 3.3.0版本更新一览

Apache DolphinScheduler即将迎来3.3.0版本的发布，届时将有一系列重要的更新和改进。在近期的社区5月份用户线上分享会上，项目PMC 阮文俊为大家介绍了3.3.0版本将带来的主要更新和改进，并为大家指出了如何参与社区的方式。什么是DolphinScheduler？ Dolph ...

14个Flink SQL性能优化实践分享

本文分享自华为云社区《Flink SQL性能优化实践》，作者：超梦。在大数据处理领域，Apache Flink以其流处理和批处理一体化的能力，成为许多企业的首选。然而，随着数据量的增长，性能优化变得至关重要。本文将深入浅出地探讨Flink SQL的常见性能问题、调优方法、易错点及调优技巧，并提供 ...

2024-2030数据集成成熟度曲线(一)

作者 | 郭炜导读：最新发布的《技术成熟度曲线2024》全面评估数据集成技术架构的7个维度，包括技术成熟度、技术难度、业务价值、技术成熟周期、管理协作难度、大模型结合等评估维度，报告篇幅较长，我们将报告分为3篇系列文章，本文为报告第一篇，描述了「从ETL 到ELT，到 EtLT的趋势」。接下来系 ...

EasyMR 基于国产化信创的适配实践技术详解

国产化信创，即采用国产信息技术产品和服务，构建自主可控的信息技术体系。近年来，随着国家对网络安全和信息安全的重视程度不断提高，国产化信创已经成为国家战略的重要组成部分，并呈现出以下大趋势： ● 政策驱动，加速发展国家出台了一系列政策法规，大力支持国产化信创产业发展。例如，《“十四五”数字经济发展规 ...

【最新】别再发邮件了，必须在开源之夏后台申请，50%的人竟然都没有报名成功！

引言近期我们注意到很多学生朋友通过邮件向导师申请报名，请注意！！！这是无效的，请必须通过“开源之夏”官方后台申请报名，请仔细参考这篇【报名攻略】所以，我们特此举办这次宣讲会，目的是向所有感兴趣的学生详细介绍Apache DolphinScheduler社区在开源之夏中提供的项目，并且解答学生朋 ...

阿里 Canal 实时同步 MySQL 增量数据至 ClickHouse 数据库

主要实现思路 1、在clickhouse中创建MySQL引擎表。 2、根据MySQL引擎表的信息创建目标表。 3、实现canal实时增量同步MySQL数据到clickhouse。 MySQL 的准备修改配置文件开启 Binlog [root@hadoop100 module]$ sudo vim ...

逻辑升级，深度解析如何实现业务中的且或组件

在业务实现的过程中，时常会出现且或关系逻辑的拼接。逻辑运算的组合使用，是实现复杂业务规则和决策支持系统的关键技术。目前袋鼠云的指标管理平台、客户数据洞察平台、数据资产平台都有在使用。并且，且或组件已经在 RC 5.0 中添加到组件库，企业现在可以更加灵活地构建和实施复杂的业务规则。本文将从前期分 ...

别再发邮件了，必须在开源之夏后台申请，50%的人竟然都没有报名成功！

引言近期我们注意到很多学生朋友通过邮件向导师申请报名，请注意！！！这是无效的，请必须通过“开源之夏”官方后台申请报名，请仔细参考这篇【报名攻略】所以，我们特此举办这次宣讲会，目的是向所有感兴趣的学生详细介绍Apache DolphinScheduler社区在开源之夏中提供的项目，并且解答学生朋 ...