刷新
读DAMA数据管理知识体系指南10数据建模(中)

博主头像 1. 域 1.1. 在数据建模中,域(Domain)代表某一属性可被赋予的全部可能取值 1.2. 域可以用不同的方式来表达 1.3. 域提供了一种将属性特征标准化的方法 1.4. 域中所有的值都为有效的值 1.4.1. 不在域中的值被称为无效的值 1.4.2. 属性中不应当含有其指定的域以外的值 1 ...

工作流调度必看!2025年这四大核心趋势你不能不懂

博主头像 在数字化时代,数据如同流淌在企业血管中的血液,源源不断地为业务决策输送养分。而大数据工作流调度系统,就像是一位精准的指挥家,协调着数据处理流程中的各个环节,确保数据的高效流动与价值释放。那么,究竟什么是大数据工作流调度系统?它在当前的技术版图中处于何种地位?又将朝着怎样的未来趋势演进?让我们一探究竟 ...

从 DeepSeek 突然爆发,看数据开发的应用市场

博主头像 在数字化快速发展的当下,人工智能与数据技术不断迭代。近期,DeepSeek 凭借自身技术实力在市场中迅速崛起,为剖析数据开发应用市场提供了视角。 DeepSeek 爆发:技术与市场的双重驱动 1.1 技术实力奠定根基 DeepSeek 崛起的关键在于技术实力。它基于 Transformer 架构打造 ...

数据没“就绪”,马斯克和AI大模型照样犯错

博主头像 不久前,埃隆·马斯克在推动美国政府效率部改革期间,对社保系统进行审查时揭露了重大异常,发现社保记录中存在年龄高达360岁的受益人,而且社保领取人数达3.98亿,远超美国实际人口(约3.3亿)。这一“乌龙”引发公众对社保资金滥用及政府监管失效的质疑。然而,美国社会保障局(SSA)对马斯克披露的异常数据 ...

读DAMA数据管理知识体系指南09数据建模(上)

博主头像 1. 数据建模 1.1. 数据建模是发现、分析和确定数据需求的过程,用一种称为数据模型的精确形式表示和传递这些数据需求 1.2. 数据建模是数据管理的一个重要组成部分 1.3. 建模过程中要求组织发现并记录数据组合的方式 1.4. 数据模型有助于组织能够理解其数据资产 1.5. 最为常见的6种模式 ...

读DAMA数据管理知识体系指南08数据架构(下)

博主头像 1. 活动 1.1. 面向质量 1.1.1. 专注于业务和IT开发周期内对数据架构进行不断改进 1.1.2. 如果架构没有得到妥善管理,也会慢慢遭到破坏,系统逐渐变得越来越复杂和缺乏扩展性,因而给组织带来风险 1.1.3. 面向质量的方法与传统的数据架构工作保持一致,其中架构质量改进是逐步完成的 1 ...

DeepSeek针对招聘JD与候选人生成专有面试题

博主头像 先上传JD招聘岗位描述上传候选人简历与工作经历另一个思路是直接询问 某个岗位行业技能要求上传候选人简历 生成面试问题候选人简历匹配度评分总结一、提升招聘效率与质量精准匹配:DeepSeek能够基于岗位描述,对候选人的简历进行深度解析,准确理解其教育背景、工作经验、技能特长等信息,并据此生成与岗位高度 ...

读DAMA数据管理知识体系指南06数据治理(下)

博主头像 数据治理需规划,含复杂性协调,需定义流程、术语表,协调架构师,分配数据财务价值。实施包括发起标准、规程,制定术语表,协调团队,估值数据资产。需嵌入流程,利用工具方法,实施指南,注重组织文化和变革管理,灵活调整沟通策略。度量指标关注价值、有效性、可持续性。 ...

不重视数据质量,企业要出大问题!

博主头像 在数字化浪潮席卷全球的当下,数据已然成为企业的核心资产,宛如血液一般流淌于企业运营的每一个脉络之中。从市场趋势的精准洞察,到产品研发的创新方向把控;从营销策略的制定与优化,再到客户关系的精细化管理,企业的每一项关键决策都深深依赖数据的支撑。而数据质量,作为这一系列决策的基石,其重要性不言而喻。 数据 ...

看过来!Apache DolphinScheduler版本升级指南

博主头像 Apache DolphinScheduler自2.0.1版本后增加了版本自动升级功能,官方文档提供了一键升级脚本: sh ./script/create-dolphinscheduler.sh 如果只是跨小版本的更新,那么只用执行脚本就好了,但跨多个大版本升级时依然容易出现一些问题,特此总结。 ( ...

AI 赋能指标管理分析,开启企业数智领航时代

博主头像 以下为本次分享的回顾: 在大数据时代,企业数字化转型的核心目标在于让数据发挥真正的价值。从数据报表到分析平台,再到日常取数,企业所依赖的不仅仅是数据本身,而是通过数据所呈现出对业务的分析、业务的查看以及业务未来趋势的洞察。再多数据只有同业务相结合转化为信息,经过处理呈现才能真正体现他们的价值,而这一 ...

读DAMA数据管理知识体系指南04数据治理(上)

博主头像 1. 数据治理 1.1. Data Governance, DG 1.1.1. 定义是在管理数据资产过程中行使权力和管控,包括计划、监控和实施 1.1.2. 数据治理职能是指导所有其他数据管理领域的活 1.1.3. 目的是确保根据数据管理制度和最佳实践正确地管理数据 1.1.4. 数据管理的整体驱动 ...

当任务失败时,顶级调度系统如何实现分钟级数据补偿?

博主头像 一、补数机制的定义与挑战 补数(Backfill) 指在数据管道因系统故障、数据延迟或逻辑错误导致历史任务缺失时,重新调度并执行指定时间范围内的工作流以修复数据缺口。在大数据场景中,补数机制需解决三大核心挑战: 复杂依赖链重建:需精准识别历史时间段内任务上下游关系,避免因时间窗口错位导致数据逻辑混乱 ...

<1···91011···18>