文章分类 - 大数据-架构
一站式元数据治理平台——Datahub入门宝典
摘要:Datahub新版本0.9.1更新,列级别数据血缘功能发布!
阅读全文
终于有人把标签与指标体系讲明白了(转载)
摘要:导读:本次分享题目为数据标签与指标在金融行业的应用,文章会围绕下面四部分展开: 何为指标,何为标签,两者有何区别? 如何建立指标体系? 如何建立标签体系? 如何用好标签与指标? 分享嘉宾|张鲲 金融壹帐通 加马开放平台 产品总监 编辑整理|杨佳慧 出品社区|DataFun 01 何为指标,何为标签,
阅读全文
5张图,搭建数据指标体系(转载)
摘要:转载自https://baijiahao.baidu.com/s?id=1741499346238966170&wfr=spider&for=pc 讲数据指标体系的文章很多,但一堆指标之间的关系到底应该怎么看?本文详细分析了指标分析的常见问题、解题思路、如何认识问题等等,感兴趣的小伙伴快来看看吧!
阅读全文
数据血缘关系(转载)
摘要:转载自 https://blog.csdn.net/YcoeXu/article/details/114242239 数据治理(一)血缘关系一、概念数据血缘也称为数据血统或谱系,是来描述数据的来源和派生关系。数据来源是数据科学的关键,也是被公认为数据信任的核心的部分。说白了就是这个数据是怎么来的,经
阅读全文
知识图谱应用 NLP + neo4j
摘要:一、应用领域 1、在医疗领域:挂号、并请咨询等 1)挂号推荐科室 2) AI病情咨询:根据病症、开药 2、大数据领域: 数据血缘 1 )表应用在哪些程序中 2) 数据来自哪些表 3 )模块开放给哪些部门 3、民航咨询系统 1)zippo能不能带上飞机 NLP 解析实体:zippo、飞机 解析动作:带
阅读全文
Airflow DAG之间依赖
摘要:DAG之间的依赖关系可以通过编写ExternalTaskSensor()去指定依赖哪个dag的id和task。 1、execution_date_fn vim test.py # coding: utf-8from airflow import DAGfrom airflow_clickhouse_
阅读全文
关于Airflow跨DAG依赖总结(转载)
摘要:关于Airflow跨DAG依赖总结单个DAG中Task之间的依赖这是最常见的Task之间的依赖,在DAG中有多种方式指定依赖关系 # 定义DAG dag = DAG(...)# 定义task_atask_a = BashOperator(...) # 定义task_btask_b = BashOpe
阅读全文
基于Clickhouse秒级查询6亿用户画像!到底有多6? (转载)
摘要:作者介绍 杨兆辉,苏宁科技集团大数据中心高级架构师,ClickHouse Contributor。在OLAP领域、大规模分布式计算领域有着深厚的技术积累,目前负责数据中台、标签平台相关的架构工作。 背景 想做营销活动,如何找到目标人群及用户特征?人群的筛选通常离不开用户画像。用户画像就是根据用户特征
阅读全文
数据治理:主数据-主数据是怎么做“主”的呢?
摘要:没有被管理的数据很难实现价值转换,很难被称之为数据资产。 在业务数据化、数据资产化再到数据价值指导业务发展的路上,合理的数据分类,再有针对的进行管理、运营是必不可少的。 常见的分类维度,可以把数据资产分为:数据和描述数据的数据,也就是元数据,再高阶的分类还可以分为描述元数据的数据,也就是元元数据。
阅读全文
浙公网安备 33010602011771号