上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 24 下一页
摘要: 随着公司越来越多的利用数据为企业提供支撑,推动创新。了解数据的准确性,可靠性就非常重要。数十年来,对于数据治理的工作一直依靠数据目录来完成,但是这就足够了吗? 数据目录 大家对于数据目录非常的熟悉了,有点类似于图书馆的目录。数据目录作为元数据的清单,向用户提供数据的可访问性,状态和位置等等信息。在过 阅读全文
posted @ 2021-04-27 16:37 独孤风 阅读(197) 评论(0) 推荐(0)
摘要: cat /etc/redhat-release 阅读全文
posted @ 2021-04-23 09:18 独孤风 阅读(82) 评论(0) 推荐(0)
摘要: 遇到这个错误可以选择给django降级,不建议 这里选择升级SQLite #1、查看版本 sqlite3 --version #2.Centos7安装最新的sqlite3 wget https://www.sqlite.org/2019/sqlite-autoconf-3270200.tar.gz 阅读全文
posted @ 2021-04-20 15:11 独孤风 阅读(122) 评论(0) 推荐(0)
摘要: #1.安装相应的编译工具 在root用户下(不要用普通用户,麻烦),全部复制粘贴过去,一次性安装即可. yum -y groupinstall "Development tools" yum -y install zlib-devel bzip2-devel openssl-devel ncurse 阅读全文
posted @ 2021-04-20 14:07 独孤风 阅读(99) 评论(0) 推荐(0)
摘要: git clone 遇到问题:fatal: unable to access 'https://github.comxxxxxxxxxxx': Failed to connect to xxxxxxxxxxxxx 将命令行里的https改为git 改为 git clone git://github. 阅读全文
posted @ 2021-04-17 22:27 独孤风 阅读(835) 评论(0) 推荐(0)
摘要: 1、hadoop dfs 专门针对hdfs系统 2、hdfs dfs 和hadoop dfs,当使用hadoop dfs时会被转为hdfs dfs命令 3、hadoop fs 范围更广 阅读全文
posted @ 2021-04-14 16:44 独孤风 阅读(518) 评论(0) 推荐(0)
摘要: 在数据治理中,数据探索服务的价值在初期往往是被忽视的,但是随着业务的增加,分析人员的增加,数据探索服务的价值就会越来越大。 一个成功的数据管理平台,不仅仅要提供各种数据分析的工具,提供各种各样的数据源,更要提供数据探索的能力。 为什么数据探索服务很重要? 想象一下,作为一名数据科学家,他刚刚获得新的 阅读全文
posted @ 2021-04-09 16:00 独孤风 阅读(1559) 评论(2) 推荐(1)
摘要: REA Group是一家专门面向房地产与实业资产的跨国数字广告公司。 他们主要为消费者提供房地产购买、出售与租赁服务,同时发布各类房产新闻、装修技巧以及生活方式层面的内容。每一天,都有数百万消费者访问REA Group网站。 REA Group每天都需要进行大量的数据分析工作,去分析用户,财务等信息 阅读全文
posted @ 2021-03-29 17:03 独孤风 阅读(456) 评论(0) 推荐(0)
摘要: 目前,Amundsen并不支持表级别和列级别的数据血缘功能,也没有办法展示数据的来龙去脉。 作为Amundsen一项非常核心的功能,Lineage功能早已经提上日程,并进入设计与研发阶段。本位将展示此功能的一些基本设计。 概述 初步设计是通过表详情页,进入到相关页面,来展示表的来源与输出。 作为这项 阅读全文
posted @ 2021-03-26 10:48 独孤风 阅读(579) 评论(0) 推荐(1)
摘要: Amundsen的使命,整理有关数据的所有信息,并使其具有普遍适用性。 这是Amundsen官网的一句话,对于元数据的管理工作,复杂且繁琐。可用的工具很多各有千秋,数据血缘做的较好的应该是Apache Atlas,而数据可视化做的较好的应该是Apache Superset。业界一直需要一个可以整合这 阅读全文
posted @ 2021-03-25 13:36 独孤风 阅读(1172) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 24 下一页