12 2018 档案

摘要:一、什么是 Apache Hive? Apache Hive 是一个基于 Hadoop Haused 构建的开源数据仓库系统,我们使用它来查询和分析存储在 Hadoop 文件中的大型数据集。此外,通过使用 Hive,我们可以在 Hadoop 中处理结构化和半结构化数据。 换句话说,Hive 是一个数 阅读全文
posted @ 2018-12-30 11:31 隐峯 阅读(538) 评论(0) 推荐(0)
摘要:SQL语言相信大家都不陌生,从本质上来说,它是一种结构化查询语言,是用来数据库之间的通信的编程语言。 作为一名Java程序员,我们从Java角度来看,SQL语言相当于Java接口,而数据库是实现这个接口的实现类,SQL语句则是实现类的方法!!。 从这里我们就可以理解了,每个数据库都有着自己独特的规则 阅读全文
posted @ 2018-12-26 09:12 隐峯 阅读(1580) 评论(4) 推荐(5)
摘要:什么是元数据?在前面的什么是元数据文章中,我们也提到过,元数据是数据的数据,可以帮助数据平台解决“有哪些数据”、“数据存储有多少”、“数据流中的血缘关系”、“如何找到我需要的数据”、“如何使用数据”和“数据的生产进度”问题。 元数据管理是做什么? 元数据在数据平台对原信息的收集、汇总和传递将数据平台 阅读全文
posted @ 2018-12-07 21:20 隐峯 阅读(2327) 评论(0) 推荐(1)
摘要:什么是元数据? 要理解这个问题,首先要知道“元”是什么。 元数据意味着“有关数据的数据”。虽然“meta”前缀(来自希腊语介词和前缀 μετά-)意味着“之后”或“超越”,但它用于在认识论中表示“约”。元数据可以为数据说明其元素或属性(名称、大小、数据类型等),或其结构(长度、字段、数据列),或其相 阅读全文
posted @ 2018-12-05 09:24 隐峯 阅读(1169) 评论(1) 推荐(1)