上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 24 下一页
摘要: 根据最新的统计显示,仅在过去的两年中,当今世界上90%的数据都是在新产生的,每天创建2.5万亿字节的数据,并且随着新设备,传感器和技术的出现,数据增长速度可能会进一步加快。 从技术上讲,这意味着我们的大数据处理将变得更加复杂且更具挑战性。而且,许多用例(例如,移动应用广告,欺诈检测,出租车预订,病人 阅读全文
posted @ 2020-06-10 08:08 独孤风 阅读(1662) 评论(0) 推荐(3) 编辑
摘要: ​ 本章我们开始正式搭建大数据环境,目标是构建一个稳定的可以运维监控的大数据环境。我们将采用Ambari搭建底层的Hadoop环境,使用原生的方式搭建Flink,Druid,Superset等实时计算环境。使用大数据构建工具与原生安装相结合的方式,共同完成大数据环境的安装。 Ambari搭建底层大数 阅读全文
posted @ 2020-06-01 10:09 独孤风 阅读(2578) 评论(4) 推荐(1) 编辑
摘要: 用户画像标签体系 ​ 用户画像的核心在于给用户“打标签”,每一个标签通常是人为规定的特征标识,用高度精炼的特征描述一类人,例如年龄、性别、兴趣偏好等,不同的标签通过结构化的数据体系整合,就可与组合出不同的用户画像。 ​ 梳理标签体系是实现用户画像过程中最基础、也是最核心的工作,后续的建模、数据仓库搭 阅读全文
posted @ 2020-05-28 11:04 独孤风 阅读(11367) 评论(0) 推荐(3) 编辑
摘要: ​ ​ 在《什么的是用户画像》一文中,我们已经知道用户画像对于企业的巨大意义,当然也有着非常大实时难度。那么在用户画像的系统架构中都有哪些难度和重点要考虑的问题呢? 挑战 大数据 随着互联网的崛起和智能手机的兴起,以及物联网带来的各种可穿戴设备,我们能获取的每一个用户的数据量是非常巨大的,而用户量本 阅读全文
posted @ 2020-05-25 09:23 独孤风 阅读(5730) 评论(2) 推荐(2) 编辑
摘要: 用户画像 简介 ​ 用户画像,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。 用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。 ​ 还 阅读全文
posted @ 2020-05-21 10:00 独孤风 阅读(7122) 评论(0) 推荐(1) 编辑
摘要: KafkaCenter是什么 KafkaCenter是一个针对Kafka的一站式,解决方案。用于Kafka集群的维护与管理,生产者和消费者的监控,以及Kafka部分生态组件的使用。 对于Kafka的平台化,一直缺少一个成熟的解决方案,之前比较流行的kafka监控方案,如kafka-manager提供 阅读全文
posted @ 2020-05-18 09:05 独孤风 阅读(2993) 评论(0) 推荐(2) 编辑
摘要: 本文介绍Druid查询数据的方式,首先我们保证数据已经成功载入。 Druid查询基于HTTP,Druid提供了查询视图,并对结果进行了格式化。 Druid提供了三种查询方式,SQL,原生JSON,CURL。 一、SQL查询 我们用wiki的数据为例 查询10条最多的页面编辑 SELECT page, 阅读全文
posted @ 2020-05-15 09:16 独孤风 阅读(1094) 评论(0) 推荐(0) 编辑
摘要: Netflix(Nasdaq NFLX),也就是网飞公司,成立于1997年,是一家在线影片[租赁]提供商,主要提供Netflix超大数量的[DVD]并免费递送,总部位于美国加利福尼亚州洛斯盖图。1999年开始订阅服务。2009年,该公司可提供多达10万部DVD电影,并有1千万的订户。2007年2月2 阅读全文
posted @ 2020-05-11 08:34 独孤风 阅读(928) 评论(0) 推荐(0) 编辑
摘要: 随着诸如Apache Flink,Apache Spark,Apache Storm之类的开源框架以及诸如Google Dataflow之类的云框架的增多,创建实时数据处理作业变得非常容易。这些API定义明确,并且诸如Map-Reduce之类的标准概念在所有框架中都遵循几乎相似的语义。 但是,直到今 阅读全文
posted @ 2020-05-08 09:46 独孤风 阅读(799) 评论(0) 推荐(0) 编辑
摘要: DataHub 首先,阿里云也有一款名为DataHub的产品,是一个流式处理平台,本文所述DataHub与其无关。 数据治理是大佬们最近谈的一个火热的话题。不管国家层面,还是企业层面现在对这个问题是越来越重视。数据治理要解决数据质量,数据管理,数据资产,数据安全等等。而数据治理的关键就在于元数据管理 阅读全文
posted @ 2020-05-07 09:23 独孤风 阅读(25697) 评论(1) 推荐(2) 编辑
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 24 下一页