上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 23 下一页
摘要: 数据搬运组件:基于Sqoop管理数据导入和导出 Sqoop是一款开源的大数据组件,主要用来在Hadoop(Hive、HBase等)与传统的数据库(mysql、postgresql、oracle等)间进行数据的传递。 阅读全文
posted @ 2021-03-15 08:38 知了一笑 阅读(445) 评论(0) 推荐(0) 编辑
摘要: Java基础篇(05):函数式编程概念和应用 函数式编程的核心要素:传入参数,执行逻辑,返回值,也可以没有返回值。函数式的编程风格侧重描述程序的执行逻辑,不是执行过程。 阅读全文
posted @ 2021-03-08 08:17 知了一笑 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 数据采集组件:Flume基础用法和Kafka集成 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。 阅读全文
posted @ 2021-03-05 09:00 知了一笑 阅读(505) 评论(0) 推荐(0) 编辑
摘要: 架构设计:数据服务系统0到1落地实现方案 基于业务场景做好服务的划分和设计,以及公共服务的基础构建,确保业务层的架构合理且可扩展,是否合理的基本考量就是,不断的新增业务场景是否需要做系统的大刀阔斧的改版,如果服务能力不断丰富,系统的改造成本很小,自然架构合理。 阅读全文
posted @ 2021-02-24 07:57 知了一笑 阅读(823) 评论(0) 推荐(3) 编辑
摘要: Java基础篇(04):日期与时间API用法详解 在系统开发中,日期与时间作为重要的业务因素,起到十分关键的作用,例如同一个时间节点下的数据生成,基于时间范围的各种数据统计和分析,集群节点统一时间避免超时等。 阅读全文
posted @ 2021-02-18 21:42 知了一笑 阅读(579) 评论(0) 推荐(0) 编辑
摘要: 职场 | 跳槽之后,如何平稳走过试用期 完成跳槽之后,进入新公司并不说明就算真正进入该公司,试用期的三个月考核这才是正式开始。 阅读全文
posted @ 2021-02-06 08:14 知了一笑 阅读(928) 评论(0) 推荐(4) 编辑
摘要: 职场 | 3天准备5天面试,跳槽完成 离职后的第一周,主要是休息和面试的准备时间,然后就是浏览自己想要跳槽的公司,准备好简历,在周四周五两天给想去的公司投简历或者发邮件。 阅读全文
posted @ 2021-02-01 08:11 知了一笑 阅读(930) 评论(0) 推荐(2) 编辑
摘要: RestHighLevelClient的API作为ElasticSearch备受推荐的客户端组件,其封装系统操作ES的方法,包括索引结构管理,数据增删改查管理,常用查询方法,并且可以结合原生ES查询原生语法,功能十分强大。在使用RestHighLevelClient的语法时,通常涉及上面几个方面,在掌握基础用法之上可以根据业务特点进行一些自定义封装,这样可以更优雅的解决业务需求。 阅读全文
posted @ 2021-01-25 08:09 知了一笑 阅读(2844) 评论(0) 推荐(1) 编辑
摘要: 数字营销产业链上最核心的角色就是就是受众人群,即浏览广告的用户,之所以称为受众人群,通常会把用户按照画像特点基于标签进行人群分类,根据广告的需求,可能是根据不同年龄段,地域,消费能力等各种标签。 阅读全文
posted @ 2021-01-18 22:29 知了一笑 阅读(754) 评论(0) 推荐(0) 编辑
摘要: 用户画像,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,用户画像在各领域得到了广泛的应用。 阅读全文
posted @ 2021-01-14 23:22 知了一笑 阅读(1957) 评论(0) 推荐(0) 编辑
摘要: HBase是一种分布式、可扩展、支持海量结构化数据存储的NoSQL数据库。HBase在Hadoop之上提供了类似于Bigtable的能力,基于列存储模式的而不是基于行的模式。 阅读全文
posted @ 2021-01-11 08:01 知了一笑 阅读(557) 评论(0) 推荐(0) 编辑
摘要: 通过在标签的使用过程分析和评估,不断优化标签的质量,形成完整的管理周期,这样才能发挥更高的业务价值。 阅读全文
posted @ 2021-01-05 22:52 知了一笑 阅读(330) 评论(0) 推荐(0) 编辑
摘要: Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,是一个可以对Hadoop中的大规模存储的数据进行查询和分析存储的组件。 阅读全文
posted @ 2021-01-04 08:00 知了一笑 阅读(851) 评论(0) 推荐(0) 编辑
摘要: 标签最初用来对实物进行分类和标记,例如标明物品的品名、重量、体积、用途等简要信息。后来逐渐流行到数据行业,用来标记数据,对数据快速分类获取和分析。 阅读全文
posted @ 2020-12-30 23:50 知了一笑 阅读(2696) 评论(0) 推荐(1) 编辑
摘要: 智能数字时代,数据不论形态、格式和类型,已经迅速成为企业最有战略意义的资产;数据资产已经成为了可以形成业务洞察及优势的战略资源,数据的体量、多样性和复杂性也正以指数级增长。 阅读全文
posted @ 2020-12-26 22:05 知了一笑 阅读(305) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 23 下一页