2023年4月11日
摘要: mysql-common是一个MySQL数据库共享的文件,其中包含了MySQL客户端和服务器共用的配置文件、默认选项文件和语言文件等。在安装MySQL客户端或服务端时,都需要安装mysql-common这个包。 mysql-libs是一个MySQL的客户端程序库,提供了MySQL客户端程序所需要的共 阅读全文
posted @ 2023-04-11 19:11 黑逍逍 阅读(572) 评论(0) 推荐(0)
摘要: 问题 mysql为什么有服务端和客户端 服务器 注意:mysql版本不要高了,el7就行了 在服务器下执行cd /usr/local,进入到local文件中。执行mkdir mysql 创建文件夹。 mysql-8.0.22-1.el7.x86_64.rpm-bundle.tar文件拷贝到b服务器的 阅读全文
posted @ 2023-04-11 19:10 黑逍逍 阅读(45) 评论(0) 推荐(0)
摘要: 定义: Kafka是一种高吞吐量的分布式发布订阅消息系统,一款开源的分布式流处理平台,可以处理高吞吐量的实时数据流。 它主要用于构建实时流数据管道和可靠的数据流处理应用程序,能够处理海量的流数据,支持水平扩展和高可用性部署。 Kafka的核心抽象是“topic”、“partition”、“offse 阅读全文
posted @ 2023-04-11 01:19 黑逍逍 阅读(40) 评论(0) 推荐(0)
摘要: Flink是一种基于流数据流式处理引擎。与批处理不同,它的主要思想是数据流的概念,它可以被视为一系列连续的事件或记录,它们按照发生的时间顺序进行处理,而不是被分成离散的块进行处理。Flink可以接收无限数据流并实时处理它们,它的流式处理支持无限的数据流输入和输出,并且可以动态地对数据流进行处理和修改 阅读全文
posted @ 2023-04-11 01:08 黑逍逍 阅读(79) 评论(0) 推荐(0)
摘要: Hive是一种基于Hadoop的数据仓库工具,它可以将结构化数据映射为一张数据库表,提供了类似于SQL的查询语言,使得数据分析师和开发人员可以使用SQL语句对分布式存储的数据进行查询和分析。 Hive可以将Hadoop分布式文件系统(HDFS)中的数据转换为SQL查询,从而使得分布式数据分析变得更加 阅读全文
posted @ 2023-04-11 01:01 黑逍逍 阅读(150) 评论(0) 推荐(0)
摘要: Hadoop分布式文件系统(HDFS)是Apache Hadoop生态系统的核心组件之一,它是一种设计用于存储和处理超大规模数据集的分布式文件系统。 HDFS是一个分布式文件系统,它将大文件切分成多个小文件存储在不同的计算机节点上,因此可以存储大规模的非结构化数据,例如文本、图像、音频和视频等。 H 阅读全文
posted @ 2023-04-11 00:56 黑逍逍 阅读(303) 评论(0) 推荐(0)