会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
星月故里
愿你游历半生,归来仍是少年。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
下一页
2022年1月5日
nosql
摘要: 1、什么是数据库? 数据库是信息或数据的有组织的集合,通常由数据库管理系统 (DBMS) 来控制。在现实中,数据、DBMS 及关联应用一起被称为数据库系统,通常简称为数据库。 数据库(Database)是计算机系统中按照一定的数据模型来组织、存储和应用的数据集合。 2、什么是数据模型(Data Mo
阅读全文
posted @ 2022-01-05 20:24 星月故里yw
阅读(368)
评论(0)
推荐(0)
2022年1月1日
预处理复习笔记1
摘要: 数据的质量问题(衡量指标)主要包括哪些方面? 答:准确性、完整性、一致性、相关性、时效性和可信性可解释性 数据的准确性? 答:数据的准确性是指数据是正确的,数据存储在数据库中的值对应于真实世界的值。 造成数据不准确的原因有哪些? 答:比如数据的收集设备出现故障;人为输入的数据错误;数据在传输过程中出
阅读全文
posted @ 2022-01-01 21:15 星月故里yw
阅读(288)
评论(0)
推荐(0)
2021年10月27日
Spark DataFrame的操作
摘要: 实验操作步骤 1、读取csv文件,并创建dataframe sc = SparkContext() sqlContext = SQLContext(sc) reader = sqlContext.read df_emp = reader.schema("emp_id String, emp_name
阅读全文
posted @ 2021-10-27 16:29 星月故里yw
阅读(277)
评论(0)
推荐(0)
spark安装后测试遇到的错误
摘要: 1、Spark测试时出现错误 原因: 由于之前修改了主机名,导致修改后的主机名和hosts文件中的127.0.0.1映射不存在,因此在执行spark-shell和pyspark的时候,会出现错误, 经过不断的测试,找到了问题并成功解决。 解决方法: 使用hostname命令查看当前主机名,我这边是u
阅读全文
posted @ 2021-10-27 15:34 星月故里yw
阅读(223)
评论(0)
推荐(0)
使用Spark RDD完成词频统计
摘要: 1、实验要求 对给定的一个英文文本,使用Spark完成文本内容的读取并转换成RDD,然后使用RDD的算子统计每个单词出现的次数,将统计结果按从大到小的顺序打印到控制台上。 2、实验代码 import findspark findspark.init() from pyspark import Spa
阅读全文
posted @ 2021-10-27 15:29 星月故里yw
阅读(1934)
评论(0)
推荐(0)
2021年10月17日
HBase shell 基本操作
摘要: 一、实验目的 (1)了解HBase的基本概念和数据模型。 (2)掌握HBase Shell客户端操作和HBase的基本方法。 二、实验环境 虚拟机+ubuntu18.04.5 三、实验步骤 1、新建一个表格,表格名为liyiwen17,列族为stuinfo和grades(VERSIONS采用系统默认
阅读全文
posted @ 2021-10-17 21:17 星月故里yw
阅读(566)
评论(0)
推荐(1)
2021年10月13日
配置和管理FTP服务器
摘要: 一、实验目的 (1)FTP服务的基本概念与工作原理。 (2)安装FTP服务器。 (3)配置与管理FTP服务器。 二、实验环境 VMware虚拟机 + centos7 三、实验目的 公司内部有一台FTP服务器,其功能主要是维护公司的网站linuxprob.com, 内容包括上传文件、创建目录、更新网页
阅读全文
posted @ 2021-10-13 10:39 星月故里yw
阅读(764)
评论(0)
推荐(0)
配置和管理Apache服务器
摘要: 一、实验目的 (1)掌握Linux系统中Apache服务器的安装与配置。 (2)掌握个人主页、虚拟目录、基于用户和主机的访问控制及虚拟主机的实现方法。 二、实验环境 VMware虚拟机 + centos7 三、实验要求 配置和管理Apcche服务器 在IP地址为192.168.100.251的服务器
阅读全文
posted @ 2021-10-13 10:30 星月故里yw
阅读(1857)
评论(0)
推荐(0)
2021年10月12日
配置和管理DNS服务器
摘要: 实验要求 在IP地址为192.168.100.252的服务器上配置主域名服务器来负责对区域“linuxrobe. edu”的解释工作。同时负责对应的反向查找工作。 dns.linuxprobe. com——192.168.100.252。 www.linuxprobe.com——192.168.10
阅读全文
posted @ 2021-10-12 12:00 星月故里yw
阅读(1621)
评论(0)
推荐(0)
2021年10月11日
配置和管理DHCP服务器
摘要: 一、实验目的 (1)掌握DHCP服务的工作过程。 (2)熟悉配置和管理DHCP服务器。 二、实验方法 配置DHCP服务器,服务器IP为192.168.100.253,为公司内部子网内的客户机提供DHCP服务。具体参数如下: IP地址段:192.168.100.100~192.168.100.200。
阅读全文
posted @ 2021-10-11 18:50 星月故里yw
阅读(3040)
评论(0)
推荐(1)
上一页
1
2
3
4
5
下一页
公告