摘要: Hadoop 分布式文件管理系统HDFS可以部署在廉价硬件之上,能够高容错、 可靠地存储海量数据(可以达到TB甚至PB级),它还可以和Yam中的MapReduce 编程模型很好地结合,为应用程序提供高吞吐量的数据访问,适用于大数据集应用程序。 1.定位 HDFS的定位是提供高容错、高扩展、高可靠的分 阅读全文
posted @ 2019-11-19 18:40 StormTides 阅读(1522) 评论(0) 推荐(0) 编辑
摘要: 前言: 由于最近复习软件设计师考试,发现有很多考点忘记了, 所以写这个网页也算复习,重新学习软考关于网络的知识点。 因特网的组成 : 学习网络首先是因特网的组成,从因特网的工作方式上看,可以划分为以下的两大块: (1) 边缘部分 由所有连接在因特网上的主机组成。这部分是用户直接使用的,用来进行通信( 阅读全文
posted @ 2019-11-19 18:35 StormTides 阅读(545) 评论(0) 推荐(0) 编辑
摘要: 前言: 基于密度聚类的经典算法 DBSCAN(Density-Based Spatial Clustering of Application with Noise, 具有噪声的基于密度的空间聚类应用)是一种基于高密度连接区域的密度聚类算法。 DBSCAN的基本算法流程如下:从任意对象P 开始根据阈值 阅读全文
posted @ 2019-11-19 18:32 StormTides 阅读(10191) 评论(0) 推荐(0) 编辑
摘要: 前言: 关联规则是数据挖掘中最活跃的研究方法之一, 是指搜索业务系统中的所有细节或事务,找出所有能把一 组事件或数据项与另一组事件或数据项联系起来的规则,以获 得存在于数据库中的不为人知的或不能确定的信息,它侧重于确 定数据中不同领域之间的联系,也是在无指导学习系统中挖掘本地模式的最普通形式。 一般 阅读全文
posted @ 2019-11-19 16:36 StormTides 阅读(6789) 评论(0) 推荐(0) 编辑