随笔分类 -  大数据

摘要:SQL: 结构化查询语言SQL(STRUCTURED QUERY LANGUAGE),是一种组重要的关系数据库操作语音。用于存储数据、及查询、更新、删除和管理关系数据库系统。 1986年10月,美国国家标准协会对SQL进行规范后,以此作为关系式数据库管理系统的标准语言,1987年得到国际标准组织的支 阅读全文
posted @ 2019-10-14 15:58 小拙 阅读(300) 评论(0) 推荐(0)
摘要:Hadoop的生态架构 Hadoop 2.0已经从传统的Hadoop三驾马车HDFS、MapReduce(MR)和HBase社区发展为60多个相关组件组成的庞大生态,其中包含在各大发行版中的组件就有25个以上,包括数据存储、执行引擎、编程和数据访问框架等。 Hadoop 2.0将资源管理从MapRe 阅读全文
posted @ 2018-07-26 17:30 小拙 阅读(912) 评论(0) 推荐(0)
摘要:Hadoop的版本 Hadoop的版本很特殊,是由多条分支并行的发展着。 1.x:该版本是由0.20.x发行版系列的延续 2.x:该版本是由0.23.x发行版系列的延续 其实Hadoop也就两个版本1.x和2.x Hadoop1.x 指的是:1.x(0.20.x)、0.21、0.22 Hadoop2 阅读全文
posted @ 2018-07-25 22:06 小拙 阅读(194) 评论(0) 推荐(0)
摘要:什么是大数据 所谓大数据,是指数据量庞大、产生数度快、结构多样的价值密度低的数据。其中,数据量庞大是指数据规模超出1、2台高性能主机所能处理范围;结构多样性是指除了关系型数据库能够处理的结构化数据还包含半结构化数据(如各类传感设备必如地镑、卫星、GPS设备等产生的纯文本格式的数据,还有良心网站NAS 阅读全文
posted @ 2018-07-25 20:16 小拙 阅读(633) 评论(0) 推荐(0)
摘要:最近有很多人问我如何学习大数据?我也是思考了很多时日才动笔写下此文。一方面我自己还只是大数据学习中的一个小学生,贸然动笔怕贻笑大方;另一方面大数据本身领域博大精深,其涵盖领域之广技术种类之多确实很难用一篇文章囊括。怎奈“下雨天打孩子,闲着也是闲着”,况笔者一直坚持写技术类的博客,今天也请允许我写一点 阅读全文
posted @ 2018-04-26 14:17 小拙 阅读(200) 评论(0) 推荐(0)
摘要:来源地址:https://baike.baidu.com/item/NoSQL/8828247?fr=aladdin NoSQL,泛指非关系型的数据库。随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心 阅读全文
posted @ 2018-02-28 20:19 小拙 阅读(665) 评论(0) 推荐(0)