• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
韩亚飞_yue31313_韩梦飞沙
未来的某一天你会觉得现在所做的,大部分很烂,小部分很好
博客园    首页    新随笔    联系   管理    订阅  订阅

大数据 入门

最小的基本单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

 Bit(比特) =Binary Digit
8Bits = 1 Byte(字节)
1,000 Bytes = 1 Kilobyte
1,000Kilobytes = 1 Megabyte
1,000 Megabytes = 1 Gigabyte
1,000 Gigabytes = 1Terabyte
1,000 Terabytes = 1 Petabyte
1,000 Petabytes = 1 Exabyte
1,000Exabytes = 1 Zettabyte
1,000 Zettabytes = 1 Yottabyte
1,000 Yottabytes = 1Brontobyte
1,000 Brontobytes = 1 Geopbyte
======
大数据这个入门。
快速入门
看了一些资料,书籍,还是懵逼。
就是知道了一些大数据名词,但还是不清楚到底是怎么回事。
是什么,怎么用。云里雾里的,很容易浮躁,看不下去,难以入门。
一种难以沟通的感觉。
实践,需要Linux系统。自己没有。 需要有。 
如果你想要走这条道路,那么就别撤退,不看了不学了不搞了。 
既然想要搞,就想办法搞,遇到困难不必浮躁,冷静下来去解决。
========
 

High Scalability 高可扩展性
NoSQL是Not Only SQL的缩写
Sharding(分片)
分片是指将数据拆分,将其分散在不同机器上的过程。
分片就是数据拆分。 名字起得不好,都不知道啥意思。

什么是分布式?
分布式 什么意思
一个业务分拆多个子业务,部署在不同的服务器上。
集群:同一个业务,部署在多个服务器上
分布式 就是 拆分业务
集群 就是 多个机器共同分担一个业务。

HDFS—Hadoop Distributed File System
Hadoop分布式文件系统
Reduce 减少,分解。
MapReduce实现了Map和Reduce两个功能
Map把一个函数方法应用于集合中的所有成员,然后返回一个基于这个处理的结果集;
Reduce对结果集进行分类和归纳;
Map()和 Reduce() 两个函数可能会并行运行,

=======

 
韩梦飞沙 韩亚飞 313134555@qq.com yue31313 han_meng_fei_sha
posted @ 2017-11-15 18:08  韩梦飞沙_韩亚飞  阅读(176)  评论(0)    收藏  举报
刷新页面返回顶部
博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3