摘要:
大数据核心3个概念: 能伸缩到一千台以上的分布式数据处理集群技术 这上千个节点是使用廉价PC搭建 将数据中心当做一台计算机 大数据的起源:“三架马车” 这三篇论文还依赖了两个基础设施:Chubby锁服务,Thrift序列化 MapReduce 演进路线: 编程方式:最初的MapReduce需要工程师 阅读全文
posted @ 2023-04-03 17:14
某某人8265
阅读(188)
评论(0)
推荐(0)
摘要:
Thrift 格式解析 https://www.cnblogs.com/Forever-Kenlen-Ja/p/9649724.html 常用数据格式包括 CSV JSON XML,这些格式有缺点: CSV没有指定数据类型,如可能将数字开头的字符串无认为数字 使用文本存储会浪费空间 JSON XML 阅读全文
posted @ 2023-04-03 09:44
某某人8265
阅读(297)
评论(0)
推荐(1)

浙公网安备 33010602011771号