数据仓库

ETL的定义:
    将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程

使分析和事务处理不冲突

(参考https://blog.csdn.net/Trigl/article/details/68944434


 

HDFS:Hadoop分布式文件系统


 

单位时间内服务器处理的请求数来描述其并发处理能力。称之为吞吐率(Throughput)

吞吐量,是指在一次性能测试过程中网络上传输的数据量的总和。

TPS (Transaction Per second)

每秒钟系统能够处理事务或交易的数量,它是衡量系统处理能力的重要指标。

(参考https://ruby-china.org/topics/26221

流式数据

https://blog.csdn.net/HeatDeath/article/details/78986025


map reduce

 

posted on 2019-04-15 23:04  ZoraZheng  阅读(117)  评论(0)    收藏  举报

导航