摘要:
全文搜索引擎架构 阅读全文
摘要:
Hadoop 分布式系统基础结构 海量数据存储,海量数据计算 Hadoop指的是Hadoop生态圈 Google=》Hadoop GFS->HDFS Map-Reduce->MR BigTable->HBase Hadoop发行版本 Apache:最基础 Cloudera:大型互联网企业 Horto 阅读全文
摘要:
平台组 框架平台搭建 Hadoop flume kafka hbase spark 集群性能监控 集群性能调优 数据仓库组 ETL工程师-数据清洗(实习生) Hive工程师-数据分析,数据仓库建模 数据挖掘组 算法工程师 推荐系统工程师 用户画像工程师 报表开发组 JavaEE工程师 阅读全文
摘要:
产品人员(提需求)==》数据部门(搭平台,分析数据指标)==》数据可视化(报表,邮件,大屏幕) 阅读全文
摘要:
++定义++ 常规软件无法在规定时间内处理完成的数据(需要用集群处理完成) ++特点++ Volume:大量 Velocity:高速 Variety:多样性 Value:低价值密度 bit Byte KB MB GB TB PB EB ZB YB BB NB DB 阅读全文