02 2019 档案

摘要:Sensor Data Analytics Application [TOC] 本案例参考自https://github.com/pranav shukla/learningelasticstack/tree/master/chapter 10 ELK版本为5.6.12 数据构成 下面是sql的三个 阅读全文
posted @ 2019-02-27 16:58 justcodeit 阅读(749) 评论(0) 推荐(0)
摘要:ELK Stack [TOC] 本文基于ELK 6.0,主要针对Elasticsearch和Kibana。 介绍 Elasticsearch is a realtime, distributed search and analytics engine that is horizontally sca 阅读全文
posted @ 2019-02-26 20:04 justcodeit 阅读(673) 评论(0) 推荐(0)
摘要:HBase [TOC] 本文实际上是《HBase不睡觉书》的重点归纳。该书不涉及:集群备份、ACL权限控制、REST客户端等。而对于一些不算常用的技术,书中也提示可略过(“集群搭建”除外),本文便以“略”表示。 基础 NoSQL 关系型数据库在大数据情况下受到并发和关联等复杂查询的影响而导致性能下降 阅读全文
posted @ 2019-02-20 12:32 justcodeit 阅读(916) 评论(0) 推荐(0)
摘要:推荐算法相关 [TOC] 推荐系统介绍 What:分类目录、搜索引擎、推荐系统 Why:需要在信息过载、用户需求不明确的背景下,留住用户和内容生产者,实现商业目标 评估指标 准确性 学界:RMSE、MAE、Recall、Precision 业界 头条:阅读 阅读时长 分享/评论 关注/付费 快手:播 阅读全文
posted @ 2019-02-12 17:57 justcodeit 阅读(4694) 评论(0) 推荐(1)
摘要:基于Spark的GBDT + LR模型实现 [TOC] 测试数据来源http://archive.ics.uci.edu/ml/machine learning databases/adult/ 该模型利用Spark mllib的GradientBoostedTrees作为GBDT部分,因为ml模块 阅读全文
posted @ 2019-02-12 17:43 justcodeit 阅读(7698) 评论(0) 推荐(0)