2018 年 5月 10 日随笔档案 - 陈峰

公告

2018年5月10日

摘要：转自 http://dblab.xmu.edu.cn/post/8274/ 0.案例概述本案例利用Spark+Kafka实时分析男女生每秒购物人数，利用Spark Streaming实时处理用户购物日志，然后利用websocket将数据实时推送给浏览器，最后浏览器将接收到的数据实时展现，案例的整体阅读全文

posted @ 2018-05-10 21:31 陈峰阅读(7543) 评论(5) 推荐(0)

大数据-08-Sqoop入门

摘要：简介 Sqoop是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据阅读全文

posted @ 2018-05-10 21:30 陈峰阅读(207) 评论(0) 推荐(0)

大数据-09-Intellij idea 开发java程序操作HDFS

摘要：主要摘自 http://dblab.xmu.edu.cn/blog/290 2/ 简介本指南介绍Hadoop分布式文件系统HDFS，并详细指引读者对HDFS文件系统的操作实践。Hadoop分布式文件系统（Hadoop Distributed File System,HDFS）是Hadoop核心组件阅读全文

posted @ 2018-05-10 21:30 陈峰阅读(4129) 评论(0) 推荐(1)

大数据-10-Spark入门之支持向量机SVM分类器

摘要：简介支持向量机SVM是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器。支持向量机学习方法包含3种模型：线性可分支持向量机、线性支持向量机及非线性支持向量机。当训练数据线性可分时，通过硬间隔最大化，学习一个线性的分类器，即线性可分支持向量机；当训练数据近似线性可分时，通过软间隔阅读全文

posted @ 2018-05-10 21:30 陈峰阅读(966) 评论(0) 推荐(0)

大数据-11-案例演习-淘宝双11数据分析与预测

摘要：主要摘自 http://dblab.xmu.edu.cn/post/8116/ 案例简介 Spark课程实验案例：淘宝双11数据分析与预测课程案例，由厦门大学数据库实验室团队开发，旨在满足全国高校大数据教学对实验案例的迫切需求。本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种阅读全文

posted @ 2018-05-10 21:30 陈峰阅读(6971) 评论(1) 推荐(0)

大数据-07-Spark之流数据

摘要：摘自 http://dblab.xmu.edu.cn/blog/1084 2/ 简介 DStream是Spark Streaming的编程模型，DStream的操作包括输入、转换和输出。 Spark Streaming工作原理，在Spark中，一个应用（Application）由一个任务控制节点（阅读全文

posted @ 2018-05-10 21:29 陈峰阅读(1089) 评论(0) 推荐(0)

准确度，精确度，召回率

摘要：准确率(正确率, accuracy)，精确度(precision)，召回率(recall) 都是计算正条件值 (Condition positive，正样本). 查准率（Precision）查准率反映了被判定为正例中真正的正例样本的比重查全率（Recall）查全率反映了被判定的正例占总的正例的阅读全文

posted @ 2018-05-10 19:52 陈峰阅读(10762) 评论(0) 推荐(0)

[转]springcloud(九)：配置中心和消息总线（配置中心终结版）

摘要： https://www.cnblogs.com/ityouknow/p/6931958.html springcloud(九)：配置中心和消息总线（配置中心终结版）我们在springcloud(七)：配置中心svn示例和refresh中讲到，如果需要客户端获取到最新的配置信息需要执行refresh 阅读全文

posted @ 2018-05-10 08:57 陈峰阅读(219) 评论(0) 推荐(0)