摘要:
转自 http://dblab.xmu.edu.cn/post/8274/ 0.案例概述 本案例利用Spark+Kafka实时分析男女生每秒购物人数,利用Spark Streaming实时处理用户购物日志,然后利用websocket将数据实时推送给浏览器,最后浏览器将接收到的数据实时展现,案例的整体 阅读全文
posted @ 2018-05-10 21:31
陈峰
阅读(7534)
评论(5)
推荐(0)
摘要:
简介 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据 阅读全文
posted @ 2018-05-10 21:30
陈峰
阅读(205)
评论(0)
推荐(0)
摘要:
主要摘自 http://dblab.xmu.edu.cn/blog/290 2/ 简介 本指南介绍Hadoop分布式文件系统HDFS,并详细指引读者对HDFS文件系统的操作实践。Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)是Hadoop核心组件 阅读全文
posted @ 2018-05-10 21:30
陈峰
阅读(4123)
评论(0)
推荐(1)
摘要:
简介 支持向量机SVM是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器。支持向量机学习方法包含3种模型:线性可分支持向量机、线性支持向量机及非线性支持向量机。当训练数据线性可分时,通过硬间隔最大化,学习一个线性的分类器,即线性可分支持向量机;当训练数据近似线性可分时,通过软间隔 阅读全文
posted @ 2018-05-10 21:30
陈峰
阅读(956)
评论(0)
推荐(0)
摘要:
主要摘自 http://dblab.xmu.edu.cn/post/8116/ 案例简介 Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数据教学对实验案例的迫切需求。本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种 阅读全文
posted @ 2018-05-10 21:30
陈峰
阅读(6934)
评论(1)
推荐(0)
摘要:
摘自 http://dblab.xmu.edu.cn/blog/1084 2/ 简介 DStream是Spark Streaming的编程模型,DStream的操作包括输入、转换和输出。 Spark Streaming工作原理 ,在Spark中,一个应用(Application)由一个任务控制节点( 阅读全文
posted @ 2018-05-10 21:29
陈峰
阅读(1086)
评论(0)
推荐(0)
摘要:
准确率(正确率, accuracy),精确度(precision), 召回率(recall) 都是计算正条件值 (Condition positive, 正样本). 查准率(Precision)查准率反映了被判定为正例中真正的正例样本的比重 查全率(Recall)查全率反映了被判定的正例占总的正例的 阅读全文
posted @ 2018-05-10 19:52
陈峰
阅读(10756)
评论(0)
推荐(0)
摘要:
https://www.cnblogs.com/ityouknow/p/6931958.html springcloud(九):配置中心和消息总线(配置中心终结版) 我们在springcloud(七):配置中心svn示例和refresh中讲到,如果需要客户端获取到最新的配置信息需要执行refresh 阅读全文
posted @ 2018-05-10 08:57
陈峰
阅读(214)
评论(0)
推荐(0)
浙公网安备 33010602011771号