陈峰 - 博客园

2018年5月21日

摘要： https://www.jianshu.com/p/c221bc39a576 上周一，来自武汉的直播平台的大数据架构，作为一个在 2 年多时间里崛起的公司，其流量经历了从 0 到 PB 级别的飞跃。刚好今年 3月，斗鱼的大数据团队负责人参加过简寻主办的首届武汉开发者峰会，分享了一些经验和坑，结合一阅读全文

posted @ 2018-05-21 13:10 陈峰阅读(2628) 评论(0) 推荐(0)

[转]携程大数据实践：高并发应用架构及推荐系统案例

摘要：本文来自携程技术中心基础业务研发部的《应用架构涅槃》系列分享。据基础业务研发部负责人李小林介绍，互联网二次革命的移动互联网时代，如何吸引用户、留住用户并深入挖掘用户价值，在激烈的竞争中脱颖而出，是各大电商的重要课题。通过各类大数据对用户进行研究，以数据驱动产品是解决这个课题的主要手段，携程的大数据团阅读全文

posted @ 2018-05-21 12:37 陈峰阅读(2293) 评论(0) 推荐(0)

2018年5月19日

算法-01-分治

摘要：分治思想 DevideConquer(P){ if(|P| 阅读全文

posted @ 2018-05-19 12:04 陈峰阅读(204) 评论(0) 推荐(0)

2018年5月16日

推荐系统-07-lambda架构

摘要： Lambda 架构 Lambda 架构由Storm的作者Nathan Marz提出，其设计目的在于提供一个能满足大数据系统关键特性的架构，包括高容错、低延迟、可扩展等。其整合离线计算与实时计算，融合不可变性、读写分离和复杂性隔离等原则，可集成Hadoop, Kafka, Spark，Storm等各类阅读全文

posted @ 2018-05-16 21:39 陈峰阅读(3249) 评论(0) 推荐(0)

推荐系统-05-Spark电影推荐、评估与部署

摘要：一、新建scala项目二、构造程序代码如下导入引用库三、打包部署程序运行时，需要指定输入数据路径,数据包含了ratings.dat和movies.dat，数据都包含在了一个数据包。[点击下载][1]，然后解压。配置运行参数点击edit configuration，在左侧点击该项目。在阅读全文

posted @ 2018-05-16 18:57 陈峰阅读(1825) 评论(0) 推荐(0)

推荐系统-04-评价技术

摘要：下面简单通过在测试集上验证错误值 (JAVA) 以下是通过信息检索，进行多维度的评价模型的优劣度(java) 阅读全文

posted @ 2018-05-16 18:48 陈峰阅读(256) 评论(0) 推荐(0)

推荐系统-03-简单基于用户的推荐

摘要：下面是一个基本的JVAVA程序， RecommenderIntro.java 下面是基于物品的多线程批推荐 ` package xyz.pl8.userrecommendermovielens; import org.apache.commons.io.Charsets; import org.ap 阅读全文

posted @ 2018-05-16 18:35 陈峰阅读(1039) 评论(0) 推荐(0)

推荐系统-02-推荐技术

摘要：前题要做推荐系统的前题，就是要信息出现过载，即如何从成千上万的物品中，选出最合适的物品供用户参考。如果可供选择的基数仅有几个，就不需要推荐系统了，直接把所有选项提供给用户就行了。推荐技术基于内容推荐基于内容相似度的进行推荐，顾名思义，把与你喜欢的内容和相似内容推荐给你。怎么来阅读全文

posted @ 2018-05-16 18:26 陈峰阅读(339) 评论(0) 推荐(0)

2018年5月14日

推荐系统-0X-电影推荐与结果评估

摘要： ``` scala import spark.sql import org.apache.spark.sql.types._ import org.apache.spark.mllib.recommendation.ALS import org.apache.spark.mllib.recommendation.MatrixFactorizationModel import org.apache.... 阅读全文

posted @ 2018-05-14 21:40 陈峰阅读(604) 评论(0) 推荐(0)

2018年5月11日

推荐系统-01-简单逻辑回归

摘要： ``` scala import org.apache.spark.ml.feature._ import org.apache.spark.ml.param.ParamMap import org.apache.spark.ml.classification.LogisticRegression import org.apache.spark.ml.{Pipeline,PipelineModel... 阅读全文

posted @ 2018-05-11 19:20 陈峰阅读(916) 评论(0) 推荐(0)

顶部BANNER

摘要： ``` html 菜鸟教程在线编辑器实例 - 基本的表格实例 - 基本的表格实例 - 基本的表格实例 - 基本的表格实例 - 基本的表格实例 - 基本的表格实例 - 基本的表格实例 - 基本的表格实例 - 基本的表格实例... 阅读全文

posted @ 2018-05-11 11:01 陈峰阅读(535) 评论(0) 推荐(0)

2018年5月10日

大数据-12-Spark+Kafka构建实时分析Dashboard

摘要：转自 http://dblab.xmu.edu.cn/post/8274/ 0.案例概述本案例利用Spark+Kafka实时分析男女生每秒购物人数，利用Spark Streaming实时处理用户购物日志，然后利用websocket将数据实时推送给浏览器，最后浏览器将接收到的数据实时展现，案例的整体阅读全文

posted @ 2018-05-10 21:31 陈峰阅读(7542) 评论(5) 推荐(0)

大数据-08-Sqoop入门

摘要：简介 Sqoop是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递，可以将一个关系型数据库（例如： MySQL ,Oracle ,Postgres等）中的数据导进到Hadoop的HDFS中，也可以将HDFS的数据导进到关系型数据阅读全文

posted @ 2018-05-10 21:30 陈峰阅读(207) 评论(0) 推荐(0)

大数据-09-Intellij idea 开发java程序操作HDFS

摘要：主要摘自 http://dblab.xmu.edu.cn/blog/290 2/ 简介本指南介绍Hadoop分布式文件系统HDFS，并详细指引读者对HDFS文件系统的操作实践。Hadoop分布式文件系统（Hadoop Distributed File System,HDFS）是Hadoop核心组件阅读全文

posted @ 2018-05-10 21:30 陈峰阅读(4128) 评论(0) 推荐(1)

大数据-10-Spark入门之支持向量机SVM分类器

摘要：简介支持向量机SVM是一种二分类模型。它的基本模型是定义在特征空间上的间隔最大的线性分类器。支持向量机学习方法包含3种模型：线性可分支持向量机、线性支持向量机及非线性支持向量机。当训练数据线性可分时，通过硬间隔最大化，学习一个线性的分类器，即线性可分支持向量机；当训练数据近似线性可分时，通过软间隔阅读全文

posted @ 2018-05-10 21:30 陈峰阅读(966) 评论(0) 推荐(0)

大数据-11-案例演习-淘宝双11数据分析与预测

摘要：主要摘自 http://dblab.xmu.edu.cn/post/8116/ 案例简介 Spark课程实验案例：淘宝双11数据分析与预测课程案例，由厦门大学数据库实验室团队开发，旨在满足全国高校大数据教学对实验案例的迫切需求。本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种阅读全文

posted @ 2018-05-10 21:30 陈峰阅读(6971) 评论(1) 推荐(0)

大数据-07-Spark之流数据

摘要：摘自 http://dblab.xmu.edu.cn/blog/1084 2/ 简介 DStream是Spark Streaming的编程模型，DStream的操作包括输入、转换和输出。 Spark Streaming工作原理，在Spark中，一个应用（Application）由一个任务控制节点（阅读全文

posted @ 2018-05-10 21:29 陈峰阅读(1089) 评论(0) 推荐(0)

准确度，精确度，召回率

摘要：准确率(正确率, accuracy)，精确度(precision)，召回率(recall) 都是计算正条件值 (Condition positive，正样本). 查准率（Precision）查准率反映了被判定为正例中真正的正例样本的比重查全率（Recall）查全率反映了被判定的正例占总的正例的阅读全文

posted @ 2018-05-10 19:52 陈峰阅读(10762) 评论(0) 推荐(0)

[转]springcloud(九)：配置中心和消息总线（配置中心终结版）

摘要： https://www.cnblogs.com/ityouknow/p/6931958.html springcloud(九)：配置中心和消息总线（配置中心终结版）我们在springcloud(七)：配置中心svn示例和refresh中讲到，如果需要客户端获取到最新的配置信息需要执行refresh 阅读全文

posted @ 2018-05-10 08:57 陈峰阅读(219) 评论(0) 推荐(0)

2018年5月9日

[转]RabbitMQ系列(一)：Windows下RabbitMQ安装及入门

摘要： https://blog.csdn.net/hzw19920329/article/details/53156015 1.Windows下安装RabbitMQ需要以下几个步骤 (1)：下载erlang，原因在于RabbitMQ服务端代码是使用并发式语言erlang编写的，下载地址：http://ww 阅读全文

posted @ 2018-05-09 22:17 陈峰阅读(176) 评论(0) 推荐(0)