摘要: 转自:http://langyu.iteye.com/blog/992916个人感觉这篇讲shuffle过程对于初学者来说,确实很详尽,不得不推荐一番。你可以点击下载该篇文章的PDFShuffle分为分区(Partition)、排序(Sort)、分组(Gro... 阅读全文
posted @ 2018-12-01 15:24 不知道的痛 阅读(353) 评论(0) 推荐(0) 编辑
摘要: title: Spark本地安装及Linux下伪分布式搭建 date: 2018-12-01 12:34:35 tags: Spark categories: 大数据 toc: true 个人github博客:Josonlee’s Blog 文章目录 前期准备 本地安装 基于hadoop伪分布式搭建 阅读全文
posted @ 2018-12-01 14:21 不知道的痛 阅读(1258) 评论(0) 推荐(0) 编辑
摘要: 今天第一次使用maven来搭建MapReduce项目,在eclipse中配置后,创建maven项目但是没有加载出来Maven Dependency这个Liabrary,导致maven没有把相关的jar包下载到本地。然后,我搜索了一下,发现这个问题有不少人遇到... 阅读全文
posted @ 2018-11-25 19:32 不知道的痛 阅读(737) 评论(0) 推荐(0) 编辑
摘要: title: Hadoop及Spark学习路线及资源收纳date: 2018-11-18 16:19:54tags: Hadoopcategories: 大数据toc: true点击查看我的博客:Josonlee’s Blog版权声明:本文为博主原创文章,未... 阅读全文
posted @ 2018-11-18 17:17 不知道的痛 阅读(392) 评论(0) 推荐(0) 编辑
摘要: title: 大数据之Hadoop学习————认识HDFSdate: 2018-11-12 20:31:36tags: Hadoopcategories: 大数据toc: true点击查看我的博客:Josonlee’s Blog文章目录分布式文件系统 HDF... 阅读全文
posted @ 2018-11-18 17:14 不知道的痛 阅读(280) 评论(0) 推荐(0) 编辑
摘要: title: Hadoop伪分布式集群搭建date: 2018-11-14 15:17:20tags: Hadoopcategories: 大数据点击查看我的博客: Josonlee’s Blog文章目录前言准备伪分布式特点JDK 下载和环境配置配置虚拟机网... 阅读全文
posted @ 2018-11-18 14:59 不知道的痛 阅读(640) 评论(0) 推荐(0) 编辑
摘要: title: 关系数据库设计(F+闭包、候选码求解、范式判断及BCNF分解)date: 2018-11-12 21:46:32tags: SQLcategories: 数据库、SQL这是基于github的个人博客:Josonlee’s Blog文章目录F+闭... 阅读全文
posted @ 2018-11-13 17:12 不知道的痛 阅读(2356) 评论(2) 推荐(1) 编辑
摘要: title: ‘SQL中NOT EXISTS…[EXCEPT]的妙用’date: 2018-11-13 16:15:30tags: SQLcategories: 数据库、SQLtoc: true这是基于github的个人博客:Josonlee’s BlogE... 阅读全文
posted @ 2018-11-13 17:00 不知道的痛 阅读(2406) 评论(0) 推荐(0) 编辑
摘要: 文章目录机器学习模型评估分类模型回归模型聚类模型交叉验证中指定scoring参数网格搜索中应用机器学习模型评估以下方法,sklearn中都在sklearn.metrics类下,务必记住哪些指标适合分类,那些适合回归,不能混着用分类的模型大多是Classifi... 阅读全文
posted @ 2018-11-01 17:07 不知道的痛 阅读(9806) 评论(0) 推荐(0) 编辑
摘要: 文章目录1.介绍2. scoring参数2.1 预定义的值2.2 从metric函数定义你的scoring策略2.3 实现你自己的scoring对象3. 分类metrics3.1 二分类/多分类/多标签3.2 accuracy_score3.3 Cohen’... 阅读全文
posted @ 2018-10-25 19:15 不知道的痛 阅读(923) 评论(0) 推荐(0) 编辑