2016年10月28日

【转】intelliJ IDEA集成checkStyle

摘要: 原文链接 http://www.cnblogs.com/kiwi-wang/p/4166410.html 本文中使用intelliJ IDEA版本为14.0.1,其他版本差异不大,可同样安装。 下载安装CheckStyle-IDEA插件 安装该插件有两种方式,在线安装和安装包安装 (1) 在线安装 阅读全文

posted @ 2016-10-28 14:34 develooop 阅读(2927) 评论(0) 推荐(0) 编辑

2016年1月17日

【转】hadoop深入研究:(十一)——序列化与Writable实现

摘要: 原文链接 http://blog.csdn.net/lastsweetop/article/details/9249411所有源码在github上,https://github.com/lastsweetop/styhadoop简介在hadoop中,Writable的实现类是个庞大的家族,我们在这里... 阅读全文

posted @ 2016-01-17 15:19 develooop 阅读(297) 评论(0) 推荐(0) 编辑

【转】Hadoop在MapReduce中使用压缩详解

摘要: 原文链接 http://www.cnblogs.com/ggjucheng/archive/2012/04/22/2465580.html#tophadoop对于压缩文件的支持hadoop对于压缩格式的是透明识别,我们的MapReduce任务的执行是透明的,hadoop能够自动为我们 将压缩的文件解... 阅读全文

posted @ 2016-01-17 00:53 develooop 阅读(196) 评论(0) 推荐(0) 编辑

2015年12月13日

【转】JDK工具jinfo用法详解

摘要: 原文链接 http://www.softown.cn/post/182.htmljinfo(Java Configuration Information),主要用于查看指定Java进程(或核心文件、远程调试服务器)的Java配置信息。用法摘要#指定进程号(pid)的进程 jinfo [ option... 阅读全文

posted @ 2015-12-13 05:05 develooop 阅读(947) 评论(0) 推荐(0) 编辑

【转】JVM统计监控工具-jstat

摘要: 原文链接 http://www.javaranger.com/archives/575jstat概要帮助jstat[generalOption|outputOptionsvmid[interval[s|ms][count]]]generalOption通用命令行选项(-help,-options,o... 阅读全文

posted @ 2015-12-13 04:38 develooop 阅读(441) 评论(0) 推荐(0) 编辑

【转】jps命令使用

摘要: 原文链接 http://blog.csdn.net/fwch1982/article/details/7947451jps(Java Virtual Machine Process Status Tool)是JDK 1.5提供的一个显示当前所有java进程pid的命令,简单实用,非常适合在linux... 阅读全文

posted @ 2015-12-13 04:24 develooop 阅读(263) 评论(0) 推荐(0) 编辑

2015年12月3日

基于MLlib的机器学习--协同过滤与推荐

摘要: 《Spark快速大数据分析》11.5.4协同过滤与推荐协同过滤是一种根据用户对各种产品的交互与评分来推荐新产品的推荐系统技术。协同过滤引入的地方就在于它只需要输入一系列用户/产品的交互记录;无论是显式的交互(例如在购物网站上进行评分)还是隐式的(例如用户访问了一个产品的页面但是没有对产品评分)交互皆... 阅读全文

posted @ 2015-12-03 22:54 develooop 阅读(448) 评论(0) 推荐(0) 编辑

基于MLlib的机器学习--聚类

摘要: 《Spark快速大数据分析》11.5.4 聚类聚类算法是一种无监督学习任务,用于将对象分到具有高度相似性的聚类中。监督式学习中的数据都是带标签的,而聚类可以用于无标签的数据。该算法主要用于数据探索(查看一个数据集是什么样子)以及异常检测(识别与任意聚类都相距较远的点)。KMeansMLlib包含聚类... 阅读全文

posted @ 2015-12-03 18:46 develooop 阅读(310) 评论(0) 推荐(0) 编辑

【转】Spark学习笔记

摘要: 原文链接 http://xialeizhou.com/2015/11/29/spark-study/#Spark学习笔记基本概念RDD - resillient distributed dataset 弹性分布式数据集 Operation - 作用于RDD的各种操作分为transformation和... 阅读全文

posted @ 2015-12-03 16:35 develooop 阅读(272) 评论(0) 推荐(0) 编辑

【转】TF-IDF与余弦相似性的应用(三):自动摘要

摘要: 原文链接 http://www.ruanyifeng.com/blog/2013/03/automatic_summarization.html有时候,很简单的数学方法,就可以完成很复杂的任务。这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的方法... 阅读全文

posted @ 2015-12-03 16:29 develooop 阅读(221) 评论(0) 推荐(0) 编辑

导航

AmazingCounters.com