会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
kongmeng
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
5
6
7
8
9
10
11
12
13
···
17
下一页
2015年5月27日
Hadoop之HDFS文件操作常有两种方式(转载)
摘要: 摘要:Hadoop之HDFS文件操作常有两种方式,命令行方式和JavaAPI方式。本文介绍如何利用这两种方式对HDFS文件进行操作。关键词:HDFS文件 命令行 Java APIHDFS是一种分布式文件系统,为MapReduce这种框架下的海量数据分布式处理而设计。Hadoop之HDFS文件操...
阅读全文
posted @ 2015-05-27 15:52 kongmeng
阅读(1164)
评论(0)
推荐(0)
2015年5月25日
Hadoop伪分布式搭建(一)
摘要: 下面内容主要说明在Windows虚拟机上面,怎么搭建一个Hadoop伪分布式,并如何运行wordcount程序和网页查看HDFS文件系统。 1 相关软件下载和安装 APACH官网提供hadoop版本是32bit的。如果要在64bit Linux环境运行,需要重新编译hadoop,网盘提供的是64bi
阅读全文
posted @ 2015-05-25 11:51 kongmeng
阅读(324)
评论(0)
推荐(0)
2015年5月12日
java项目命名规范
摘要: 一、命名规范1、项目名全部小写2、包名全部小写3、类名首字母大写,如果类名由多个单词组成,每个单词的首字母都要大写。如:public class MyFirstClass{}4、变量名、方法名首字母小写,如果名称由多个单词组成,每个单词的首字母都要大写。如:int index=0;public vo...
阅读全文
posted @ 2015-05-12 08:42 kongmeng
阅读(215)
评论(0)
推荐(0)
2015年5月3日
朴素贝叶斯和逻辑回归分类
摘要: 朴素贝叶斯 查看例子: 用p1(x, y)表示(x, y)属于类别1的概率,P2(x, y)表示(x, y)属于类别2的概率; 如果p(c1|x, y) > P(c2|x, y), 那么类别为1 如果p(c1|x, y) < P2(c2|x, y), 那么类别为2 根据贝叶斯公式: p(c|x, y
阅读全文
posted @ 2015-05-03 11:40 kongmeng
阅读(1781)
评论(0)
推荐(0)
2015年4月20日
机器学习中的相似性度量(转载)
摘要: 在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼...
阅读全文
posted @ 2015-04-20 15:22 kongmeng
阅读(202)
评论(0)
推荐(0)
2015年4月17日
data and dream
摘要: 1 用通俗的语言介绍下线性回归->逻辑回归->SVM之间的区别和联系。2 聚类算法的应用场景,以及k-means中的k值怎么确定。 1 def center(data): 2 3 center = [] 4 for num in data: 5 sumX =...
阅读全文
posted @ 2015-04-17 21:00 kongmeng
阅读(179)
评论(0)
推荐(0)
脑筋急转弯
摘要: 1一个袋子里装有1000枚硬币,其中有一枚是两面都是正面。现从中取出一枚,连续抛掷10次都是正面。问:取出的硬币是两面都是正面的概率有多大?2某个小城镇有10万对夫妇,假设每对夫妇可以随意生孩子直到生出一个男孩为止,并且一对夫妇一年只能生一次。问1)10年后的男女比例;2)n年后,平均每个家庭有多少...
阅读全文
posted @ 2015-04-17 20:39 kongmeng
阅读(338)
评论(0)
推荐(0)
2015年4月3日
SQl语句学习笔记(二)
摘要: merge into when matched then... when not mached then... MySQl for Tmall *取得重复的最大值,控制内循环的数量,推荐*/ SQL去除重复 Oracle中替代变量(动态参数)的使用 1. &变量名/&&变量名 &变量名, 执行sql
阅读全文
posted @ 2015-04-03 21:47 kongmeng
阅读(405)
评论(0)
推荐(0)
2015年4月2日
Adaboost 算法
摘要: Adaboost 算法 AdaBoost 是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器,即弱分类器,然后把这些弱分类器集合起来,构造一个更强的最终分类器。(很多博客里说的三个臭皮匠赛过诸葛亮) 算法本身是改变数据分布实现的,它根据每次训练集之中的每个样本的分类是否正确,以及上次的总体...
阅读全文
posted @ 2015-04-02 16:51 kongmeng
阅读(561)
评论(0)
推荐(0)
2015年3月31日
降维PCA技术
摘要: 降维技术使得数据变得更易使用,并且它们往往能够去除数据中的噪声,使得机器学习任务往往更加精确。降维往往作为预处理步骤,在数据应用到其它算法之前清洗数据。有很多技术可以用于数据降维,在这些技术中,独立成分分析(Independent Component Analysis, ICA)、因子分析(Fact...
阅读全文
posted @ 2015-03-31 17:20 kongmeng
阅读(874)
评论(0)
推荐(1)
上一页
1
···
5
6
7
8
9
10
11
12
13
···
17
下一页
公告