摘要:Sleep Sort SleepSort是一个使用多线程不同的休眠时间的排序算法。先看一下原始的版本#!/bin/bashfunction f() { sleep "$1" echo "$1"}while [ -n "$1" ]do f "$1" & shiftdonewait./sleepsort.bash 5 3 6 3 6 3 1 4 7相当给力啊。不过不懂Shell脚本的貌似看起来比较困难。比如我--!。其实这个算法主要的思想就是使用将要排序的数字作为线程的休眠时间,然后依次将其输出。我使用Java 阅读全文
posted @ 2011-06-25 21:10 可乐LL 阅读(5034) 评论(13) 推荐(5) 编辑
摘要:Libsvm是实现了SVM算法的一个开源工具包(http://www.csie.ntu.edu.tw/~cjlin/libsvm/),我最近有一个实验要用到自定义核函数的Libsvm,其中网上有不少的matlab版本的使用自定义核函数矩阵的方法例如:http://www.shamoxia.com/html/y2011/3003.html。但是Java和C++版本与matlab有所区别。而且Libsvm最新的版本才加上多分类的解决方案。故我采用了Java版本的自定义核函数方法。 对于自定义核函数,libsvm中称为:Precomputed Kernels。其中的例子如下: Assume the. 阅读全文
posted @ 2011-06-23 17:32 可乐LL 阅读(4858) 评论(1) 推荐(0) 编辑
摘要:Oracle存储过程与JAVA程序调用 阅读全文
posted @ 2011-06-22 20:08 可乐LL 阅读(49054) 评论(9) 推荐(10) 编辑
摘要:对自己在程序中所遇到的字符串编码问题的一个总结,首先,我们先看看我们经常听说的几种编码格式:ASCII,Unicode,UTF-8 当然还有我想拿出来单独来说的GB2312,GBK等等。首先说,这种字符编码是美国制定的,所以它只对英文字符与二进制位之间做了一个对应,区分大小写的英文字符共52个,再加上例如空格之类的控制字符,ASCII共规定了128个字符编码。此时,一个字节的最高位(置为0)是没有... 阅读全文
posted @ 2010-11-30 05:41 可乐LL 阅读(765) 评论(0) 推荐(0) 编辑
摘要:最大后验估计是根据经验数据获得对难以观察的量的点估计。与最大似然估计类似,但是最大的不同时,最大后验估计的融入了要估计量的先验分布在其中。故最大后验估计可以看做规则化的最大似然估计。 首先,我们回顾上篇文章中的最大似然估计,假设x为独立同分布的采样,θ为模型参数,f为我们所使用的模型。那么最大似然估计可以表示为: 现在,假设θ的先验分布为g。通过贝叶斯理论,对于&theta... 阅读全文
posted @ 2010-11-24 02:11 可乐LL 阅读(36585) 评论(2) 推荐(9) 编辑
摘要:最大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。简单而言,假设我们要统计全国人口的身高,首先假设这个身高服从服从正态分布,但是该分布的均值与方差未知。我们没有人力与物力去统计全国每个人的身高,但是可以通过采样,获取部分人的身高,然后通过最大似然估计来获取上述假设中的正态分布的均值与方差。 最大似然估计中采样需满足一个很重要的假设,就是所有... 阅读全文
posted @ 2010-11-22 01:53 可乐LL 阅读(61895) 评论(16) 推荐(15) 编辑
摘要:判别式模型该模型主要对p(y|x)建模,通过x来预测y。在建模的过程中不需要关注联合概率分布。只关心如何优化p(y|x)使得数据可分。通常,判别式模型在分类任务中的表现要好于生成式模型。但判别模型建模过程中通常为有监督的,而且难以被扩展成无监督的。  常见的判别式模型有:    Logistic regression    Linear discriminant analysis    Suppo... 阅读全文
posted @ 2010-11-21 02:14 可乐LL 阅读(2789) 评论(0) 推荐(1) 编辑
摘要:传说中一篇凑数的博客,无意中发现自己在08年3月写的一个东西,感觉挺有意思。就拿来凑凑数吧。不多说了,言归正传。 [代码] 看到题目后思路是这样:[代码]运行发现这个怎么都不正确,答案是24 找了些文档看了看,发现有一个内存的对齐的问题。基本思路如下: 结构体中任何一个元素的起始位置必须是该元素的字节数大小的倍数 回到原来的题目: int a占四个字节起始位置为0符合sizeof(int)的倍数,... 阅读全文
posted @ 2010-11-20 03:28 可乐LL 阅读(546) 评论(4) 推荐(0) 编辑
摘要:想写博客好久了,但是一直没有成行,人太懒了,而且感觉自己的那点东西实在不值得一提,所以一直没敢写。今天,盗用一句当下非常流行的3q体:我做了一个非常艰难的决定,从今天开始,我要写博客了。 最近一直在做自然语言和机器学习的入门级的研究,所以后面的文章主要都集中在这两个方向上面。水平很低,也难免有错误,请各位看客不要惨无人道的围观,多海涵,多提意见。 最后,用我的方式欢迎大家来到我的博客。 Make ... 阅读全文
posted @ 2010-11-20 03:08 可乐LL 阅读(391) 评论(2) 推荐(1) 编辑