摘要: 打算把博客搬到csdn,http://blog.csdn.net/lskyne 阅读全文
posted @ 2012-12-06 16:35 lskyne 阅读(99) 评论(0) 推荐(0)
摘要: 斯坦福大学的《机器学习》课程有两个星期没看了,最近一直忙着论文,考试。这周开了几门新课,其中模式识别、知识发现与数据开采。这两门跟机器学习相关很大。通过前段时间的自学,现在听着老师讲课,有种豁然开朗的感觉。之前听斯坦福大学的课程都是在本子上做笔记,第一次在博客上写机器学习的学习总结,写的目的主要是理清一下自己的思路,把自己懂的不懂的记录一下,也是对知识的一种回顾。 主成分分析PCA(PrincipalComponentsAnalysis) 目的:特征很多是和类标签有关,但里面存在噪声或冗余,这种情况,需要一种特征降维的方法来减少特征数,减少噪音和冗余,减少过度拟合的可能性。 思想:将n... 阅读全文
posted @ 2012-11-14 23:56 lskyne 阅读(1678) 评论(0) 推荐(0)
摘要: 上一篇主要写了Linux的初步学习,及相关软件的配置安装,没想到这么快就用到了,接触hadoop快一个月了,大致了解了其中的运行机制,主要包括两方面:1,HDFS进行文件存储,2,MapReduce进行数据分析处理。通过网上的资料查询,终于把hadoop单机版配置好了,于是把配置过程总结一下。 1,安装JDK,我用的是openjdk1.6版本 sudo apt-get install openjdk-6-jdk 2,配置JDK环境变量 sudo gedit /etc/environment 在其中添加如下两行: CLASSPATH=./:/usr/lib/j... 阅读全文
posted @ 2012-11-12 12:57 lskyne 阅读(560) 评论(0) 推荐(0)
摘要: 研究生生活已经开始两个月了,这两个月以来,发现很多新知识需要学习。而这些在大学里却一直没有接触。Linux就是其中之一。研究生课程里首先接触的编程就是并行处理了,要用MPI。而MPI在windows下配置比较麻烦,大部分同学都在Linux下编程。而发现自己真的很菜,Linux一点也没接触到,可能自己还是习惯了windows下的应用,所以找了一个替代版MPICH代替MPI,也可以用的。并行处理上了一半的时候,一个Inter的总监过来给我们讲课,边学边操作,还是Linux下编程,于是发现真的OUT了。老师让我们看的hadoop更是需要在Linux下来搭建。于是,我决定开始Linux学习之旅。 .. 阅读全文
posted @ 2012-11-04 10:36 lskyne 阅读(230) 评论(0) 推荐(0)