2014年4月13日

摘要: 在做实验的时候,由于每次都要手工修改文件夹的名字,实在是给自己添了太多的麻烦,为了摆脱手工修改的困恼,于是产生了一个使用程序批量修改文件夹名字的好主意。为了最终实现这个目标,自然需要选择一种合适的脚本语言,恰好目前对Ruby十分感兴趣,于是“兴趣+需求”,诞生了一个不算过于丑陋的Ruby程序(自以为)。(一)功能需求首先来说一下我的需求:在程序运行的根目录(记为LDAModel)下有50个子文件夹(名字分别为21-70,为什么不是从1开始呢?),而每个子文件夹下又有若干个子文件夹,其名字分为两类,分别是20和20(i),如下图所示:而其中名为20的文件夹并不一定存在,如果不存在的话则在每次程序 阅读全文
posted @ 2014-04-13 08:01 韧心 阅读(1251) 评论(0) 推荐(1) 编辑

2014年1月3日

摘要: 近日来,老板要在内部部署一套IT资产管理系统,要笔者去调研一下,测试了GLPI、OCSNG(没记错吧)和CMDBuild之后,发现还是CMDBuild的功能较为强大,虽然暂时不具备SNMP之类的工具,但是据说可以利用OCSNG来进行导入。并且,Cmdbuild对于数据的管控更加灵活,同时还兼具了... 阅读全文
posted @ 2014-01-03 15:03 韧心 阅读(8664) 评论(12) 推荐(1) 编辑

2012年12月12日

摘要: Stanford Parser是一个很好的语法分析工具,但在使用的时候发现有很多不认识的标签,经过一番查找,将其列出供大家参考:本文的内容主要来源于以下两个网址:http://en.wikipedia.org/wiki/Brown_Corpus#Part-of-speech%5Ftags%5Fusedhttp://stackoverflow.com/questions/1833252/java-stanford-nlp-part-of-speech-labelsCC: conjunction, coordinatin 表示连词例如: &'n and both but eithe 阅读全文
posted @ 2012-12-12 10:16 韧心 阅读(3211) 评论(0) 推荐(0) 编辑

2012年12月1日

摘要: 这篇文档算不上一篇完整的blog,只是作为一个小Bug的记录而已,所以取名1.1~在使用IndexUI.jar建立索引的过程中,笔者选择使用了TRECWeb的数据格式,但是发现总是出现一些小问题,不是无法建立索引就是建立的索引只包含一个文档。经过若干轮的折磨,最终发现问题在于,Indri理解的TRECWeb必须是以“\n”来结尾的。。。这是今天的1.2,哈哈笔者使用Indri自带的图形界面IndexUI.jar来建立索引,在编程对索引进行处理时,发现总是无法获得到域内(fields)的值,最开始以为是Indri与Lucene中域的概念不同造成的,并没有进行深入的理解。今天突发奇想,对Index 阅读全文
posted @ 2012-12-01 23:02 韧心 阅读(737) 评论(0) 推荐(0) 编辑

2012年11月26日

摘要: Indri是一个不错的搜索引擎,目前关于Indri的中文介绍相对较少,因此介绍在Mac系统上配置Indri的文章就更少,笔者最近正在研究如何使用Indri,结合自己的一点努力,与大家分享一下Indri的相关内容(主要是在Mac系统下面的~)这是本系列的第一部分,主要介绍一下Indri在Mac系统下如何安装,如果有机会,给大家再讲讲如何在Java下面开发Indri1、配置Indri在Mac系统下面进行安装,需要首先进行配置(Linux和Unix下面也是这样的)启动“终端”,将当前目录调整到Indri的根目录下,输入./configure --prefix=<indri的安装目录>-- 阅读全文
posted @ 2012-11-26 17:16 韧心 阅读(1450) 评论(0) 推荐(0) 编辑

2012年9月23日

摘要: EndNote是一种常用文献管理软件,由于其对Word、Page以及中文的良好支持,已经成为论文写作的必备工具之一。这几天帮人修改毕业论文的格式,发现EndNote自带的输出样式都不能满足要求,于是上网查了一些资料,整理了一份EndNote output style的自定义指南,和大家共享一下。1、打开EndNote软件,笔者这里的是EndNote X4(Windows版)和EndNote X5(Mac版),其实两者没有本质的区别。2、点击Edit->Output Styles,会弹出如下列表。如果要直接编辑某些已经存在的Output Style,可点击Open Style Manage 阅读全文
posted @ 2012-09-23 20:06 韧心 阅读(52652) 评论(0) 推荐(1) 编辑

2012年9月16日

摘要: 使用MyEclipse对Hadoop进行开发,一定会用到hadoop-eclipse-plugin插件,目前最稳定的版本是1.0.3。现在Hadoop已经不提供编译好的hadoop-eclipse-plugin(***).jar文件,需要自己对其进行编译。如果实在不会编译的话,可以使用网上编译好的jar文件。编译好的jar文件可以直接放入MyEclipse的dropins文件夹中,这样就可以使用了。在MyEclipse 10中,该文件夹所在的目录为~/Application/MyEclipse/MyEclipse 10-1/Drop-ins/dropins。该结构与MyEclipse 8.6的 阅读全文
posted @ 2012-09-16 23:50 韧心 阅读(737) 评论(0) 推荐(0) 编辑

导航