摘要: 最近要使用中科院计算所的关键词工具NLPIR,用java调用,在windows下测试后放到linux下跑,就发现会有乱码。windows下默认是GBK,linux下是utf-8,因此在意料之中(尽管最后发现其实不是平台的问题)。除此之外对于编码问题,一直不清楚,不知道这是工具问题还是平台问题,因此楼主一点一点排查,学到了一些编码的知识,备忘一下~设置linux下的中文编码包首先,查看linux设置的默认编码方式,看看是不是因为缺少中文编码包。[root]# localelocale是什么? 引自http://hi.baidu.com/dd_taiyangxue/item/84b85007814 阅读全文
posted @ 2014-01-09 00:50 木木璐 阅读(2494) 评论(0) 推荐(0) 编辑
摘要: 编程语言:java三种工具的简要介绍:FudanNLPgoogle project上的介绍是:FudanNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。FudanNLP及其包含数据集使用LGPL3.0许可证。If you're new to FudanNLP, check out the Quick Start (使用说明) page, FudanNLP Book or Java-docs.功能有:信息检索: 文本分类 新闻聚类中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别结构化学习: 在线学习 层次分类 聚 阅读全文
posted @ 2013-08-31 11:37 木木璐 阅读(6161) 评论(0) 推荐(0) 编辑
摘要: 感谢ITeye的博主viskyzz分享的经验,笔者基本参考ta的方法。然而,解决中间出现的问题时也融入了自己的经验。查看ta的原文请戳:http://tbwuming.iteye.com/blog/1152333默认已经建好了数据库的表。配置过程:1.改写solrconfig.xml,向其中加入: data-config.xml 同时记得要导入相应lib,否则会报错:requesthander init failure,java.lang.ClassNotFoundException: org.apache.solr.handler.dataimport.DataImportHand... 阅读全文
posted @ 2013-07-26 20:05 木木璐 阅读(1911) 评论(2) 推荐(0) 编辑
摘要: Eclipse安装SVN1、help->Install New Software2、Work With,点击add name:subclipse url:http://subclipse.tigris.org/update3、勾选subclipse插件,一路next,重启即可4、在file->import中可以看到other选项,点开即svn。 阅读全文
posted @ 2013-07-24 20:29 木木璐 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 刚学习winAPI,碰到很多不明白的地方。比如它不是通常的控制台项目。入口函数不是main。报错:这说明程序中有窗口函数winMain,而建的是控制台项目(main函数为入口)。产生这个问题的原因可能有:新建的是控制台项目,但用了winMain函数;在vc上首先运行了控制台程序,然后关闭解决方案,再打开了一个win32项目,此时vc默认设置仍然是控制台的,因此应该手动如下解决办法进行修改。解决办法:项目-属性-链接器-系统-子系统,改为窗口(windows) 阅读全文
posted @ 2013-03-17 17:54 木木璐 阅读(4236) 评论(0) 推荐(0) 编辑
摘要: 在上这门课之前,经过两年各种基础课程的学习,感觉做软件这个事还是遥不可及。尽管写过一点大作业,比如java的,c++的,但都是“关起门来搞建设”,以练习新语言为目的,写出来的小工程简直不堪入目,除了能跑以外自己都不能忍,更不要说用户体验,团队合作,迭代开发......我当然不是否定这些青涩的写简陋软件的经历,这都是程序猿的进化之路。然而,除了基本技能的练习,也需要更多提炼的实践中的思考,来确实的将技能转化为可见的友好的实物。邹老师的软件工程课就给我们提供了这样的一个转折点。我认为软工课最重要的是老师讲解和同学实践两个线程并行,所有的理论知识都亲切而紧密的嵌入实践过程,一旦割裂就容易变成传统软工 阅读全文
posted @ 2013-01-10 11:09 木木璐 阅读(275) 评论(1) 推荐(0) 编辑
摘要: 测试软件:微软必应桌面的使用测试测试人:10061171贺翔,10061142林璐测试环境第一部分 下载并使用,按照教程描述的 bug 定义, 找出一个功能性的比较严重的 bug。至少一个。用专业的语言描述 (每个bug 不少于 40字), 如有必要, 可以配图。 bug1:这款软件在安装时无法选择安装路径,也许因为软件比较小的原因,或者是功能的限制,至少设计者没有让软件可以被安装到其他硬盘分区,这对于那些每次安装软件都要选择自定义模式或者高级模式然后自己选择安装路径的人来说是很痛苦的一件事。 bug2:在使用过程中,必应缤纷桌面总是要在任务栏中占据一个位置,虽然软件具有吸附到桌面边缘... 阅读全文
posted @ 2012-12-28 15:11 木木璐 阅读(753) 评论(0) 推荐(0) 编辑
摘要: no silver bullet: 开篇就做了一个很有趣的比喻,说软件工程就像“狼人”,因为一些缺陷会在某个不确定的时候变成一个可怕的“怪兽”。由此,引发了一个疑问,软件工程是否有捷径能够让软件的花销像计算机硬件那样可控的减少? 然而,遗憾的是,作者证明,不论从技术上还是管理上,都没有这样的捷径。但同时,这并不意味着悲观,也许没有康庄大道,但是逐步的,坚持不懈的改进是可以创造一条路的。 到底有什么本质上的困难导致无法找到这样的捷径呢?主要是这四个现代软件系统的本质因素:复杂性(complexity), 一致性(conformity), 易变性(changeability), and 不可... 阅读全文
posted @ 2012-11-13 21:33 木木璐 阅读(197) 评论(0) 推荐(0) 编辑
摘要: 拿到《code complete》,哇,这么厚一本,看到哪年去。。然后就有这个作业了,正愁不知道怎么下手啃完,课间老师跟我们说针对性的看。所以,并没有吃透这本书,只是在目前的认知水平上,选取了帮助比较大的部分细读。主要的收获如下:1.高质量的子程序 在过去的学习中,我认识到子程序的若干好处,比如说可以减少代码冗余,减少修改代价。但是我一直是按照自己的感觉,在编程时临时根据具体需要写觉得这里这里写个子程序比较好,并不知道子程序应该满足怎么样规范才能高效,可读性强。学习这本书的第7章,我收获很大。比如,子程序起名的规范可以很好的提高可读性,参数排列,还有在什么情况下用什么种类的子程序。回想我的编. 阅读全文
posted @ 2012-10-31 17:03 木木璐 阅读(293) 评论(0) 推荐(0) 编辑
摘要: 结队成员:林璐10061142-孙胜10061169一、pair work照片以及优缺点 1.1 pair work优缺点 优点:1.两个人一起编程效率很高,因为不会想去边编程边听歌,或者编一会儿去看会电影。两个人都全身心的投入到设计算法,编程的过程中,甚至过去了一整天都没什么感觉; 2.面对复杂的算法思路,两个人可以一起思考,随时商量,克服自己的思维局限。就像上面的照片,是我们设计算法时的记录。 3.在编程过程中可以分工,我们把整体的结构搭好之后,可以把工作分成几个模块,两个人分别做,并且随时可以商量调整。比如孙胜负责写外部、内部请求的存储方法,我负责写计算下... 阅读全文
posted @ 2012-10-22 23:59 木木璐 阅读(369) 评论(0) 推荐(0) 编辑