Alex He

...永远保持希望与激情...约会未来更强大的自己...

 

12 2010 档案

[算法集锦]编辑距离分析与实现
摘要:编辑距离的分析与实现 做文本分析的时候,我们常常需要计算两篇文本的相关性(相关性除了可以使用相似度还可以使用距离-当然是应该反着来算的),如果你不知道把文本转换为一个向量(如果你知道这个,那遭了,因为那样你就可能认为我这里的很rubbish了),那你可能会考虑我们这里介绍的最朴素的方法-计算字符串间编辑距离的方法。 先给出我遇到的问题(也即定义编辑距离):设A 和B 是两个字符串。对于字符串可以执行如下操作:(1) 删除一个字符;(2)插入一个字符;(3)将一个字符替换成另外一个字符。例如将kitten一字转成sitting:(1). sitten (k→s)(2). sittin (e→i) 阅读全文

posted @ 2010-12-31 17:28 Alex木头 阅读(1704) 评论(0) 推荐(1)

学习使用Linux做实验
摘要:学习使用Linux做实验 这里介绍的是使用Linux平台做实验,也就是在Linux下运行程序。当然程序的编写可以在Linux下编写,也可在非Linux(也就是Windows啦)下编写。而我们做实验大都不需要桌面环境,而只需要命令行就行了(这和隔壁实验室不同,他们使用Matlab就常常需要坐在那台大服务器前敲啊敲啊敲键盘,幸福啊,我们),这就是说我们可以在Windows下把程序写好(甚至是编译好,只要两个平台可以兼容),然后把程序移至Linux下运行就了。 我们实验室大多用Java做实验,这更方便了,因为Java的跨平台,可以直接把编译好的字节码文件拷贝到Linux下运行就是了。当然,有时候要注 阅读全文

posted @ 2010-12-14 17:08 Alex木头 阅读(772) 评论(0) 推荐(0)

导航