随笔分类 -  学习

[Linux]创建bash脚本
只有注册用户登录后才能阅读该文。

posted @ 2017-02-24 18:14 yyyyyi 阅读(2) 评论(0) 推荐(0)

[Linux]如何在linux环境下运行HDP、HLDA
摘要:新手菜鸟记录如何在linux运行hdp、hldaHDP:首先根据命令格式等输入 命令、路径、语料,并开始运行。运行结束后,在结果文件中获得结果找到mode-word-assignments.dat 并运行,得到带hdp后缀的文件,即为结果文件,格式为 文本id:类id。HLDA:根据命令格式输入 .... 阅读全文

posted @ 2015-07-22 10:41 yyyyyi 阅读(712) 评论(0) 推荐(0)

[JAVA]清洗latex数据
摘要:首先,找出符合条件的文章。一.清洗公式格式为\\begin{equation}...\\end{equation}\\begin{eqnarray}...\\end{eqnarray}二.以每段为准,将句子连接,接着进行分句(每行为一个句子)。(暂时不分句)三.清洗标签1.清洗公式标签,格式为(\\... 阅读全文

posted @ 2015-07-04 11:02 yyyyyi 阅读(739) 评论(0) 推荐(0)

[JAVA]基本的数据集分析技巧
摘要:抽取信息并统计,排序任务是对语料进行预处理,对1000个问题的答案和回复进行抽取有用信息并统计。首先,分析文本内容、格式,思考如何抽取。文件有三种类型answer、comment、vote,因此在开始时根据前面几个字符先判断文件类型。接着根据需求构造对象和方法,并构造对象list来存储抽取出来的信息... 阅读全文

posted @ 2015-03-09 20:43 yyyyyi 阅读(276) 评论(0) 推荐(0)

导航