摘要: TeamSHIT今天的Scrum布置了接下来三天的任务,具体如下: 隋宇豪:完成语料库的数据库设计与实现,继续完成CRAWLER-PIPELINE数据库; 李斌、彭笑东:语料库翻译 胡仁君:基于web文本本身,脱离语料库的标签抽取。组员今天任务明天任务胡仁君任务367确认信息抽取主要算法任务428正文分词任务429词频统计彭笑东 任务368确认信息抽取主要算法任务374翻译语料库任务374翻译语料库李斌任务369确认信息抽取主要算法任务373翻译语料库任务373翻译语料库隋宇豪任务375创建预料字典数据库任务287相关数据库定义与实现其中信息抽取的算法为: 1、标签(关键字... 阅读全文
posted @ 2012-12-03 23:00 teamshit 阅读(171) 评论(0) 推荐(0) 编辑