课题简介:

     “自动化学科创新思想与科学方法研究”课题,编号2009IM020300。 项目旨在对影响国内自动化领域发展的知识要素(包括 人物、机构、研究对象等)进行系统分析,形成知识体系,构建知识服务网络平台,提供知识服务,促进知识创新。

     项目涉及文献情报分析与研究、知识关联与服务等层面,但是在底层数据获取的方面需要依赖于文本挖掘技术。

 

资源简介:

论文:

面向自动化学科中文期刊论文的文本挖掘系统

PPT:

面向自动化学科中文期刊论文的文本挖掘系统PPT

 

数据专区:http://www.datatang.com/member/5878

以下算法在论文中都有提到,

人名消歧和机构名称归一http://download.csdn.net/detail/finallyliuyu/5491655

科技术语或者说是关键词的聚类算法:http://download.csdn.net/detail/finallyliuyu/5491665

知识族谱形成算法:http://download.csdn.net/detail/finallyliuyu/5491675

以上三个算法,写的比较乱,也没有时间进行优化了,有需要的自己费劲看一下吧。大致的框架是main函数调用DataBaseManagement类,再进行算法的调用。

文本分类程序代码:http://www.datatang.com/data/13483 这个放在了数据堂已经有一定的下载量了。

 

 

posted on 2012-06-02 11:03  finallyly  阅读(4077)  评论(14编辑  收藏  举报