数据挖掘——学习笔记(机器学习--监督,非监督,半监督学习)
摘要:http://blog.sina.com.cn/s/blog_627a4f560100xmj1.html在机器学习(Machine learning)领域,监督学习(Supervised learning)、非监督学习(Unsupervised learning)以及半监督学习(Semi-supervised learning)是三类研究比较多,应用比较广的学习技术,wiki上对这三种学习的简单描述如下:监督学习:通过已有的一部分输入数据与输出数据之间的对应关系,生成一个函数,将输入映射到合适的输出,例如分类。非监督学习:直接对输入数据集进行建模,例如聚类。半监督学习:综合利用有类标的数据和没
阅读全文
posted @
2012-03-28 13:56
yangrui099
阅读(6656)
推荐(2)
自动文本摘要论文总结九(A complex network approach to text summarization)
摘要:本文介绍了基于复杂网络的自动文本摘要的方法。 具体分为四步骤: 1 将文章进行预处理,根据句子分隔符将句子分开,并将名词提取出。 2 根据文章构建成两个N*N的矩阵,一个是表示邻接关系的矩阵,一个是表示权重的矩阵,分别叫做A和W,N为句子的个数。 3 计算节点的值 4 根据一定的算法将句子进行排序,然后取出前n个句子组成摘要。 文中提出了7种网络测量的算法和14中句子排序算法,具体介绍如下: 1Degree strategies: CN-Degree and CN-Strength 根据与节点i相连的节点的个数作为节点i的值,即Ki = ∑aij,aij为矩阵A中的元素...
阅读全文
posted @
2012-03-18 14:48
yangrui099
阅读(513)
推荐(0)