星云外

2010年7月26日

zt 计算语言学 与 自然语言处理

摘要: 计算语言学和自然语言处理简介一、从一个例子开始2001年美国电影《太空奥德赛》中的一段对话:(Screenplay 0f 2001: A Space Odyssey,Stanley Kubrick & Arthur C. Charke编 )Dave Bownman: Open the pod bay doors, HAL.HAL: I’m sorry Dave, I&rsquo... 阅读全文

posted @ 2010-07-26 12:36 星云外 阅读(608) 评论(0) 推荐(0) 编辑

2010年7月23日

网站学习初步1 关于控件

摘要: Html控件的优点HTML控件由HTML标记衍生而来,HTML控件在外形上与普通的HTML标记很相似,几乎所有的HTML标记加上runat="Server"这个Server控件的标识属性后,都可以变成HTML控件。它们之间最大的区别就是HTML可以通过服务器端的代码来控制。下面以一个超级链接控件(HtmlAnchor)为例来看一下。可以在WebForm1.aspx上定义一个HtmlAnchor控件... 阅读全文

posted @ 2010-07-23 15:43 星云外 阅读(245) 评论(0) 推荐(0) 编辑

2010年5月16日

常用算法源码集锦 [推荐]

摘要: 以下收集了很少一部分论坛中算法实现,若不在列表中请使用“搜索”一些数据挖掘算法源代码! http://bbs.dmresearch.net/viewthread.php?tid=3475&extra=page%3D1粗糙集理论介绍(对于初学者来说,很经典的滴) http://bbs.dmresearch.net/viewthread.php?tid=3588&... 阅读全文

posted @ 2010-05-16 21:30 星云外 阅读(967) 评论(0) 推荐(0) 编辑

2010年4月27日

转自Lindahua博客《图,谱,马尔可夫过程,聚类结构》

摘要: 题目中所说到的四个词语,都是Machine Learning以及相关领域中热门的研究课题。表面看属于不同的topic,实际上则是看待同一个问题的不同角度。不少文章论述了它们之间的一些联系,让大家看到了这个世界的奇妙。 从图说起 这里面,最简单的一个概念就是“图”(Graph),它用于表示事物之间的相互联系。每个图有一批节点(Node),每个节点表示一个对象,通过一些边(Ed... 阅读全文

posted @ 2010-04-27 15:37 星云外 阅读(824) 评论(0) 推荐(0) 编辑

2010年4月16日

conditional random fields{很赞,有空一定翻译出来!}

摘要: http://www.inference.phy.cam.ac.uk/hmw26/crf/This page contains material on, or relating to, conditional randomfields. I shall continue to update this page as research onconditional random fields adva... 阅读全文

posted @ 2010-04-16 21:21 星云外 阅读(1703) 评论(1) 推荐(0) 编辑
粗糙集理论介绍

摘要: 粗糙集理论介绍面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述?粗糙集合论回答了上面的这些问题。要想了解粗糙集合论的思想,我们先要了解一下什么叫做知识?假设有8个积木构成了一个集合A,我们记:A={x1,x2,x3,x4,x5,x6,x7,x8},每个积木块都有颜色属性,按照颜色的不同,我们能够把这堆积木分成... 阅读全文

posted @ 2010-04-16 20:57 星云外 阅读(338) 评论(0) 推荐(0) 编辑
概率图模型之生成模型与判别模型

摘要: < PreviousNext >Sorry, your entry can't be deleted right now. Please try again later.July 30概率图模型之生成模型与判别模型 自然语言处理中,经常要处理序列标注问题(分词、词性标注、组快分析等),为给定的观察序列标注标记序列。 令o和s分别代表观察序列和标记序列, 根据贝叶斯公式, 1 生成... 阅读全文

posted @ 2010-04-16 20:53 星云外 阅读(1335) 评论(0) 推荐(0) 编辑
概率图模型之有向图与无向图

摘要: 预备知识:条件熵定义: 一 原理 对待已知事物和未知事物的原则:(1)承认已知事物(知识);(2)对未知事物不做任何假设,没有任何偏见, 概率平均分布 = 熵最大。即在满足特征函数期望等于样本特征函数期望的条件下,找出使得条件熵最大的分布。 二 数学模型 1 目标函数(条件熵最大) ,P={p|p是X上满足条件的概率分布} 2 约束(特征函数期望等于样本特征函数期望,即对每一个特征(x,y... 阅读全文

posted @ 2010-04-16 20:52 星云外 阅读(2652) 评论(0) 推荐(0) 编辑
概率图模型之条件随机场(CRF)

摘要: CRF及其应用开宗明义,概念先行~条件随机域模型是一种无向图模型,它是在给定需要标记的观察序列的条件下,计算整个标记序列的联合概率分布,而不是在给定当前状态条件下,定义下一个状态的状态分布。即给定观察序列O,求最佳序列S。1 链式条件随机场模型的图结构2 条件随机场模型的分解式2 原理:(1)目标函数:基于最大熵原则进行建模,定义样本条件熵(2)约束条件:以团为单位定义特征约束特征的样本期望与模型... 阅读全文

posted @ 2010-04-16 20:49 星云外 阅读(3117) 评论(1) 推荐(0) 编辑
几个常用的机器学习工具包

摘要: 所谓机器学习,借用维基百科里的话说,是一种“用于创建数据集分析分析程序的方法”(具体的定义在此就不多说了)。借助这些方法我们可以对事件进行建模,常常可以达到通过对已有数据分析,对新数据作出迅速判断的效果。常见的机器学习模型(就我接触的而言)有CRF(条件随机场),SVM(支持向量机),EM(最大熵)和ME(最大似然),当然排名不分先后,至于是generativemodel还... 阅读全文

posted @ 2010-04-16 20:25 星云外 阅读(2208) 评论(0) 推荐(0) 编辑