摘要: Updated 1st 2011.8.6CHAPTER 2 Accessing Text Corpora and Lexical Resources访问文本语料库和词汇资源Practical work in Natural Language Processing typically uses large bodies of linguistic data, or corpora. The goal of this chapter is to answer the following questions:1. What are some useful text corpora and lexic 阅读全文
posted @ 2011-07-10 21:40 牛皮糖NewPtone 阅读(5206) 评论(0) 推荐(0) 编辑
摘要: Updated log 1st 2011.8.62.4 Lexical Resources 词汇资源A lexicon, or lexical resource, is a collection of words and/or phrases along with associated information, such as part-of-speech(词性) and sense definitions. Lexical resources are secondary to texts, and are usually created and enriched with the help. 阅读全文
posted @ 2011-07-09 22:26 牛皮糖NewPtone 阅读(4068) 评论(5) 推荐(1) 编辑
摘要: 新手上路,翻译不恰之处,恳请指出,不胜感谢 Updated log:1st:2011.8.61.3 Computing with Language: Simple Statistics 语言计算:简单的统计Let' s return to our exploration of the ways we can bring our computational resources to bear on large quantities of text. We began this discussion in Section 1.1, and saw how to search for wor 阅读全文
posted @ 2011-06-30 00:02 牛皮糖NewPtone 阅读(3786) 评论(0) 推荐(0) 编辑
摘要: 尽管网上有文字版的PDF,我还是去买了本Python自然语言处理。目前正在写读书笔记,写得很有意思,貌似用这个的人很少,豆瓣上都没有具体的书评。摘抄一下内容简介:《Python自然语言处理(影印版)》提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在《Python自然语言处理(影印版)》中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。 《Python自然语言处理》准备了充足的示例和练习,可以帮助你: 从非结构化文本中抽取信息,甚至 阅读全文
posted @ 2011-06-27 23:06 牛皮糖NewPtone 阅读(1793) 评论(0) 推荐(0) 编辑
摘要: Updated 1st:2011/8/5Updated 2nd:2012/5/14 中英对照完成Preface 前言This is a book about Natural Language Processing. By “natural language” we mean a language that is used for everyday communication by humans; languages such as English, Hindi(印度语), or Portuguese(葡萄牙语). In contrast to artificial languages such 阅读全文
posted @ 2011-06-27 19:58 牛皮糖NewPtone 阅读(5652) 评论(2) 推荐(1) 编辑
摘要: Update日志创建日期:2011.6.27翻译修正:2011.7.20修改了已知的翻译错误更新1st:2011.8.5为目录添加了相关笔记链接更新2rd:2011.8.28修改了部分翻译错误目前施工进度:Chapter5巨坑缓慢填充ing Table of Contents 目录Preface前言1. Language Processing and Python Python和语言处理1.1 Computing with Language: Texts and Words 语言计算:文本和单词 1.2 A Closer Look at Python: Texts as Lists of .. 阅读全文
posted @ 2011-06-27 15:41 牛皮糖NewPtone 阅读(5886) 评论(0) 推荐(4) 编辑
摘要: 在《社会能计算吗?》学术沙龙上的发言摘要)转载自王飞跃教授的博客,要查教授资料请自己Google 王飞跃发言: 关于人的建模,我是20世纪90年代初做股市经济评价计算时才意识这个问题的重要性。当时找第一篇相关文献,是哈佛大学的一位中年经济学教授,他把人类归结四种类型,太哲学,也太简单,无法用于计算。后来继续找,直到找到司马贺写的Models of Man,厚厚一本书,觉得肯定有答案了。借来一看,发现原来是一本论文集。问题是书中的论文多数与书名不符,少数间接隐含着书名的意思,但无法得到我想要的东西。既然找不到,就自己来建规则,用Fuzzy Logic 建一些简单的人和组织的模型,这也是后来我致. 阅读全文
posted @ 2011-06-27 10:27 牛皮糖NewPtone 阅读(636) 评论(2) 推荐(0) 编辑
摘要: 当社会计算在国内仍处在理论研究的阶段时,IBM已经推出了Web 2.0 实践软件:面向业务的社会计算。 因为有个学弟的方向是基于此,而我对于此方面也很有趣,就去IBM官网查了相关的资料。 社会计算开创了一个新的时代,在这个时代,人们可以充分发挥自己的能力,创新也不再是自上而下,而是自下而上,因为个人和社区的价值已经在产品和服务中体现出来。 社会计算这一创新是在我们自己的实验室开发的,使我们能够在整... 阅读全文
posted @ 2011-06-27 10:26 牛皮糖NewPtone 阅读(351) 评论(0) 推荐(0) 编辑
摘要: Pyxml是一个早在04年停止维护的项目了,只支持到2.4,我从官网上down下0.8.4版本setup.py build,结果error: Unable to find vcvarsall.bat。网上找解决办法还得下个mingw,否则就得VS2005以上的版本,这样机子上只有VC6.0的我情何以堪那。 于是上网搜解决办法: 这位老大告诉我:PyXML is dead project – warning: PyXML does not work with Python2.6 http://georgik.sinusgear.com/2011/01/10/dead-project-warnin 阅读全文
posted @ 2011-06-23 11:13 牛皮糖NewPtone 阅读(2407) 评论(2) 推荐(0) 编辑
摘要: 转载自developerworks,原文地址:http://www.ibm.com/developerworks/cn/xml/x-cn-yamlintro/ YAML Ain't Markup Language 和GNU一样,YAML是一个递归着说“不”的名字。不同的是,GNU对UNIX说不,YAML说不的对象是XML。 YAML不是XML。 为什么不是XML呢?因为: YAML的可读性好。 Y... 阅读全文
posted @ 2011-06-22 19:57 牛皮糖NewPtone 阅读(1452) 评论(0) 推荐(0) 编辑