2012年7月10日

摘要: 我们在使用python shell的时候,默认没有开启tab补全功能,有时候忘记了某个函数怎么写,这时候补全功能就能给我们很大的帮助了。如果你使用的是Ipython,那 tab补全默认是开启的,在标准python shell中开启tab补全,只要打开python shell,然后>>>import rlcompleter, readline>>>readline.parse_and_bind('tab: complete')之后,就能在标准python shell中使用tab补全了。为了每次都能开启tab补全,可以自己创建一个PYTHONST 阅读全文
posted @ 2012-07-10 10:28 蓝色守望 阅读(991) 评论(0) 推荐(0)

2012年7月9日

摘要: 如果 S 表示一连串特定顺序排列的词 w1, w2,..., wn ,换句话说, 可以表示某一个由一连串特定顺序排练的词而组成 S的一个有意义的句子。 现在, 机器对语言的识别从某种角度来说,就是想知道 S 在文本中出现的可能性, 也就是数学上所说的 S 的概率用 P(S) 来表示。利用条件概率的公式,S 这个序列出现的概率等于每一个词出现的概率相乘,于是 P(S) 可展开为:P(S) = P(w1)P(w2|w1)P(w3| w1 w2)...P(wn|w1 w2...wn-1)。其中 P (w1) 表示第一个词 w1 出现的概率;P(w2|w1) 是在已知第一个词的前提下,第二个词出现的. 阅读全文
posted @ 2012-07-09 22:00 蓝色守望 阅读(135) 评论(0) 推荐(0)
摘要: 使用已有的cookie访问网站import cookielib, urllib2ckjar =cookielib.MozillaCookieJar(os.path.join(’C:\Documents andSettings\tom\ApplicationData\Mozilla\Firefox\Profiles\h5m61j1i.default’, ‘cookies.txt’))req = urllib2.Request(url, postdata, header) req.add_header(’User-Agent’, \ ‘Mozilla/4.0 (compatible; MSIE 6 阅读全文
posted @ 2012-07-09 17:31 蓝色守望 阅读(225) 评论(1) 推荐(0)

2012年7月5日

摘要: hostent: hostent是host entry的缩写,该结构记录主机的信息,包括主机名、别名、地址类型、地址长度和地址列表。之所以主机的地址是一个列表的形式,原因是当一个主机有多个网络接口时,自然有多个地址。 struct hostent { char *h_name; 地址的正式名称。 char **h_aliases; 空字节-地址的预备名称的指针 int h_addrtype; 地址类型; 通常是AF_INET。 int h_length; 地址的比... 阅读全文
posted @ 2012-07-05 22:19 蓝色守望 阅读(133) 评论(0) 推荐(0)

2012年7月2日

摘要: 今天是7月2号,第一天工作,主要是学习python,我要好好工作,实现自己的价值。下午的目标:读python基础教程1到5章。 阅读全文
posted @ 2012-07-02 13:15 蓝色守望 阅读(112) 评论(0) 推荐(0)

2012年6月28日

摘要: 今天好开心,电子路一次过了,节省了时间和金钱,人品小爆发了一下。 阅读全文
posted @ 2012-06-28 20:45 蓝色守望 阅读(100) 评论(1) 推荐(0)
摘要: 参考文献:http://blog.csdn.net/chl033/article/details/3324548考虑一个数据库中的二维表如下:元素颜色形状大小稳定性x1红三角大稳定x2红三角大稳定x3黄圆小不稳定x4黄圆小不稳定x5兰方块大稳定x6红圆中不稳定x7兰圆小不稳定x8兰方块中不稳定其中“颜色形状大小”称为条件属性,“稳定性”称为决策属性。我们的目的是找出哪些条件属性能够对决策属性有影响。主要思路是假设去除要验证的条件属性后,其下近似集和上近似集没有变化,那么说明没影响,反之有影响。假设有8个积木构成了一个集合A,我们记:A={x1,x2,x3,x4,x5,x6,x7,x8},每个积 阅读全文
posted @ 2012-06-28 20:43 蓝色守望 阅读(784) 评论(0) 推荐(0)

2012年6月25日

摘要: 本文转自:http://www.cnblogs.com/leoo2sk/archive/2010/09/20/k-means.html4.1、摘要 在前面的文章中,介绍了三种常见的分类算法。分类作为一种监督学习方法,要求必须事先明确知道各个类别的信息,并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足,尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的要求,则代价非常大,这时候可以考虑使用聚类算法。聚类属于无监督学习,相比于分类,聚类不依赖预定义的类和类标号的训练实例。本文首先介绍聚类的基础——距离与相异度,然后介绍一种常见的聚类算法——k均值和k中心点聚类 阅读全文
posted @ 2012-06-25 20:49 蓝色守望 阅读(255) 评论(0) 推荐(0)

2012年6月23日

摘要: 3种OWL语言 OWL可以分为三种子语言:OWL-Lite,OWL-DL,OWL-Full。子语言的特征是由它的描述能力来分类的。其中,OWL-Lite描述能力最弱,OWL-Full描述能力最强,OWL-DL的能力 属于中间,同时,OWL-Full可以视为是OWL-DL的一个扩展。 OWL-Lite:在语法上,OWL-Lite是最简单的语言。一般用于只有一个简单的类层次和定义的约束比较简单的情况。比如,根据一个现有的百科全书建立的本体。 OWL-DL:OWL-DL是建立在描述逻辑基础上的的,描述能力比OWL-Lite强得多。描述逻辑是第一顺序逻辑的决定性部分,可以进行自动推理。因此,可以自动的 阅读全文
posted @ 2012-06-23 20:32 蓝色守望 阅读(914) 评论(0) 推荐(0)

2012年6月12日

摘要: 问题1:在文档中统计单词的频数。在C++中遇到这类问题只需调用STL中的set或者map就可以很快的解决了,但是在C中需要自己实现。#include <stdio.h>#include <stdlib.h>#include <string.h>typedef struct node{ char *word; int count; struct node * next;}node;#define NHASH 29989#define MULT 31node *bin[NHASH];unsigned int hash(char *p){ unsigned int 阅读全文
posted @ 2012-06-12 19:35 蓝色守望 阅读(261) 评论(0) 推荐(0)

导航