摘要: 最近在看廖雪峰老师的基础教程(http://www.liaoxuefeng.com/),今天实现了一下简单Python的Socket的网络编程。 1. Socket网络编程 Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标 阅读全文
posted @ 2016-03-28 23:24 HaichaoON 阅读(16242) 评论(1) 推荐(0)
摘要: 本篇blog是利用Python进行文章特征提取的续篇,主要介绍构建带TF-IDF权重的文章特征向量。 In [1]: # 带TF-IDF权重的扩展词库 # 在第一篇文档里 主要是利用词库模型简单判断单词是否在文档中出现。然而与单词的顺序、频率无关。然后词的频率对文档更有意义。因此本文将词频加入特征向 阅读全文
posted @ 2016-02-27 18:02 HaichaoON 阅读(8022) 评论(1) 推荐(0)
摘要: # 文字特征提取 词库模型(bag of words) 2016年2月26,星期五 # 1.词库表示法 In [9]: # sklearn 的 CountVectorizer类能够把文档词块化(tokenize),代码如下 from sklearn.feature_extraction.text i 阅读全文
posted @ 2016-02-26 16:57 HaichaoON 阅读(10857) 评论(1) 推荐(0)
摘要: from __future__ import unicode_literalsprint(type("test")) #Chinatest="测试"print(Chinatest[1:2]) #输出“试” 阅读全文
posted @ 2015-11-04 12:59 HaichaoON 阅读(288) 评论(0) 推荐(0)