摘要:
0. 创建网络爬虫的常规方法进入命令行(操作系统的命令行,不是 python 的命令行)windows:cmd ⇒ c:\Uses\Adminstrator>Linux:$执行:scrapy startproject myfirstproj会自动创建一些文件:__in... 阅读全文
posted @ 2016-10-27 16:09
未雨愁眸
阅读(137)
评论(0)
推荐(0)
摘要:
0. 创建网络爬虫的常规方法进入命令行(操作系统的命令行,不是 python 的命令行)windows:cmd ⇒ c:\Uses\Adminstrator>Linux:$执行:scrapy startproject myfirstproj会自动创建一些文件:__in... 阅读全文
posted @ 2016-10-27 16:09
未雨愁眸
阅读(185)
评论(0)
推荐(0)
摘要:
学术界著名的分词器:中科院的 ICTCLAS,代码并不十分好读哈工大的 ltp,东北大学的 NIU Parser,另外,中文 NLP 和英文 NLP 不太一致的地方还在于,中文首先需要分词,针对中文的分词问题,有两种基本的解决思路:启发式(Heuristic):查字典... 阅读全文
posted @ 2016-10-27 12:43
未雨愁眸
阅读(252)
评论(0)
推荐(0)
摘要:
学术界著名的分词器:中科院的 ICTCLAS,代码并不十分好读哈工大的 ltp,东北大学的 NIU Parser,另外,中文 NLP 和英文 NLP 不太一致的地方还在于,中文首先需要分词,针对中文的分词问题,有两种基本的解决思路:启发式(Heuristic):查字典... 阅读全文
posted @ 2016-10-27 12:43
未雨愁眸
阅读(347)
评论(0)
推荐(0)
摘要:
from sklearn.feature_extraction.text import **1. 向量的统计、tf-idf 的计算考虑如下预料,三行 ⇒ 三个文档,不重复的单词共有 8 个,corpus = ['I love you', 'You love ... 阅读全文
posted @ 2016-10-27 11:55
未雨愁眸
阅读(152)
评论(0)
推荐(0)
摘要:
from sklearn.feature_extraction.text import **1. 向量的统计、tf-idf 的计算考虑如下预料,三行 ⇒ 三个文档,不重复的单词共有 8 个,corpus = ['I love you', 'You love ... 阅读全文
posted @ 2016-10-27 11:55
未雨愁眸
阅读(250)
评论(0)
推荐(0)
摘要:
使用Opencv实现张正友法相机标定之前,有几个问题事先要确认一下,那就是相机为什么需要标定,标定需要的输入和输出分别是哪些?相机标定的目的:获取摄像机的内参和外参矩阵(同时也会得到每一幅标定图像的选择和平移矩阵),内参和外参系数可以对之后相机拍摄的图像就进行矫正,得... 阅读全文
posted @ 2016-10-27 01:09
未雨愁眸
阅读(3429)
评论(1)
推荐(0)
浙公网安备 33010602011771号