摘要:
一 安装环境 直接下载algs4.exe 下载完成后C:\Users\zle 下面会有algs4 文件夹 原文: Our installer downloads, installs, and configures the Java programming environment you will b 阅读全文
摘要:
Using the numpy.hstack will create an array with two sparse matrix objects. scipy.sparse.bmat 归一化 norm : ‘l1’, ‘l2’, or ‘max’, optional (‘l2’ by defau 阅读全文
摘要:
文本提取特征常用的模型有:1.Bag-of-words:最原始的特征集,一个单词/分词就是一个特征。往往一个数据集就会有上万个特征;有一些简单的指标可以帮助筛选掉一些对分类没帮助的词语,例如去停词,计算互信息熵等等,但不管怎么训练,特征维度都很大,每个特征的信息量太小;2.统计特征:包括Term f 阅读全文