随笔分类 - sklearn
学习sklearn包
摘要:sklearn.feature_extraction.FeatureHasher(n_features=1048576, input_type="dict", dtype=<class 'numpy.float64'>, alternate_sign=True, non_negative=False
阅读全文
摘要:sklearn.featture_extraction.DictVectorizer: 将特征与值的映射字典组成的列表转换成向量。 DictVectorizer通过使用scikit-learn的estimators,将特征名称与特征值组成的映射字典构成的列表转换成Numpy数组或者Scipy.spa
阅读全文
摘要:CountVectorizer: CountVectorizer可以将文本文档集合转换为token计数矩阵。(token可以理解成词) 此实现通过使用scipy.sparse.csr_matrix产生了计数的稀疏表示。 如果不提供一个先验字典,并且不使用进行某种特征选择的分析器,那么特征的数量将与通
阅读全文

浙公网安备 33010602011771号