摘要:
一、首先学习学习knn算法。kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个... 阅读全文
posted @ 2018-05-16 22:16
HeCCXX
阅读(292)
评论(0)
推荐(0)
摘要:
jieba是python第三方库,用于自然语言处理,对文本进行分词,当然也有其他的分词库。gensim库,利用TFIDF算法来进行文本相似度计算,通过利用gensim库的corpora,models,simila... 阅读全文
posted @ 2018-05-16 20:57
HeCCXX
阅读(1691)
评论(0)
推荐(1)

浙公网安备 33010602011771号