摘要:class TFIDF(object): """ 以一个图书馆为例, tf: 该单词在图书馆某本书里出现的频率 idf: 1+log((图书馆所有书的数量+平滑系数)/(该单词出现过的书的数量+平滑系数)) tfidf = tf*idf,即对应该本书该词的tfidf值 """ def __init_
阅读全文
摘要:本demo从pytorch官方的迁移学习示例修改而来,增加了以下功能:
阅读全文
摘要:1 from itertools import combinations 2 3 data = [['I1', 'I2', 'I5'], ['I2', 'I4'], ['I2', 'I3'], ['I1', 'I2', 'I4'], ['I1', 'I3'], 4 ['I2', 'I3'], ['I1', 'I3'], ['I1
阅读全文
摘要:数据集如下: 基于信息增益的ID3决策树的原理这里不再赘述,读者如果不明白可参考西瓜书对这部分内容的讲解。 python实现代码如下: 绘制的决策树如下:
阅读全文
摘要:1 import numpy as np 2 # 将二维数据降成1维 3 num = [(2.5, 2.4), (0.5, 0.7), (2.2, 2.9), (1.9, 2.2), (3.1, 3.0), (2.3, 2.7), (2, 1.6), (1, 1.1), (1.5, 1.6), (1
阅读全文
摘要:原理:计算当前点(无label,一般为测试集)和其他每个点(有label,一般为训练集)的距离并升序排序,选取k个最小距离的点,根据这k个点对应的类别进行投票,票数最多的类别的即为该点所对应的类别。代码实现(数据集采用的是iris): 对比结果:custom的准确率: 0.95sklearn的准确率
阅读全文