随笔分类 -  Machine Learning

摘要:余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上。 与欧几里德距离类似,基于余弦相似度的计算方法也是把用户的喜好作为n 维坐标系中的一个点,通过连接这个点与坐标系的原点构成一条直线(向量),两个用户之间的 阅读全文
posted @ 2019-04-13 09:44 睿晞 阅读(4622) 评论(1) 推荐(1)
摘要:<! done 分类模型的评价指标Fscore 小书匠深度学习分类方法常用的评估模型好坏的方法. 0.预设问题 假设我现在有一个二分类任务,是分析100封邮件是否是垃圾邮件,其中不是垃圾邮件有65封,是垃圾邮件有35封.模型最终给邮件的结论只有两个:是垃圾邮件与 不是垃圾邮件. 经过自己的努力,自己 阅读全文
posted @ 2019-04-10 19:50 睿晞 阅读(3923) 评论(0) 推荐(0)
摘要:2019/03/09 16:16 归一化方法: 简单放缩(线性归一化):这种归一化方法比较适用在数值比较集中的情况。这种方法有个缺陷,如果max和min不稳定,很容易使得归一化结果不稳定,使得后续使用效果也不稳定。实际使用中可以用经验常量值来替代max和min。 特征标准化:经过处理的数据符合标准正 阅读全文
posted @ 2019-03-24 18:50 睿晞 阅读(267) 评论(0) 推荐(0)