随笔分类 -  Machine Learning

Studying with everyone
摘要:https://www.cnblogs.com/denny402/p/7028832.html 阅读全文
posted @ 2021-02-19 11:26 Sunshine168 阅读(56) 评论(0) 推荐(0)
摘要:倾向于使用准确率,是因为熟悉它的定义,而不是因为它是评估模型的最佳工具! 精度(查准率)和召回率(查全率)等指标对衡量机器学习的模型性能是非常基本的,特别是在不平衡分布数据集的案例中,在周志华教授的「西瓜书」中就特别详细地介绍了这些概念。 什么是分布不平衡的数据集? 倘若某人声称创建了一个能够识别登 阅读全文
posted @ 2020-10-31 10:05 Sunshine168 阅读(1494) 评论(0) 推荐(0)
摘要:欧氏距离(Euclidean distance)也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。在二维和三维空间中的欧氏距离的就是两点之间的距离。 Lp space p范数:║x║p=(|x1|^p+|x2|^p+…+|xn|^p)^{1/p} 每个值 阅读全文
posted @ 2020-10-14 18:40 Sunshine168 阅读(1214) 评论(0) 推荐(0)
摘要:1. 欧氏距离(Euclidean Distance) 欧氏距离是最容易直观理解的距离度量方法,我们小学、初中和高中接触到的两个点在空间中的距离一般都是指欧氏距离。 二维平面上点a(x1,y1)与b(x2,y2)间的欧氏距离: 三维空间点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离: 阅读全文
posted @ 2018-10-15 10:29 Sunshine168 阅读(711) 评论(0) 推荐(0)
摘要:转载声明:本文为「顶级程序员」编译团队原创文章,转载请联系后台。 1. 为什么要学习机器学习策略? 机器学习众多重要应用的基础,包括搜索引擎、垃圾邮件过滤、语音识别、商品推荐等。假设你或者你的团队正在做机器学习应用项目,同时你想获得快速进步。你可以从这本书中找到满意的答案。 示例:建立一个识别含有猫 阅读全文
posted @ 2018-10-08 09:12 Sunshine168 阅读(382) 评论(0) 推荐(0)
摘要:原文作者:禅在心中 出处:http://www.cnblogs.com/pinking/ 概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。 离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布 阅读全文
posted @ 2018-08-21 16:42 Sunshine168 阅读(1732) 评论(0) 推荐(0)
摘要:What is Gensim? Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API 阅读全文
posted @ 2018-06-12 15:32 Sunshine168 阅读(967) 评论(0) 推荐(0)
摘要:本文来自 https://blog.csdn.net/u010900574/article/details/52666291,写的太好了。 前言:本教程主要使用了numpy的最最基本的功能,用于生成数据,matplotlib用于绘图,scikit-learn用于调用机器学习方法。如果你不熟悉他们(我 阅读全文
posted @ 2018-04-21 16:32 Sunshine168 阅读(677) 评论(0) 推荐(0)
摘要:主函数可优化为下: 1、p0里放的是k、b的初始值,这个值可以随意指定。往后随着迭代次数增加,k、b将会不断变化,使得error函数的值越来越小。 2、func函数里指出了待拟合函数的函数形状。 3、error函数为误差函数,我们的目标就是不断调整k和b使得error不断减小。这里的error函数和 阅读全文
posted @ 2018-03-31 20:32 Sunshine168 阅读(2675) 评论(0) 推荐(0)