随笔分类 -  机器学习知识

关于最大似然估计的理解
摘要:似然 这个词害死人啊! 拽什么拽啊,就是 最大可能估计!还有什么极大似然估计。都是坑人的,都一样。 最大似然估计是机器学习领域最为常见的用来构建 目标函数 的方法。 他的核心思想是:根据观测到的结果来预测其中的未知参数。 假设有一枚硬币,它是不均匀的,也就是说出现正面的反面的概率是不同的。假设我们设 阅读全文

posted @ 2020-02-13 20:28 耀扬 阅读(467) 评论(0) 推荐(0)

易百教程人工智能python补充-NLTK包
摘要:自然语言处理(NLP)是指使用诸如英语之类的自然语言与智能系统进行通信的AI方法。 如果您希望智能系统(如机器人)按照您的指示执行操作,希望听取基于对话的临床专家系统的决策时,则需要处理自然语言。 NLP领域涉及使计算机用人类使用的自然语言执行有用的任务。 NLP系统的输入和输出可以是 - 言语(说 阅读全文

posted @ 2019-11-02 23:09 耀扬 阅读(317) 评论(0) 推荐(0)

负样本的理解
摘要:https://www.cnblogs.com/rainsoul/p/7890641.html 总结一下学习笔记 如,做一个汽车的照片分类,正样本 就是 正确的 汽车的图片,负样本就是 不是 汽车的图片。 通过模型训练,可以告诉机器,那些是对的,哪些是错误的。错误的就是负样本。 针对与分类问题,正样 阅读全文

posted @ 2019-08-22 17:10 耀扬 阅读(2578) 评论(5) 推荐(1)

学习贝叶斯定理
摘要:感谢 https://mp.weixin.qq.com/s/YPUHWBPwRiH0N0AFNnIrmw 整理一下,学习笔记 贝叶斯定理是一种在已知其他概率的情况下求概率的方法: P(A|B) 是在 B 发生的情况下 A 发生的概率; P(A) 是 A 发生的概率; P(B|A) 是在 A 发生的情 阅读全文

posted @ 2019-08-20 23:59 耀扬 阅读(304) 评论(0) 推荐(0)

独热编码(One-Hot)的理解
摘要:https://www.imooc.com/article/35900 参考上面大神的原文,说的非常透彻。非常便于理解。感谢 感谢 自己做个小笔记,便于自己学习 特征值是离散的,无序的。 如: 性别特征:["男","女"] 祖国特征:["中国","美国,"法国"] 运动特征:["足球","篮球"," 阅读全文

posted @ 2019-08-15 18:11 耀扬 阅读(2886) 评论(0) 推荐(0)

易百教程人工智能python修正-人工智能NLTK性别发现器
摘要:在这个问题陈述中,将通过提供名字来训练分类器以找到性别(男性或女性)。 我们需要使用启发式构造特征向量并训练分类器。这里使用scikit-learn软件包中的标签数据。 以下是构建性别查找器的Python代码 - 导入必要的软件包 - 现在需要从输入字中提取最后的N个字母。 这些字母将作为功能 - 阅读全文

posted @ 2018-08-25 22:45 耀扬 阅读(381) 评论(0) 推荐(0)

易百教程人工智能python修正-人工智能无监督学习(聚类)
摘要:无监督机器学习算法没有任何监督者提供任何指导。 这就是为什么它们与真正的人工智能紧密结合的原因。 在无人监督的学习中,没有正确的答案,也没有监督者指导。 算法需要发现用于学习的有趣数据模式。 什么是聚类? 基本上,它是一种无监督学习方法,也是用于许多领域的统计数据分析的常用技术。 聚类主要是将观测集 阅读全文

posted @ 2018-08-25 17:02 耀扬 阅读(475) 评论(0) 推荐(0)

易百教程人工智能python修正-人工智能监督学习(回归)
摘要:回归是最重要的统计和机器学习工具之一。 我们认为机器学习的旅程从回归开始并不是错的。 它可以被定义为使我们能够根据数据做出决定的参数化技术,或者换言之,允许通过学习输入和输出变量之间的关系来基于数据做出预测。 这里,依赖于输入变量的输出变量是连续值的实数。 在回归中,输入和输出变量之间的关系很重要, 阅读全文

posted @ 2018-08-25 16:16 耀扬 阅读(448) 评论(0) 推荐(0)

易百教程人工智能python修正-人工智能监督学习(分类)
摘要:分类技术或模型试图从观测值中得出一些结论。 在分类问题中,我们有分类输出,如“黑色”或“白色”或“教学”和“非教学”。 在构建分类模型时,需要有包含数据点和相应标签的训练数据集。 例如,如果想检查图像是否属于汽车。 要实现这个检查,我们将建立一个训练数据集,其中包含与“车”和“无车”相关的两个类。 阅读全文

posted @ 2018-08-25 15:55 耀扬 阅读(422) 评论(0) 推荐(0)

易百教程人工智能python修正-人工智能数据准备-标记数据
摘要:我们已经知道,某种格式的数据对于机器学习算法是必需的。 另一个重要的要求是,在将数据作为机器学习算法的输入发送之前,必须正确标记数据。 例如,如果所说的分类,那么数据上会有很多标记。 这些标记以文字,数字等形式存在。与sklearn中的机器学习相关的功能期望数据必须具有数字标记。 因此,如果数据是其 阅读全文

posted @ 2018-08-25 10:57 耀扬 阅读(311) 评论(0) 推荐(0)

易百教程人工智能python修正-人工智能数据准备-预处理数据
摘要:预处理数据 在我们的日常生活中,需要处理大量数据,但这些数据是原始数据。 为了提供数据作为机器学习算法的输入,需要将其转换为有意义的数据。 这就是数据预处理进入图像的地方。 换言之,可以说在将数据提供给机器学习算法之前,我们需要对数据进行预处理。 数据预处理步骤 按照以下步骤在Python中预处理数 阅读全文

posted @ 2018-08-25 10:50 耀扬 阅读(538) 评论(0) 推荐(0)

导航