随笔分类 - 人工智能与机器学习
摘要:1、k近邻算法是学习机器学习算法最为经典和简单的算法,它是机器学习算法入门最好的算法之一,可以非常好并且快速地理解机器学习的算法的框架与应用。它是一种经典简单的分类算法,当然也可以用来解决回归问题。2、kNN机器学习算法具有以下的特点:(1)思想极度简单(2)应用的数学知识非常少(3)解决相关问题的
阅读全文
摘要:多元线性回归算法和正规方程解 ——燕江依/2019.08.05 1、对于多元线性回归算法,它对于数据集具有较好的可解释性,我们可以对比不过特征参数的输出系数的大小来判断它对数据的影响权重,进而对其中隐含的参数进行扩展和收集,提高整体训练数据的准确性。 2、对于KNN算法和多元线性回归算法对比可以知道
阅读全文
摘要://2019.08.04#线性回归算法基础入门(Linear Regression)1、线性回归算法是一种非常典型的解决回归问题的监督学习算法,它具有以下几个特点:(1)典型的回归算法,可以解决实际中的回归问题;(2)思想简单,容易实现;(3)是许多强大的非线性算法模型的基础;(4)结果具有很好的可
阅读全文
摘要:Python如何输出矩阵的行数与列数? 对于pyhton里面所导入或者定义的矩阵或者表格数据,想要获得矩阵的行数和列数有以下方法: 1、利用shape函数输出矩阵的行和列 x.shape函数可以输出一个元组(m,n),其中元组的第一个数m表示矩阵的行数,元组的第二个数n为矩阵的列数 具体代码如下:
阅读全文
摘要:最小二乘法的数学原理推导(机器学习线性回归) ——燕江依/2019.08.04 对于简单线性回归问题,即数据特征只有一个的基础数据集,要使得损失函数(这里是指真值与预测值之间误差的平方)最小,从而求得最优化的参数a和b,这个具体方法称为最小二乘法,利用最小二乘法,可以得到最佳的参数a和b的计算式,如
阅读全文
摘要://2019.08.03晚#k-近邻算法的拓展思考与总结1、k-近邻算法是一种非常典型的分类监督学习算法,它可以解决多分类的问题;另外,它的整体思想简单,效果强大。它也可以用来解决回归问题,使用的库函数为KNeighborsRegressor 2、k-近邻算法虽然可以很好地解决多分类问题,但是它也有
阅读全文
摘要://2019.08.03下午#机器学习算法的数据归一化(feature scaling)1、数据归一化的必要性:对于机器学习算法的基础训练数据,由于数据类型的不同,其单位及其量纲也是不一样的,而也正是因为如此,有时它会使得训练集中每个样本的不同列数据大小差异较大,即数量级相差比较大,这会导致在机器学
阅读全文
摘要:1、机器学习算法的整体使用步骤如下: (1)从scikitlearn库中调用相应的机器学习算法模块;(2)输入相应的算法参数定义一个新的算法;(3)输入基础训练数据集利用scaler对其进行数据归一化处理 (4)对于归一化的数据集进行机器学习算法的训练fit过程;(5)输入测试数据集对其结果进行预测
阅读全文
摘要:机器学习算法参数的网格搜索实现: //2019.08.031、scikitlearn库中调用网格搜索的方法为:Grid search,它的搜索方式比较统一简单,其对于算法批判的标准比较复杂,是一种复合交叉批判方式,不仅仅是准确率。其具体的实现方式如下(以KNN算法的三大常用超参数为例):#使用sci
阅读全文
摘要://2019.08.02下午#机器学习算法中的超参数与模型参数1、超参数:是指机器学习算法运行之前需要指定的参数,是指对于不同机器学习算法属性的决定参数。通常来说,人们所说的调参就是指调节超参数。2、模型参数:是指算法在使用过程中需要学习得到的参数,即输入与输出之间映射函数中的参数,它需要通过对于训
阅读全文
摘要:1、k近邻算法可以说是唯一一个没有训练过程的机器学习算法,它含有训练基础数据集,但是是一种没有模型的算法,为了将其和其他算法进行统一,我们把它的训练数据集当做它的模型本身。2、在scikitlearn中调用KNN算法的操作步骤如下(利用实际例子举例如下):#1导入相应的数据可视化模块import n
阅读全文
摘要:sklearn之train_test_split()函数各参数含义(非常全) 在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,从 sklearn.model_selection 中调用train_test_split 函数 简单用法如下: X_train,X_test, y_t
阅读全文
摘要://2019.08.01下午机器学习算法1——k近邻算法1、k近邻算法是学习机器学习算法最为经典和简单的算法,它是机器学习算法入门最好的算法之一,可以非常好并且快速地理解机器学习的算法的框架与应用。2、kNN机器学习算法具有以下的特点:(1)思想极度简单(2)应用的数学知识非常少(3)解决相关问题的
阅读全文
摘要://2019.08.01机器学习基础入门1-21、半监督学习的数据特征在于其数据集一部分带有一定的"标记"和或者"答案",而另一部分数据没有特定的标记,而更常见的半监督学习数据集产生的原因是各种原因引起的数据缺失。2、半监督学习的数据集处理方式大多采用:先用无监督学习算法对数据进行相关的处理,再利用
阅读全文
摘要:机器学习入门介绍(非常易懂) //2019.07.31早上机器学习基本概念介绍1、机器学习的含义在于让机器去学习,其核心在于学习。 2、最早的机器学习应用是在垃圾邮件的分辨,它开启了机器学习的领域和时代 3、机器学习的典型应用主要体现在以下几个方面:(1)图像识别(2)语音识别(3)数字识别(4).
阅读全文
摘要://2019.07.29-301、Keras 是提供一些高度可用神经网络框架的 Python API ,能帮助你快速的构建和训练自己的深度学习模型,它的后端是 TensorFlow 或者 Theano 。 2、Keras 被认为是构建神经网络的未来,以下是一些它流行的原因:(1)轻量级和快速开发:K
阅读全文
摘要:Python Sklearn.metrics 简介及应用示例 利用Python进行各种机器学习算法的实现时,经常会用到sklearn(scikit-learn)这个模块/库。 无论利用机器学习算法进行回归、分类或者聚类时,评价指标,即检验机器学习模型效果的定量指标,都是一个不可避免且十分重要的问题。
阅读全文
摘要://2019.07.26#scikit-learn数据挖掘工具包1、Scikit learn是基于python的数据挖掘和机器学习的工具包,方便实现数据的数据分析与高级操作,是数据分析里面非常重要的工具包。2、Scikit Learn是数据挖掘重要的工具包,其官网为http://scikit-lea
阅读全文
摘要:metrics.png wiki.png 机器学习度量指标 分类评估指标 TN TP FN FP TP:预测为正向(P),实际上预测正确(T),即判断为正向的正确率 TN:预测为负向(N),实际上预测正确(T),即判断为负向的正确率 FP:预测为正向(P),实际上预测错误(F),误报率,即把负向判断
阅读全文
摘要:python中numpy矩阵运算操作大全(非常全) //2019.07.10晚python矩阵运算大全1、矩阵的输出形式:对于任何一个矩阵,python输出的模板是:import numpy as np #引入numpy模块np1=np.array([[1,2,3],[1,3,4],[1,6,2].
阅读全文

浙公网安备 33010602011771号