随笔分类 - 机器学习与数据挖掘
摘要:python中数据含量统计: 对于:pandas表格数据numpy的数组型数据均可以通过value_counts()函数来进行输出 pandas表格:print(data["size"].value_counts()) numpy的数组型:print(n[0].value_counts())结果输出
阅读全文
摘要:学习官网:https://scikit-learn.org(API and user guide比较重要,可以系统学习)
阅读全文
摘要:python中numpy二维数组数据删除行和列: x=np.array[[1,2,3],[1,2,3]] 二维数组数据 y=np.array[0,1] #一维数据 #删除行: x=np.delete(x,1,axis=0) y=np.delete(y,1) #删除列: x=np.delete(x,1
阅读全文
摘要:#机器学习分类算法的评价指标#二分类问题的算法评价指标import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn import datasetsd=datasets.load_digits()x=d
阅读全文
摘要:#逻辑回归算法是一个二分类的算法,但是通过变形可以解决多分类的任务#逻辑回归将数据的特征转变为数据的发生概率,然后与阈值作比较,判断是0还是1,所以也可以叫做回归算法import numpy as npimport matplotlib.pyplot as plt#定义概率转换函数sigmoid函数
阅读全文
摘要:import numpy as npimport matplotlib.pyplot as pltx=np.random.uniform(-3,3,size=100)X=x.reshape(-1,1)np.random.seed(666)y=0.5*x**2+x+2+np.random.normal
阅读全文
摘要:#PCA算法的底层原理实现import numpy as npimport matplotlib.pyplot as pltx=np.empty((100,2))np.random.seed(666)#噪声数据验证x[:,0]=np.random.uniform(0.0,100.0,size=100
阅读全文
摘要:#梯度下降法原理编写#一维函数的梯度下降方法编写import numpy as npimport matplotlib.pyplot as pltx=np.linspace(-1,6,141)y=(x-2.5)**2-1plt.plot(x,y)plt.show()def dJ(theta): re
阅读全文
摘要:#向量化运算import matplotlib as mplmpl.rcParams['agg.path.chunksize'] = 1000000import numpy as npimport matplotlib.pyplot as pltm=100x=np.random.random(siz
阅读全文
摘要:梯度下降法不是一种机器学习算法,而是一种基于搜索最优化方法,它是用来求取最大化效用函数,也可以用来最小化损失函数。
阅读全文
摘要:多元线性回归算法可以用来进行初步的数据分析,具有很好的可解释性,不需要进行数据的归一化; 另外,对于目标函数的最小化,求取模型参数,一般有两种方式:正规方程解以及梯度下降法
阅读全文
摘要:python实现KNN算法的全体流程代码#1-1KNN算法的原理底层代码import numpy as npimport matplotlib.pyplot as plt #导入相应的数据可视化模块raw_data_X=[[3.393533211,2.331273381], [3.110073483
阅读全文
摘要:import matplotlib as mplimport matplotlib.pyplot as pltimport numpy as np#绘制正常的二维曲线图像(实质是折线图)x=np.linspace(0,10,100) #x自变量的范围print(x)y=np.sin(x) #因变量的
阅读全文
摘要:#numpy.array基础模块介绍与使用import numpyimport numpy as np #导入numpy模块print(np.__version__) #输出numpy的版本# 将列表转换为二维数组mxn数组L=[[1,2,3],[1,3,1]] #先定义好list列表,将其转换为n
阅读全文

浙公网安备 33010602011771号