随笔分类 -  机器学习与数据挖掘

摘要:python中数据含量统计: 对于:pandas表格数据numpy的数组型数据均可以通过value_counts()函数来进行输出 pandas表格:print(data["size"].value_counts()) numpy的数组型:print(n[0].value_counts())结果输出 阅读全文
posted @ 2020-03-25 12:21 The-Chosen-One 阅读(2354) 评论(0) 推荐(0)
该文被密码保护。
posted @ 2020-03-21 18:26 The-Chosen-One 阅读(0) 评论(0) 推荐(0)
摘要:学习官网:https://scikit-learn.org(API and user guide比较重要,可以系统学习) 阅读全文
posted @ 2020-03-21 18:22 The-Chosen-One 阅读(416) 评论(0) 推荐(0)
摘要:python中numpy二维数组数据删除行和列: x=np.array[[1,2,3],[1,2,3]] 二维数组数据 y=np.array[0,1] #一维数据 #删除行: x=np.delete(x,1,axis=0) y=np.delete(y,1) #删除列: x=np.delete(x,1 阅读全文
posted @ 2020-03-20 18:35 The-Chosen-One 阅读(4298) 评论(0) 推荐(2)
摘要:#机器学习分类算法的评价指标#二分类问题的算法评价指标import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn import datasetsd=datasets.load_digits()x=d 阅读全文
posted @ 2020-03-19 18:46 The-Chosen-One 阅读(1743) 评论(0) 推荐(0)
摘要:#逻辑回归算法是一个二分类的算法,但是通过变形可以解决多分类的任务#逻辑回归将数据的特征转变为数据的发生概率,然后与阈值作比较,判断是0还是1,所以也可以叫做回归算法import numpy as npimport matplotlib.pyplot as plt#定义概率转换函数sigmoid函数 阅读全文
posted @ 2020-03-19 18:42 The-Chosen-One 阅读(934) 评论(0) 推荐(0)
摘要:import numpy as npimport matplotlib.pyplot as pltx=np.random.uniform(-3,3,size=100)X=x.reshape(-1,1)np.random.seed(666)y=0.5*x**2+x+2+np.random.normal 阅读全文
posted @ 2020-03-18 22:08 The-Chosen-One 阅读(1405) 评论(0) 推荐(0)
摘要:#PCA算法的底层原理实现import numpy as npimport matplotlib.pyplot as pltx=np.empty((100,2))np.random.seed(666)#噪声数据验证x[:,0]=np.random.uniform(0.0,100.0,size=100 阅读全文
posted @ 2020-03-18 22:05 The-Chosen-One 阅读(766) 评论(0) 推荐(0)
摘要:#梯度下降法原理编写#一维函数的梯度下降方法编写import numpy as npimport matplotlib.pyplot as pltx=np.linspace(-1,6,141)y=(x-2.5)**2-1plt.plot(x,y)plt.show()def dJ(theta): re 阅读全文
posted @ 2020-03-17 23:50 The-Chosen-One 阅读(1204) 评论(0) 推荐(0)
摘要:#向量化运算import matplotlib as mplmpl.rcParams['agg.path.chunksize'] = 1000000import numpy as npimport matplotlib.pyplot as pltm=100x=np.random.random(siz 阅读全文
posted @ 2020-03-17 23:46 The-Chosen-One 阅读(1268) 评论(0) 推荐(0)
摘要:梯度下降法不是一种机器学习算法,而是一种基于搜索最优化方法,它是用来求取最大化效用函数,也可以用来最小化损失函数。 阅读全文
posted @ 2020-03-17 23:43 The-Chosen-One 阅读(188) 评论(0) 推荐(0)
摘要:多元线性回归算法可以用来进行初步的数据分析,具有很好的可解释性,不需要进行数据的归一化; 另外,对于目标函数的最小化,求取模型参数,一般有两种方式:正规方程解以及梯度下降法 阅读全文
posted @ 2020-03-17 12:48 The-Chosen-One 阅读(655) 评论(0) 推荐(0)
摘要:python实现KNN算法的全体流程代码#1-1KNN算法的原理底层代码import numpy as npimport matplotlib.pyplot as plt #导入相应的数据可视化模块raw_data_X=[[3.393533211,2.331273381], [3.110073483 阅读全文
posted @ 2020-03-16 21:14 The-Chosen-One 阅读(1066) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-03-16 21:06 The-Chosen-One 阅读(210) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2020-03-16 20:58 The-Chosen-One 阅读(148) 评论(0) 推荐(0)
摘要:import matplotlib as mplimport matplotlib.pyplot as pltimport numpy as np#绘制正常的二维曲线图像(实质是折线图)x=np.linspace(0,10,100) #x自变量的范围print(x)y=np.sin(x) #因变量的 阅读全文
posted @ 2020-03-15 19:13 The-Chosen-One 阅读(390) 评论(0) 推荐(0)
摘要:#numpy.array基础模块介绍与使用import numpyimport numpy as np #导入numpy模块print(np.__version__) #输出numpy的版本# 将列表转换为二维数组mxn数组L=[[1,2,3],[1,3,1]] #先定义好list列表,将其转换为n 阅读全文
posted @ 2020-03-15 19:06 The-Chosen-One 阅读(802) 评论(0) 推荐(0)