随笔分类 -  机器学习

记录机器学习历程
摘要:1,三维转二维 用reshape()函数 举个例子A=(2,2,2)将A转换成2*4的矩阵 val(:,:,1) = 0 1 2 3 val(:,:,2) = 4 5 5 6 >> aa=reshape(A,4,2) aa = 0 4 2 5 1 5 3 6 AA=aa‘(aa的转置) AA是全部每 阅读全文
posted @ 2021-02-06 20:39 凝气强者 阅读(1535) 评论(0) 推荐(0)
摘要:特征选择原因: 冗余:部分特征的相关度高,容易消耗计算性能 噪声:部分特征对预测结果有影响 一,特征选择(过滤式) 删除低方差的特征 特征选取代码如下: from sklearn.feature_selection import VarianceThreshold def var(): """ 特征 阅读全文
posted @ 2021-01-22 22:17 凝气强者 阅读(315) 评论(0) 推荐(0)
摘要:一,归一化 处理不同特征之间数据相差不是太大的问题。 特征1 特征2 特征3 特征4 80 2 10 30 40 4 15 40 30 3 12 45 以计算80这个位置进行转换为例,特征1这一列 x‘=(80-30)/(80-30)=1 x''=1*(1-0)+0=1 故80转换化为x''=1 其 阅读全文
posted @ 2021-01-22 22:14 凝气强者 阅读(95) 评论(0) 推荐(0)
摘要:导入相关的包: 1 import numpy as np 2 #NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象和用于处理数组的例程集合组成的库。 3 import matplotlib.pyplot as plt 4 #matplotlib 阅读全文
posted @ 2021-01-21 16:23 凝气强者 阅读(94) 评论(1) 推荐(0)
摘要:一.字典特征数据抽取 把字典中一些类别数据,分别进行转换成特征数据(one-hot). 在机器学习中为了方便日后的数据处理,我们需要对数据进行抽取,如:{‘name’:'李华','age':23}这样一条数据,数据量很小,处理起来很方便,但是当数据量非常大的时候,直接处理就会显得很是耗费处理资源,所 阅读全文
posted @ 2021-01-21 16:17 凝气强者 阅读(189) 评论(0) 推荐(0)