随笔分类 -  深度学习&机器学习&机器学习 / 机器学习

sklearn数据处理,特征工程,各种基础算法
摘要:# 1.什么是特征降维 >降低的对象为二维数组 此处的降维为**降低特征**的个数 **降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程** ![image](https://img2023.cnblogs.com/blog/1914163/202306/19141 阅读全文
posted @ 2023-06-10 11:53 lipu123 阅读(363) 评论(0) 推荐(0)
摘要:# 1.数据集 **学习是可能用到的数据集** >训练集分为训练集和测试集 Kaggle https://www.kaggle.com/datasets 大数据竞赛平台 80 万科学家 真实数据 数据量巨大 UCI http://archive.ics.uci.edu/ml/ 收录了 559 个数据 阅读全文
posted @ 2023-06-09 22:11 lipu123 阅读(193) 评论(0) 推荐(0)
摘要:# 1 数据预处理 > **数据预处理是通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程** 例如: ![image](https://img2023.cnblogs.com/blog/1914163/202306/1914163-20230612105841612-156821624 阅读全文
posted @ 2023-06-08 22:43 lipu123 阅读(1004) 评论(0) 推荐(0)
摘要:# 1.为什么要特征工程 >**业界广泛流传∶数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。** # 2.什么是特征工程 > 意义:会直接影响机器学习的效果 sklearn 特征工程 pandas 数据清洗、数据处理 应用 DictVectorizer 实现对类别特征进行数值化、 阅读全文
posted @ 2023-06-08 09:17 lipu123 阅读(120) 评论(0) 推荐(0)
摘要:一:图像领域 包括人脸识别,街道交通信号识别 二:自然语言识别(NPL) 机器学习定义: 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。 数据集的构成:特征值+目标值 机器学习的分类:1.监督学习(有一个目标的) 目标值:类别--分类问题(比如说识别猫狗,目标是一个类别) 目标值 阅读全文
posted @ 2023-06-06 21:03 lipu123 阅读(61) 评论(0) 推荐(0)