随笔分类 - 机器学习
摘要:1、聚类-Kmeans算法应用 观察学习与生活中可以用K均值解决的问题,从数据-模型训练-测试-预测完整地完成一个应用案例。 这是从网上摘录的数据--地址:https://www.scoregg.com/data/player?tournamentID=169 数据背景:2020英雄联盟季中杯挑战赛
阅读全文
摘要:1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:
阅读全文
摘要:1.简述人工智能、机器学习和深度学习三者的联系与区别。 ①人工智能 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以 人类智能相似的方式做出反应的智能机器,该领域的研究包括语音识别、图像识别、 机器人、自然语言处理、智能搜索和专家系统等。人工智能可以对人的意识、思维的 信息
阅读全文
摘要:1.读取 #1.读取数据集 def read_dataset(): file_path = r'D:\SMSSpamCollection.txt' sms = open(file_path, encoding='utf-8') sms_data = [] sms_label = [] csv_rea
阅读全文
摘要:1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv file_path =r"SMSSpamCollection" sms= open(file_path,'r',encoding='utf-8') data=csv.reader(sms,delimiter =
阅读全文
摘要:1.理解分类与监督学习、聚类与无监督学习。简述分类与聚类的联系与区别。简述什么是监督学习与无监督学习。 联系:分类与聚类都是在数据集中寻找离自己最近的点 区别:分类是一种有监督学习,目的是为了确定点的类别,而类别是已知的;聚类是一种无监督学习,目的是将点分为成若干个类,事先是没有类别的。 监督学习:
阅读全文
摘要:一、用自己的话描述出其本身的含义: 1、特征选择:从一组特征中挑选出一些最有效的特征来降低特征空间维数。去除不相关的特征,可以降低学习任务的难度,只留下关键特征,往往可以更容易看清真相。 2、PCA:主成分分析PCA是一种分析、简化数据集的技术,经常用于减少数据集的维数,同时保持数据集中的对方差贡献
阅读全文
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3],[0,1,4,3],[0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.feature
阅读全文
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 1)减少数量特征或正则化 2)正则化不需减少数量特征,只需要通过减小特征变量的数量级使他们接近于0.这样子就可以形成一个类似二元的多元函数。 2.用logiftic回归来进行实践操作,数据不限。 import pa
阅读全文
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归:一种有监督的统计学习方法,主要用于对样本进行分类。 线性回归:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法 对比:逻辑回归也被称为广义线性回归模型,它与线性回归模型的形式基本上相
阅读全文
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 机器学习的分类: 回归算法概括: 回归与分类的区别: 线性关系的概念: 一些常用到的方程或函数: 课堂示例的代码: import random import matplotlib.pyplot as plt xs = [0
阅读全文
摘要:1.应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 #导入所需要用到的包 fro
阅读全文
摘要:1. 机器学习的步骤 数据,模型选择,训练,测试,预测 2. 安装机器学习库sklearn pip list 查看版本 python -m pip install --upgrade pip pip install -U scikit-learn pip uninstall sklearn pip
阅读全文
摘要:本周任务: 请确保熟悉并理解机器学习数学部分常用相关概念: 1.高等数学 1)函数 2)极限 3)导数 4)极值和最值 5)泰勒级数 6)梯度 7)梯度下降 2.线性代数 1)基本概念 2)行列式 3)矩阵 4)最小二乘法 5)向量的线性相关性 3.概率论 1)事件 2)排列组合 3)概率 4)贝叶
阅读全文
摘要:1.python基础的准备 本课程拟采用Python做为机器算法应用的实现语言,所以请确保: 1)安装好Python开发环境, PyCharm 或 Anaconda等都可以,按个人习惯喜好。 2)基本库的安装,如numpy、pandas、scipy、matplotlib 3)具备一定的Python编
阅读全文

浙公网安备 33010602011771号