2020年6月23日

摘要: 老师:MissDu 提交作业 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 二、实践方案 简要说明理由。 三、实践任务分解 根据所选的题目,明确实验步骤,分解任务到每天。 四、实践计划 按任务分解撰写计划表,每天按计划表开展工作。 第天根据实际情况更 阅读全文
posted @ 2020-06-23 19:41 邓伟江 阅读(228) 评论(0) 推荐(0) 编辑

2020年6月15日

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 2.自述一下什么是过拟合和欠拟合? 3.思考一下逻辑回归的应用场景有哪些? 1. 逻辑回归:是一种广义的线性回归分析模型,要求因变量必须是连续性数据变量。常用于数据挖掘,疾病自动诊断,经济预测等领域。 线性回归:利用数理统计中回归 阅读全文
posted @ 2020-06-15 18:41 邓伟江 阅读(142) 评论(0) 推荐(0) 编辑

2020年6月14日

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
posted @ 2020-06-14 15:25 邓伟江 阅读(102) 评论(0) 推荐(0) 编辑

2020年6月7日

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 2. 全连接神经网络与卷积神经网络的联系与区别。 3.理解卷积计算。 以digit0为例,进行手工演算。 from sklearn.datasets import load_digits #小数据集8*8 digits = load_digit 阅读全文
posted @ 2020-06-07 21:30 邓伟江 阅读(120) 评论(0) 推荐(0) 编辑

2020年5月23日

摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-23 17:40 邓伟江 阅读(106) 评论(0) 推荐(0) 编辑

2020年5月13日

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病 阅读全文
posted @ 2020-05-13 20:39 邓伟江 阅读(145) 评论(0) 推荐(0) 编辑

2020年5月4日

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 二、并用自己的话阐述出两者的主要区别 阅读全文
posted @ 2020-05-04 19:39 邓伟江 阅读(119) 评论(0) 推荐(0) 编辑

2020年4月29日

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 2.用logiftic回归来进行实践操作,数据不限。 阅读全文
posted @ 2020-04-29 21:30 邓伟江 阅读(136) 评论(0) 推荐(0) 编辑

2020年4月22日

摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题) 阅读全文
posted @ 2020-04-22 21:06 邓伟江 阅读(104) 评论(0) 推荐(0) 编辑

2020年4月18日

摘要: 1. 应用K-means算法进行图片压缩 读取一张图片 观察图片文件大小,占内存大小,图片数据结构,线性化 用kmeans对图片像素颜色进行聚类 获取每个像素的颜色类别,每个类别的颜色 压缩图片生成:以聚类中收替代原像素颜色,还原为二维 观察压缩图片的文件大小,占内存大小 2. 观察学习与生活中可以 阅读全文
posted @ 2020-04-18 21:51 邓伟江 阅读(69) 评论(0) 推荐(0) 编辑