博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2020年6月23日

摘要: 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 答:选第二题的泰坦尼克号生存预测。选择这一题的原因是电脑配置不行,运行虚拟机很卡,也不能运行太大的数据,所以就选择了这个适中的项目。 二、实践方案 简要说明理由。 答:在kaggle中下载泰坦尼克号的生存数 阅读全文

posted @ 2020-06-23 19:14 马淳丰 阅读(201) 评论(0) 推荐(0) 编辑

2020年6月14日

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 实验代码: 1 import matplotlib.pyplot as plt 2 import numpy as np 3 from sklearn. 阅读全文

posted @ 2020-06-14 15:43 马淳丰 阅读(224) 评论(0) 推荐(0) 编辑

2020年6月5日

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 答:人工智能包含了机器学习,机器学习包含了深度学习,其中人工智能出现得最早。 2. 全连接神经网络与卷积神经网络的联系与区别。 答: 除了结构相似,卷积神经网络的输入输出以及训练的流程和全连接神经网络也基本一致,类似的,全连接神经网络的损失函数 阅读全文

posted @ 2020-06-05 00:18 马淳丰 阅读(213) 评论(0) 推荐(0) 编辑

2020年5月21日

摘要: 1.读取 1 # 1、导入数据 2 file_path = r"C:\Users\23625\Desktop\机器学习\项目\data\SMSSpamCollection" 3 sms = open(file_path, 'r', encoding='utf-8') 4 sms_data = [] 阅读全文

posted @ 2020-05-21 14:42 马淳丰 阅读(350) 评论(0) 推荐(0) 编辑

2020年5月14日

摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 实验代码为: 1 import csv 2 file_path = r"C:\Users\23625\Desktop\机器学习\项目\data\SMSSpamCollection" 3 sms = open(file_path, ' 阅读全文

posted @ 2020-05-14 17:21 马淳丰 阅读(257) 评论(0) 推荐(0) 编辑

2020年5月7日

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答: 分类:按照某种标准给对象贴标签,再根据标签来区分归类。 聚类:事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。 简单来说,分类就是向事物分配标签,聚类就是将相似的事物 阅读全文

posted @ 2020-05-07 21:18 马淳丰 阅读(205) 评论(0) 推荐(0) 编辑

2020年4月30日

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 答:特征选择:选择部分特征当做机器学习的相关数据。特征选择能剔除不相关(irrelevant)或冗余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。 PCA是找出数据里最主要的方面,用数据里最主要 阅读全文

posted @ 2020-04-30 11:29 马淳丰 阅读(156) 评论(0) 推荐(0) 编辑

2020年4月29日

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 实验代码: 1 # 特征选择--删除 阅读全文

posted @ 2020-04-29 12:30 马淳丰 阅读(109) 评论(0) 推荐(0) 编辑

2020年4月27日

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 答:算法上可以使用正则化;数据上可以加大样本量和通过特征选择减少特征量。 正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况。 2.用logiftic回归来进行实践操作,数据不限。 实验代码 阅读全文

posted @ 2020-04-27 12:16 马淳丰 阅读(196) 评论(0) 推荐(0) 编辑

2020年4月24日

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是机器学习中的一种分类模型,逻辑回归是一种二分类算法,虽然名字中带有回归,与回归之间有一定的联系,但不是回归算法。 逻辑回归的数学表达模型: 逻辑回归模型是具有一定数量的固定数量参数的模型,这取决于输入特征的数量。逻辑回归 阅读全文

posted @ 2020-04-24 17:38 马淳丰 阅读(226) 评论(0) 推荐(0) 编辑