导航

2020年6月23日

摘要: 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 选题: Hadoop 平台应用 网站用户购物行为分析 官网:http://dblab.xmu.edu.cn/post/7499/ 理由:感兴趣 意义:可以对用户购物行为进行分析 二、实践方案 个人电脑安装实 阅读全文

posted @ 2020-06-23 15:43 靓仔lay 阅读(274) 评论(0) 推荐(0) 编辑

2020年6月14日

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() #1、手写数字数据集 from sklearn.datasets import load_digits import numpy as np digit 阅读全文

posted @ 2020-06-14 15:58 靓仔lay 阅读(209) 评论(0) 推荐(0) 编辑

2020年6月7日

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。 五十年代,人工智能曾一度被极为看好。之后,人工智能的一些较小的子集发展了起来。先是机器学习,然后是深度学习。深度学习又 阅读全文

posted @ 2020-06-07 17:47 靓仔lay 阅读(162) 评论(0) 推荐(0) 编辑

2020年5月23日

摘要: 1.读取 # 1、读取数据集 def read_dataset(): file_path = r'SMSSpamCollection' sms = open(file_path, encoding='utf-8') sms_data = [] sms_label = [] csv_reader = 阅读全文

posted @ 2020-05-23 20:49 靓仔lay 阅读(219) 评论(0) 推荐(0) 编辑

2020年5月13日

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 分类就是按照数据的属性给对象贴上标签,再根据标签来分类,属于无监督学习,聚类就是指事先定义好类别,然后通过某种度量(比如距离)将他们分类。 简述什么是监督学习与无监督学习。 监督学习:利用一组已知类别的样本调整分类器的参数,使 阅读全文

posted @ 2020-05-13 16:19 靓仔lay 阅读(219) 评论(0) 推荐(0) 编辑

2020年4月30日

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择:将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA:将高维的数据映射到低维的空间中,并期望在所投影的维度上数据的信息量最大(方差最大),以此使用较少的数据维度,同 阅读全文

posted @ 2020-04-30 16:26 靓仔lay 阅读(124) 评论(0) 推荐(0) 编辑

2020年4月29日

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 阅读全文

posted @ 2020-04-29 21:47 靓仔lay 阅读(142) 评论(0) 推荐(0) 编辑

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归利用正则化防止过拟合。正则化削减了容易过拟合的那部分假设空间,从而降低过拟合风险。过拟合的时候,拟合函数的系数往往非常大,而正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况。 2. 阅读全文

posted @ 2020-04-29 14:27 靓仔lay 阅读(213) 评论(0) 推荐(0) 编辑

2020年4月25日

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 一、性质不同 1、逻辑回归:是一种广义的线性回归分析模型。 2、线性回归:利用数理统计中回归分析,来确定两种或两种以上抄变量间相互依赖的定量关系的一种统计分析方法。 二、应用不同 1、逻辑回归:常用于数据挖掘,疾病自动诊断,经济预 阅读全文

posted @ 2020-04-25 22:04 靓仔lay 阅读(129) 评论(0) 推荐(0) 编辑

2020年4月22日

摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 线性回归,顾名思义,属于回归问题。既然是回归问题,那必然属于监督学习。在这里简单再介绍一下什么是回归问题,回归用于预测输入变量和输出变量之间的关系,特别是当输入变量的值发生变化时,输出变量的值随之发生的变化。回归模型正是表 阅读全文

posted @ 2020-04-22 17:57 靓仔lay 阅读(145) 评论(0) 推荐(0) 编辑