摘要: 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 我选择的题目是Kaggle分析数据项目——通过推文预测灾难是否发生。首先是因为太久没接触过Hadoop平台了,而且不知道安装的时候还会不会出现一些难以解决的问题,再加上这学期学习了机器学习这门课程,所需的环 阅读全文
posted @ 2020-06-23 17:48 Seraooo 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 导入数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据 阅读全文
posted @ 2020-06-11 11:42 Seraooo 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 答: 联系:机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。 人工智能包含了机器学习,机器学习包含了深度学习,其中人工智能出现得最早。 区别:机器学习和深度学习的区别是,机器学习大部分算法需要人类自己寻找特征,而深度学习可以 阅读全文
posted @ 2020-06-06 16:09 Seraooo 阅读(165) 评论(0) 推荐(0) 编辑
摘要: 1.读取 file_path = r'C:\Users\86186\Desktop\大三下\机器学习\SMSSpamCollection' sms = open(file_path, 'r', encoding='utf-8') sms_data = [] sms_label = [] csv_re 阅读全文
posted @ 2020-05-23 14:53 Seraooo 阅读(181) 评论(0) 推荐(0) 编辑
摘要: nltk库的安装与使用 import nltk print(nltk.__doc__) 2.1 nltk库 分词 nltk.sent_tokenize(text) #对文本按照句子进行分割 nltk.word_tokenize(sent) #对句子进行分词 2.2 punkt 停用词 from nl 阅读全文
posted @ 2020-05-14 22:27 Seraooo 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 区别: 分类是为了确定点的类别,具体有哪些类别是已知的,是监督学习。 聚类是把点成若干类,事先是没有类别的,是一种无监督学习。 联系: 都是为了把点进行一种归类 监督学习:从正确的例子中进行的 阅读全文
posted @ 2020-05-13 11:22 Seraooo 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 特征选择就是,一个学习任务会有很多属性,属性就是特征,有些无关紧要,有些很有用,一般是选择有用的特征就行数据分析与学习。 PCA就是,将特性明显的,较为重要的信息保留下来。 二、并用自己的话阐述出两者的主要区别 特征选择就是,从海量的数据 阅读全文
posted @ 2020-05-01 19:04 Seraooo 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 实验结果如图: 代码如下 from 阅读全文
posted @ 2020-04-29 10:28 Seraooo 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归在算法层面是通过正则化来防止过拟合的,因为正则化是通过约束参数的范数使其不要太大,所以能够防止过拟合。 2.用logiftic回归来进行实践操作,数据不限。 import pandas as pd impo 阅读全文
posted @ 2020-04-27 11:57 Seraooo 阅读(216) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是一种用来解决二分类问题的机器学习方法,用来估计某种事物发生得到可能性,它与线性回归的区别就是它是是一种广义的线性回归分析模型,而逻辑回归多是通过数理统计分析两种或两种以上变量间的依赖关系。 即线性回归偏向于通过分析两种或 阅读全文
posted @ 2020-04-24 14:19 Seraooo 阅读(183) 评论(0) 推荐(0) 编辑