摘要: 一、选题与意义 Hadoop平台应用 简要说明理由与意义。 还要在十天左右做一个项目出来,只能选择hadoop了。 二、实践方案 简要说明理由。 步骤零:实验环境准备 所需知识储备 Windows操作系统、Linux操作系统、大数据处理架构Hadoop的关键技术及其基本原理、列族数据库HBase概念 阅读全文
posted @ 2020-06-23 19:39 Wu。 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
posted @ 2020-06-14 21:26 Wu。 阅读(172) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能:它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 机器学习:它是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性 阅读全文
posted @ 2020-06-07 19:37 Wu。 阅读(124) 评论(0) 推荐(1) 编辑
摘要: 1.读取 file_path = r"E:\da3xia\jiqixuexi\SMSSpamCollection" sms = open(file_path, 'r', encoding='utf-8') sms_data = [] sms_lable = [] csv_reader = csv.r 阅读全文
posted @ 2020-05-23 21:05 Wu。 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl 阅读全文
posted @ 2020-05-17 21:30 Wu。 阅读(536) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 答:分类指监督学习,就是按照某种标准给对象贴标签,再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。指无监督学习。 区别是,分类是事先定义好类别 阅读全文
posted @ 2020-05-13 22:00 Wu。 阅读(168) 评论(0) 推荐(1) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA 将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主元,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。 二、并用自己的话阐述出两者的主要区 阅读全文
posted @ 2020-05-04 19:31 Wu。 阅读(134) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 逻辑回归是用正则化来防止过拟合的, 正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情况。 2.用logiftic回归来进行实践操作,数据不限 from sklearn.datasets im 阅读全文
posted @ 2020-04-29 21:09 Wu。 阅读(180) 评论(0) 推荐(1) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。 逻辑回归处理的是分类问题,线性回归处理的是回归问题,这是两者最本质的区别。 2.自述一下什 阅读全文
posted @ 2020-04-25 22:21 Wu。 阅读(152) 评论(0) 推荐(0) 编辑
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 线性回归,就是能够用一个直线较为精确地描述数据之间的关系。这样当出现新的数据的时候,就能够预测出一个简单的值。线性回归中最常见的就是房价的问题。一直存在很多房屋面积和房价的数据 2.思考线性回归算法可以用来做什么?(大家尽 阅读全文
posted @ 2020-04-22 21:33 Wu。 阅读(141) 评论(0) 推荐(1) 编辑