摘要: 友情提示:安装目录不要有中文 1. nacos 介绍 https://nacos.io/zh-cn/docs/quick-start.html 2.安装jdk http://www.mamicode.com/info-detail-2893658.html 百度网盘:链接: https://pan. 阅读全文
posted @ 2020-12-02 17:53 罗奕涛 阅读(60) 评论(0) 推荐(0) 编辑
摘要: 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 选择 1.Hadoop平台应用 --网站用户购物行为分析 理由:想巩固下之前学的知识 二、实践方案 简要说明理由。 步骤零:实验环境准备 查看实验指南 步骤一:本地数据集上传到数据仓库Hive 查看实验指南 阅读全文
posted @ 2020-06-23 19:27 罗奕涛 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 源代码: 1 from sklearn.datasets import load_digits 2 from sklearn.preprocessing 阅读全文
posted @ 2020-06-12 08:57 罗奕涛 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。 2. 全连接神经网络与卷积神经网络的联系与区别。 卷积神经网络也是通过一层一层的节点组织起来的。和全连接神经网络一样,卷积神经网络中的每一个节点就是一个神经元。在全连接神经网 阅读全文
posted @ 2020-06-05 01:00 罗奕涛 阅读(160) 评论(0) 推荐(0) 编辑
摘要: 1.读取 源代码: #读取文件 file_path=r'D:\PycharmProjects\201706120186罗奕涛\data\SMSSpamCollection' sms=open(file_path,'r',encoding='utf-8') sms_data=[] sms_label= 阅读全文
posted @ 2020-05-21 11:26 罗奕涛 阅读(283) 评论(0) 推荐(1) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl 阅读全文
posted @ 2020-05-14 12:05 罗奕涛 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 老师:MissDu 提交作业 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类:在已知的类中自己找相似性,自动归类。(先前已有类) 聚类:在大量的数据中把相似的聚成一类。(先前未有类) 监督学习:从大量的先前知识中来判断是什么类型。( 阅读全文
posted @ 2020-05-07 11:43 罗奕涛 阅读(229) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择:相当于人为的控制一些特征里面的分布数据和大小分布,这种主成分降维就是通过数学运算,得到一个好的结果。 2、PCA:是一种分析、简化数据集的技术。可以尽可能降低原数据的维度 (复杂度),损失少量信息。 二、并用自己的话阐述出两者的主要区别 特征选择:只 阅读全文
posted @ 2020-04-30 10:06 罗奕涛 阅读(218) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 代码: from sklearn.f 阅读全文
posted @ 2020-04-27 16:46 罗奕涛 阅读(119) 评论(0) 推荐(1) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 通过正则化来防止过拟合。 通过正则化把许多隐藏的单元权重的影响消除掉,这样这个神经网络就会变成一个小网络,没有那么复杂,这样就可以防止过拟合了。 2.用logiftic回归来进行实践操作,数据不限。 import 阅读全文
posted @ 2020-04-26 17:27 罗奕涛 阅读(181) 评论(0) 推荐(0) 编辑