董星辉

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2020年6月23日

摘要: 一、选题与意义 1.选题:Kaggle分析数据项目:泰坦尼克号:从灾难中学习 2.理由和意义:一:因为第一题需要构建很多镜像和平台,很难预测是否会在安装中报错等等,而且hadoop太久没用过了。第二题的话,所需的软件和环境都以及布置完成了,不需要再去构建。 二:更喜欢Kaggle分析数据 二、实践方 阅读全文
posted @ 2020-06-23 21:08 D2012 阅读(153) 评论(0) 推荐(0) 编辑

2020年6月14日

摘要: 1 阅读全文
posted @ 2020-06-14 17:30 D2012 阅读(79) 评论(0) 推荐(0) 编辑

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu 阅读全文
posted @ 2020-06-14 17:27 D2012 阅读(118) 评论(0) 推荐(0) 编辑

摘要: 机器学习作业8--特征选择 : https://www.cnblogs.com/dongxinghui/p/13125729.html 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from skl 阅读全文
posted @ 2020-06-14 17:20 D2012 阅读(150) 评论(0) 推荐(0) 编辑

2020年6月7日

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别 如上图,人工智能是最早出现的,也是最大、最外侧的同心圆;其次是机器学习,稍晚一点;最内侧,是深度学习,当今人工智能大爆炸的核心驱动。人工智能的一些较小的子集发展了起来。先是机器学习,然后是深度学习。深度学习又是机器学习的子集。 2. 全连接神经网 阅读全文
posted @ 2020-06-07 20:14 D2012 阅读(109) 评论(0) 推荐(0) 编辑

2020年5月23日

摘要: 1读取 file_path = r'C:\Users\jiqixuexi\SMSSpamCollection'sms = open(file_path, 'r', encoding='utf-8')sms_data = []sms_label = []csv_reader = csv.reader( 阅读全文
posted @ 2020-05-23 00:56 D2012 阅读(127) 评论(0) 推荐(0) 编辑

2020年5月17日

摘要: 1 阅读全文
posted @ 2020-05-17 15:35 D2012 阅读(100) 评论(0) 推荐(0) 编辑

2020年5月13日

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 联系:分类与聚类都是通过预处理使得数据能基于一个分析目标而被整理。 区别:分类是有监督,靠的是学习; 聚类无监督,靠的是启发式搜索。 简述什么是监督学习与无监督学习。 有监督学习:使用的是有标签的数据(即实现分好类了) 无监督 阅读全文
posted @ 2020-05-13 21:15 D2012 阅读(114) 评论(0) 推荐(0) 编辑

2020年4月29日

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 1. 增加样本量; 2. 通过特征选择,剔除一些不重要的特征,从而降低模型复杂度。3. 检查业务逻辑;4.进行离散化处理,所有特征都离散化。 正则化是通过约束参数的范数使其不要太大,所以可以在一定程度上减少过拟合情 阅读全文
posted @ 2020-04-29 20:37 D2012 阅读(128) 评论(0) 推荐(0) 编辑

2020年4月25日

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? (1)什么是逻辑回归? 逻辑回归是一种有监督的统计学习方法,主要用于对样本进行分类。 (2)与线性回归对比,有什么不同? 线性回归是解决回归问题。 结果是连续型。 逻辑回归是分类问题,不是回归问题,结果是离散型,主要解决二分类问题 阅读全文
posted @ 2020-04-25 11:20 D2012 阅读(174) 评论(0) 推荐(0) 编辑