kzg

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2020年6月23日

摘要: 一、选题与意义 1.Hadoop平台应用 2.Kaggle分析数据项目 简要说明理由与意义。 二、实践方案 简要说明理由。 第一题,简单适合我。 三、实践任务分解 根据所选的题目,明确实验步骤,分解任务到每天。 四、实践计划 按任务分解撰写计划表,每天按计划表开展工作。 第天根据实际情况更新计划表, 阅读全文
posted @ 2020-06-23 17:29 kzg 阅读(160) 评论(0) 推荐(0) 编辑

2020年6月12日

摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_categorical 训练集测试集划分 阅读全文
posted @ 2020-06-12 22:47 kzg 阅读(918) 评论(0) 推荐(0) 编辑

2020年6月5日

摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是目的,机器学习是方式,深度学习技术。 2. 全连接神经网络与卷积神经网络的联系与区别。 卷积神经网络也是通过一层一层的节点组织起来的。和全连接神经网络一样,卷积神经网络中的每一个节点就是一个神经元。在全连接神经网络中,每相邻两层之间的 阅读全文
posted @ 2020-06-05 21:37 kzg 阅读(102) 评论(0) 推荐(0) 编辑

2020年5月23日

摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-23 21:36 kzg 阅读(127) 评论(0) 推荐(0) 编辑

2020年5月15日

摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl 阅读全文
posted @ 2020-05-15 22:04 kzg 阅读(191) 评论(0) 推荐(0) 编辑

2020年5月7日

摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 分类与聚类都是分开几类,分类是根据历史经验,已知类别,监督学习,聚类是自己分析现有数据,无监督学习 监督学习利用历史数据分类,把已有数据代入。无监督学习是没有样本,将已有数据分类 2.朴素贝叶 阅读全文
posted @ 2020-05-07 12:13 kzg 阅读(177) 评论(0) 推荐(0) 编辑

2020年4月30日

摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 根据自身选择,筛选对应的数据 2、PCA 主成分分析,机器自动筛选,应用于特征成百上千的时候,数据改变,特征数量减少 二、并用自己的话阐述出两者的主要区别 特征选择是人为主观意识筛选,而PCA是通过机器自动筛选 特征选择后数据不会改变,PCA降维后数 阅读全文
posted @ 2020-04-30 10:18 kzg 阅读(162) 评论(0) 推荐(0) 编辑

2020年4月27日

摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 阅读全文
posted @ 2020-04-27 16:27 kzg 阅读(139) 评论(0) 推荐(0) 编辑

2020年4月26日

摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 将多余特征前的系数无限接近于0,使得多余特征无影响。 2.用logiftic回归来进行实践操作,数据不限。 阅读全文
posted @ 2020-04-26 16:27 kzg 阅读(130) 评论(0) 推荐(0) 编辑

2020年4月25日

摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 处理分类问题,与线性回归相比,线性回归是连续型,损失函数不一样,只能通过梯度下降求解。 2.自述一下什么是过拟合和欠拟合? 过拟合是过度寻找特征,欠拟合是特征太少。 3.思考一下逻辑回归的应用场景有哪些? 网上医生断症,将城市分类 阅读全文
posted @ 2020-04-25 10:14 kzg 阅读(121) 评论(0) 推荐(0) 编辑