摘要: 1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() from sklearn.datasets import load_digits import numpy as np import pandas as 阅读全文
posted @ 2020-06-08 21:52 seele233 阅读(198) 评论(0) 推荐(0) 编辑
摘要: 1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能是目的,是结果。 深度学习、机器学习是方法、是工具。 机器学习,一种实现人工智能的方法;机器学习都可以精准地被定义为:1任务T;2.训练过程E;3.模型表现P。 深度学习则是一种实现机器学习的技术;它适合处理大数据。 深度学习使得机器学 阅读全文
posted @ 2020-06-01 11:29 seele233 阅读(139) 评论(0) 推荐(0) 编辑
摘要: 1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-05-23 21:36 seele233 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 import csv filepath = r"D:\data\SMSSpamCollection" sms = open(filepath, 'r', encoding='utf-8') csv_reader = csv.read 阅读全文
posted @ 2020-05-18 09:54 seele233 阅读(175) 评论(0) 推荐(0) 编辑
摘要: 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病 阅读全文
posted @ 2020-05-09 23:12 seele233 阅读(211) 评论(0) 推荐(0) 编辑
摘要: 一、用自己的话描述出其本身的含义: 1、特征选择 2、PCA 二、并用自己的话阐述出两者的主要区别 第一题: 特征选择:从所有特征中选取有用的特征。 PCA:通过降维,建立新特征取代部分冗余的旧特征。 第二题: 特征选择 PCA 不会改变特征值 会改变特征值 不会减少数据集的维数 可以减少数据集的维 阅读全文
posted @ 2020-04-27 21:29 seele233 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图 from sklearn.feature_selection import VarianceThre 阅读全文
posted @ 2020-04-27 10:35 seele233 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?(大家用自己的话介绍下) 2.用logiftic回归来进行实践操作,数据不限。 第一题: ①增加样本量。②对稀疏的数据进行正则化处理。③特征选择。④特征离散化。 过拟合时,拟合函数的系数往往非常大,需要顾忌每一个点,最终形成的拟合函数波动很 阅读全文
posted @ 2020-04-27 09:56 seele233 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 2.自述一下什么是过拟合和欠拟合? 3.思考一下逻辑回归的应用场景有哪些? 1.逻辑回归:逻辑回归是一种用于解决二分类问题的机器学习方法,用于估计某种事物的可能性。 线性回归 逻辑回归 要求变量服从正态分布 对变量分布没有要求 要 阅读全文
posted @ 2020-04-23 20:08 seele233 阅读(144) 评论(0) 推荐(1) 编辑
摘要: 1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题) 第一题 ①机器学习分类 ②了解回归算法 ③回归和分类的区别 ④线性回归模型 ⑤损失函数 ⑥ 阅读全文
posted @ 2020-04-21 10:58 seele233 阅读(127) 评论(0) 推荐(0) 编辑