06 2020 档案

摘要:1.手写数字数据集 from sklearn.datasets import load_digits digits = load_digits() (1)获取的数据集: (2)提取的x值: 2.图片数据预处理 x:归一化MinMaxScaler() y:独热编码OneHotEncoder()或to_ 阅读全文
posted @ 2020-06-09 09:48 WEJACKSI 阅读(197) 评论(1) 推荐(0)
摘要:1.读取 2.数据预处理 3.数据划分—训练集和测试集数据划分 from sklearn.model_selection import train_test_split x_train,x_test, y_train, y_test = train_test_split(data, target, 阅读全文
posted @ 2020-06-09 09:12 WEJACKSI 阅读(146) 评论(0) 推荐(0)
摘要:1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能最大,根本在于智能;机器学习次之,机器学习是实现人工智能的一种方法;深度学习最后,但深度学习是实现机器学习的一种核心技术。 2. 全连接神经网络与卷积神经网络的联系与区别。 卷积神经网络中的每一个节点就是一个神经元。在全连接神经网络中, 阅读全文
posted @ 2020-06-09 09:07 WEJACKSI 阅读(114) 评论(0) 推荐(0)
摘要:1. 读邮件数据集文件,提取邮件本身与标签。 列表 numpy数组 2.邮件预处理 邮件分句 句子分词 大小写,标点符号,去掉过短的单词 词性还原:复数、时态、比较级 连接成字符串 2.1 传统方法来实现 2.2 nltk库的安装与使用 pip install nltk import nltk nl 阅读全文
posted @ 2020-06-09 09:05 WEJACKSI 阅读(106) 评论(0) 推荐(0)
摘要:1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 简述什么是监督学习与无监督学习。 2.朴素贝叶斯分类算法 实例 利用关于心脏病患者的临床历史数据集,建立朴素贝叶斯心脏病分类模型。 有六个分类变量(分类因子):性别,年龄、KILLP评分、饮酒、吸烟、住院天数 目标分类变量疾病 阅读全文
posted @ 2020-06-09 09:04 WEJACKSI 阅读(152) 评论(0) 推荐(0)
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 特征选择是将高维数据映射或者转换改成低维数据,完成降维目标,通过特征选取的方式将冗余或者不相关的特征删除掉,实现进一步的降维。 2、PCA 主成分分析又叫主元分析,该方法主要的思想是通过原始特征进行变换,从而找出一组互相不相关而且重要性从小到大排列的 阅读全文
posted @ 2020-06-09 09:01 WEJACKSI 阅读(163) 评论(0) 推荐(0)
摘要:用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的 from sklearn.featu 阅读全文
posted @ 2020-06-09 09:00 WEJACKSI 阅读(165) 评论(0) 推荐(0)
摘要:1.逻辑回归是怎么防止过拟合的?为什么正则化可以防止过拟合?】 · 防止过拟合的方法: (1)增加样本量(适用任何模型)。 (2)如果数据稀疏,使用L1正则,其他情况,使用L2。 L1正则,通过增大正则项导致更多参数为0,参数系数化降低模型复杂度,从而抵抗过拟合。 L2正则,通过使得参数都趋于0,变 阅读全文
posted @ 2020-06-09 08:57 WEJACKSI 阅读(194) 评论(0) 推荐(0)
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 逻辑回归是离散选择法模型之一,属于多重变量分析范畴,是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。 逻辑回归处理的是分类问题,线性回归处理的是回归问题,这是两者最本质的区别。 2.自述一下什 阅读全文
posted @ 2020-06-09 08:55 WEJACKSI 阅读(105) 评论(0) 推荐(0)
摘要:1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性 回归算法的含义: 线性回归的含义: 2.思考线性回归算法可以用来做什么?(大家尽量不要写重复) 答:线性回归的预测模型虽然是一元(线性)方程,但现实中很多应用场景符合这个模型,例如商品的价格与商品的销量之间的关系。 3.自 阅读全文
posted @ 2020-06-09 08:53 WEJACKSI 阅读(186) 评论(0) 推荐(0)
摘要:1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 30张牌 第一次划分 第二次划分 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 源代码: from sklearn.datasets import load_iris import numpy 阅读全文
posted @ 2020-06-09 08:50 WEJACKSI 阅读(160) 评论(0) 推荐(0)
摘要:本周任务: 请确保熟悉并理解机器学习数学部分常用相关概念: 1.高等数学 1)函数 2)极限 3)导数 4)极值和最值 5)泰勒级数 6)梯度 7)梯度下降 2.线性代数 1)基本概念 2)行列式 3)矩阵 4)最小二乘法 5)向量的线性相关性 3.概率论 1)事件 2)排列组合 3)概率 4)贝叶 阅读全文
posted @ 2020-06-09 08:49 WEJACKSI 阅读(126) 评论(0) 推荐(0)
摘要:1)贴上Python环境及pip list截图,了解一下大家的准备情况。暂不具备开发条件的请说明原因及打算。 2)贴上视频学习笔记,要求真实,不要抄袭,可以手写拍照。 p1 机器学习概论 机器学习定义:给予某给定的任务T,在合理的性能度量方案P的前提下,某计算机程序可以自主学习任务T的经验E;随着提 阅读全文
posted @ 2020-06-09 08:48 WEJACKSI 阅读(192) 评论(0) 推荐(0)
摘要:词法分析程序(Lexical Analyzer)要求: - 从左至右扫描构成源程序的字符流 - 识别出有词法意义的单词(Lexemes) - 返回单词记录(单词类别,单词本身) - 滤掉空格 - 跳过注释 - 发现词法错误 程序结构: 输入:字符流(什么输入方式,什么数据结构保存) 处理: –遍历( 阅读全文
posted @ 2020-06-09 08:45 WEJACKSI 阅读(74) 评论(0) 推荐(0)
摘要:1. 梳理第二章的内容,写一篇理解与总结。 在第2章文法和语言这一章的学习中,我收获了很多。 知道了语言和编程语言的组成结构分别是:语言是句子的集合,句子由多个单词按一定的规则组成,而单词又是由多个字符按一定规则组成的。编程语言是程序的语句集合,语句是多个单词按语法规则组成,单词又是由多个字符按词法 阅读全文
posted @ 2020-06-09 08:41 WEJACKSI 阅读(95) 评论(0) 推荐(0)
摘要:1.已知文法: S->a|^|(T) T->T,S|S 分析句型(T,(^,a)),求全部的短语、直接短语和句柄。 S => (T) => (T,S) => (T,(T))=>(T,(T,S)) => (T,(T,a)) => (T,(S,a)) => (T,(^,a)) 2.构造上下文无关文法,描 阅读全文
posted @ 2020-06-09 08:39 WEJACKSI 阅读(63) 评论(0) 推荐(0)
摘要:(1)文法G(Z):Z->aZb|ab定义的是什么样的语言? 答:Z => aZb => aaZbb => aaabbb L(G[Z])={a^n*b^n|n>=1},Z可以产生aZb或者ab,是一条关于Z的规则。 (2)写出教材22页例2.2中标识符的文法四元组形式。 答:G=(VN,VT,P,S 阅读全文
posted @ 2020-06-09 08:38 WEJACKSI 阅读(62) 评论(0) 推荐(0)
摘要:(1)简述编译程序与翻译程序、汇编程序的联系与区别。 答:编译程序、翻译程序、汇编程序都是解释程序,编译程序是把高级语言源程序翻译成机器语言源程序的软件。翻译程序是先生成目标程序然后在输入、输出。编译程序和汇编程序的区别在于编译程序的源语言是诸如C、C++、Java等“高级语言”,而目标语言是诸如汇 阅读全文
posted @ 2020-06-09 08:36 WEJACKSI 阅读(99) 评论(0) 推荐(0)
摘要:1.简述人工智能、机器学习和深度学习三者的联系与区别。 人工智能包含了机器学习,机器学习包含了深度学习,其中人工智能出现得最早。举例而言,如果想让机器区分一张图片中是猫还是狗,我们可以使用人工智能来解决,那么如何区分则可以使用机器学习的方法,通过对大量猫和狗的图片数据进行学习,经过算法处理生成模型, 阅读全文
posted @ 2020-06-02 08:19 WEJACKSI 阅读(177) 评论(0) 推荐(0)