随笔分类 - 机器学习
摘要:1.读取 2.数据预处理 词性还原 def get_wordnet_pos(treebank_tag): if treebank_tag.startswith('J'): return nltk.corpus.wordnet.ADJ elif treebank_tag.startswith('V')
阅读全文
摘要:朴素贝叶斯垃圾邮件分类 1. 读邮件数据集文件,提取邮件本身与标签。 2.邮件预处理 2.1传统方法 2.1 nltk库 分词 nltk.sent_tokenize(text) 对文本按照句子进行分割 nltk.word_tokenize(sent) 对句子进行分词 2.2 punkt 停用词 fr
阅读全文
摘要:11.分类与监督学习,朴素贝叶斯分类算法 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 答:分类指监督学习,就是按照某种标准给对象贴标签,再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。指无监督学习。 区别是,分类是事先定
阅读全文
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA 将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主元,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n k维特征。 二、并用自己的话阐述出两者的主要区
阅读全文
摘要:8、特征选择 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样
阅读全文
摘要:1.用自己的话描述一下,什么是逻辑回归,与线性回归对比,有什么不同? 性质不同: 逻辑回归:是一种广义的线性回归分析模型,线性回归:利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。 (1) 线性回归只能用于回归问题,逻辑回归用于分类问题(二分类、多分类) (2
阅读全文
摘要:1). 扑克牌手动演练k均值聚类过程:>30张牌,3类 2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题) 3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示. 4). 鸢尾花完整数据做聚类并用散点图显示. 5
阅读全文
摘要:机器学习笔记: 条件概率:在事件B发生的基础上,A发生的概率。 全概率公式:把各事件相加的得 1. 我对贝叶斯定理得理解 我对梯度和梯度下降法的理解: 梯度:即函数在某一点最大的方向导数,函数沿梯度方向函数有最大的变化率。 梯度下降法:梯度即函数在某一点最大的方向导数,函数沿梯度方向函数有最大的变化
阅读全文

浙公网安备 33010602011771号