05 2020 档案
摘要:1.读取 2.数据预处理 词性还原 def get_wordnet_pos(treebank_tag): if treebank_tag.startswith('J'): return nltk.corpus.wordnet.ADJ elif treebank_tag.startswith('V')
阅读全文
摘要:朴素贝叶斯垃圾邮件分类 1. 读邮件数据集文件,提取邮件本身与标签。 2.邮件预处理 2.1传统方法 2.1 nltk库 分词 nltk.sent_tokenize(text) 对文本按照句子进行分割 nltk.word_tokenize(sent) 对句子进行分词 2.2 punkt 停用词 fr
阅读全文
摘要:11.分类与监督学习,朴素贝叶斯分类算法 1.理解分类与监督学习、聚类与无监督学习。 简述分类与聚类的联系与区别。 答:分类指监督学习,就是按照某种标准给对象贴标签,再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。指无监督学习。 区别是,分类是事先定
阅读全文
摘要:一、用自己的话描述出其本身的含义: 1、特征选择 通过特征选取删选掉冗余和不相关的特征来进一步降维。 2、PCA 将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主元,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n k维特征。 二、并用自己的话阐述出两者的主要区
阅读全文
摘要:利用fs核心模块的weiteFile()方法 代码: 运行结果: 当文件名存在时,会覆盖原来的内容, 当文件名不存在时,会创建一个文件把文件名改为hellownew.txt: 在文件路径中加入特殊字符,则写入失败:
阅读全文
摘要:1、利用require 方法引入fs核心模块 2、调用fs中的readFile方法进行读取文件 3、运行结果 文件的存储是二进制进行存储的,输出的结果是16进制 利用toString()方法在16进制文件流转化为我们熟悉的汉字 4、当文件名或路径写入错误时:
阅读全文
摘要:什么 nodejs 是构建在 Chromes V8 引擎上 js 的运行环境,可以解析javaScript 代码。 javaScript 可以脱离浏览器运行,归功于node.js 事件驱动,非阻塞I/O 模型 (异步) nodejs npm 是世界上最大的开源生态系统 javaScript 绝大多数
阅读全文
摘要:8、特征选择 用过滤法对以下数据进行特征选择: [[0,2,0,3], [0,1,4,3], [0,1,1,3]] 要求: 1、Variance Threshold(threshold =1.0) 2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样
阅读全文

浙公网安备 33010602011771号