摘要: KNN(最邻近规则分类K-Nearest-Neighibor)KNN算法 1. 综述 1.1 Cover和Hart在1968年提出了最初的邻近算法 1.2 分类(classification)算法 1.3 输入基于实例的学习(instance-based learning), 懒惰学习(lazy l 阅读全文
posted @ 2019-03-30 16:36 谵语芥末 阅读(167) 评论(0) 推荐(0)
摘要: 样本选自周志华老师的西瓜书 样本: 将上面的样本制作成为一个CSV文件,保存的编码为utf8,文中保存在/home/jsj/datetest/下名字wm20.csv 需要导入的文件: 1)导入文件: 这段代码的运行结果: <_csv.reader object at 0x7fa77d171198> 阅读全文
posted @ 2019-03-30 12:09 谵语芥末 阅读(1076) 评论(0) 推荐(1)
摘要: 机器学习中分类和预测算法的评估: 准确率 速度 强壮行 可规模性 可解释性 准确率 速度 强壮行 可规模性 可解释性 1)什么叫做决策树 判定树是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或类分布。树的最顶层是根结点。 小明进行 阅读全文
posted @ 2019-03-24 20:18 谵语芥末 阅读(192) 评论(0) 推荐(0)
摘要: 1)使用GUI 1、GUI:Graphical user interface 2、tkinter:GUI libary for Python自带的库 3、GUI:Example 2)Ubuntu18.04和Pycharm使用tkinter 如果出现No module named _tkinter 导 阅读全文
posted @ 2019-03-24 16:07 谵语芥末 阅读(145) 评论(0) 推荐(0)
摘要: 1)什么叫做异常 程序运行时,发生的不被期望的事件,它阻止了程序按照程序员的预期正常执行,这就是异常。 2)异常和错误的区别 Error(错误)是系统中的错误,程序员是不能改变的和处理的,是在程序编译时出现的错误,只能通过修改程序才能修正。一般是指与虚拟机相关的问题,如系统崩溃,虚拟机错误,内存空间 阅读全文
posted @ 2019-03-24 11:00 谵语芥末 阅读(143) 评论(0) 推荐(0)
摘要: 读写文件 代码: 运行结果: 阅读全文
posted @ 2019-03-24 10:53 谵语芥末 阅读(134) 评论(0) 推荐(0)
摘要: 1. 机器学习 (Machine Learning, ML) 1.1 概念:多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 1.2 学科定位:人工智能(Ar 阅读全文
posted @ 2019-03-23 23:18 谵语芥末 阅读(194) 评论(0) 推荐(0)
摘要: 1)使用Scrapy,什么叫做Scrapy Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。 2)安装的Scrapy $ : sudo pip3 install scr 阅读全文
posted @ 2019-03-23 17:00 谵语芥末 阅读(174) 评论(0) 推荐(0)
摘要: 1)什么叫做URL url是统一资源定位符,对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。网站的URL, 通常网站的url是回路的,要涉及到网站的去重问题。 2)什么叫 阅读全文
posted @ 2019-03-23 15:44 谵语芥末 阅读(132) 评论(0) 推荐(0)
摘要: 1. 爬虫的选取:scrapy和requests+beautifuisoup scrapy是框架,而requests和beautifulsoup是库。scrapy框架是可以加如requests和beautifulsoup库的,而scrapy是基于twisted,性能是最大的优势。scrapy方便扩展 阅读全文
posted @ 2019-03-21 19:58 谵语芥末 阅读(201) 评论(0) 推荐(0)