摘要: 数据库介绍 数据库是在计算机出现以后,为了解决计算机存储问题而创建,数据库中包含表,表当中才是数据。 数据库的发展史 1. 萌芽阶段 所有存储依赖的都是文件,安全性低,查找非常困难。 2. 层次模型 1). 优点:查询分类的效率高; 2). 缺点:导航结构:如果查找同类别数据,效率低。 数据不完整( 阅读全文
posted @ 2020-03-27 23:00 大-道-至-简 阅读(323) 评论(0) 推荐(0) 编辑
摘要: 理论上讲线性回归模型既可以用于回归,也可以用于分类。解决回归问题,可以用于连续目标值的预测。但是针对分类问题,该方法则有点不适应,因为线性回归的输出值是不确定范围的,无法很好的一一对应到我们的若干分类中。即便是一个二分类,线性回归+阈值的方式,已经很难完成一个鲁棒性很好的分类器了。为了更好的实现分类 阅读全文
posted @ 2020-03-21 16:56 大-道-至-简 阅读(1173) 评论(0) 推荐(0) 编辑
摘要: 什么是线性回归(Linear Regression) 我们在初中可能就接触过,y=ax,x为自变量,y为因变量,a为系数也是斜率。如果我们知道了a系数,那么给我一个x,我就能得到一个y,由此可以很好地为未知的x值预测相应的y值。在只有一个变量的情况下,线性回归可以用方程:y = ax+b 表示;多元 阅读全文
posted @ 2020-03-20 20:46 大-道-至-简 阅读(2139) 评论(0) 推荐(0) 编辑
摘要: SVM(support vector machine)简单的说是一个分类器,并且是一种线性分类和非线性分类都支持的二元分类算法,但经过演变,现在也支持多分类问题,也能应用到了回归问题。Vector:通俗说就是点,或是数据。Machine:也就是classifier,也就是分类器。它的基本模型是定义在 阅读全文
posted @ 2020-03-19 23:39 大-道-至-简 阅读(734) 评论(0) 推荐(0) 编辑
摘要: 本篇博客主要详细介绍朴素贝叶斯模型。首先贝叶斯分类器是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类器。而朴素贝叶斯分类器是贝叶斯分类器中最简单,也是最常见的一种分类方法。并且,朴素贝叶斯算法仍然是流行的十大挖掘算法之一,该算法是有监督的学习算法,解决的是分类问题。该算法的优点 阅读全文
posted @ 2020-03-18 00:03 大-道-至-简 阅读(4443) 评论(0) 推荐(0) 编辑
摘要: 本篇博客主要介绍机器学习中的决策树模型。决策树算法在机器学习中算是很经典的一个算法系列。它既可以作为分类算法,也可以作为回归算法,同时也特别适合集成学习比如随机森林。决策树模型是一类算法的集合,在数据挖掘十大算法中,具体的决策树算法占有两席位置,即C4.5和CART算法。 决策树分类的思想类似于找对 阅读全文
posted @ 2020-03-16 13:09 大-道-至-简 阅读(4731) 评论(1) 推荐(1) 编辑
摘要: 分类是在一群已经知道类别标号的样本中,训练一种分类器,让其能够对某种未知的样本进行分类,分类算法属于一种有监督的学习。分类算法的分类过程就是建立一种分类模型来描述预定的数据集或概念集,通过分析由属性描述的数据库元组来构造模型。分类的目的就是使用分类对新的数据集进行划分,其主要涉及分类规则的准确性、过 阅读全文
posted @ 2020-03-13 22:23 大-道-至-简 阅读(1879) 评论(1) 推荐(0) 编辑
摘要: K-最近邻(k-Nearest Neighbor,KNN)分类算法: 数据分析当中KNN通过测量不同特征值之间的距离来进行分类的。存在一个样本数据集合,也称作训练样本集,并且样本集中的每个数据都存在标签,所选择的邻居都是已经正确分类的对象,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签 阅读全文
posted @ 2020-03-13 14:11 大-道-至-简 阅读(681) 评论(0) 推荐(0) 编辑
摘要: 本文主要引出数据分析过程当中涉及到的各个知识点,以便快速了解数据分析的大体框架和流程,后续会详细补充对每个知识点的理解和运用。 python数据分析基本流程(粗糙版): 1). 需求分析:项目技术、产品和应用调研; 2). 数据采集:自有数据源/Python爬虫技术获取; 3). 数据清洗: 异常样 阅读全文
posted @ 2020-03-12 15:27 大-道-至-简 阅读(759) 评论(0) 推荐(0) 编辑
摘要: 可迭代对象Iterable和迭代器对象Iterator: 可迭代对象: 满足前提: 可以被循环操作的对象,就是可迭代对象 举例:str、list、tuple、set、dict、range、generator... 如何高效的检测一个对象是否是可迭代对象? 可以使用collections模块中的Ite 阅读全文
posted @ 2020-03-10 19:03 大-道-至-简 阅读(301) 评论(0) 推荐(0) 编辑