11 2019 档案
K-近邻算法(KNN)
摘要:k-近邻算法原理 简单地说,K-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高(计算距离)、对异常值不敏感(单纯根据距离进行分类,会忽略特殊情况)、无数据输入假定(不会对数据预先进行判定)。 缺点:时间复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。 工作原理 存在一个样本 阅读全文
posted @ 2019-11-25 14:03 cs_1993 阅读(615) 评论(0) 推荐(0)
matplotlib
摘要:Matplotlib基础知识 Matplotlib中的基本图表包括的元素 x轴和y轴 axis水平和垂直的轴线 x轴和y轴刻度 tick刻度标示坐标轴的分隔,包括最小刻度和最大刻度 x轴和y轴刻度标签 tick label表示特定坐标轴的值 绘图区域(坐标系) axes实际绘图的区域 坐标系标题 t 阅读全文
posted @ 2019-11-19 11:41 cs_1993 阅读(280) 评论(0) 推荐(0)
SQLAlchemy
摘要:介绍 SQLAlchemy是一个基于Python实现的ORM框架。该框架建立在 DB API之上,使用关系对象映射进行数据库操作,简言之便是:将类和对象转换成SQL,然后使用数据API执行SQL并获取执行结果。 安装 pip3 install sqlalchemy SQLAlchemy本身无法操作数 阅读全文
posted @ 2019-11-15 13:42 cs_1993 阅读(141) 评论(0) 推荐(0)
数据分析案例
摘要:人口分析案例 需求: 导入文件,查看原始数据 将人口数据和各州简称数据进行合并 将合并的数据中重复的abbreviation列进行删除 查看存在缺失数据的列 找到有哪些state/region使得state的值为NaN,进行去重操作 为找到的这些state/region的state项补上正确的值,从 阅读全文
posted @ 2019-11-14 17:41 cs_1993 阅读(643) 评论(0) 推荐(0)