随笔分类 -  第三方库

万能胶python的各种外裤:安装,使用,报错等
摘要:一、数据读取 1、读写数据库数据 读取函数: pandas.read_sql_table(table_name, con, schema=None, index_col=None, coerce_float=True, columns=None) pandas.read_sql_query(sql, 阅读全文
posted @ 2018-09-04 10:22 WoLykos 阅读(1918) 评论(0) 推荐(0)
摘要:分类模型构建 分类是指构造一个分类模型,输入样本的特征值,输出对应的类别,将每个样本映射到预先定义好的类别中。分类模型若建立在已有类标记的数据集上,则属于有监督学习。在实际应用场景中,分类算法被用于行为分析,物品识别,图像检测等。 | 模块 | 函数 | 算法名称 | | | | | | linea 阅读全文
posted @ 2018-08-31 16:31 WoLykos 阅读(3077) 评论(0) 推荐(1)
摘要:回归模型构建 | 模块 | 函数 | 算法名称 | 简称 | | | | | | | linear_model | LinearRegression | 线性回归 | LR | | svm | SVR | 支持向量机回归 | SVM | | neighbors | KNeighborsRegress 阅读全文
posted @ 2018-08-31 14:57 WoLykos 阅读(1324) 评论(0) 推荐(0)
摘要:忙了许久,总算是又想起这边还没写完呢。 那今天就写写sklearn库的一部分简单内容吧,包括数据集调用,聚类,轮廓系数等等。   自带数据集API | 数据集函数 | 中文翻译 | 任务类型 | 数据规模 | | | | | | | load_boston | Boston房屋价格 | 回 阅读全文
posted @ 2018-08-31 10:45 WoLykos 阅读(3456) 评论(0) 推荐(0)
摘要:数据集划分 一般在日常工作中我们会将数据集拆分为训练集(train_set)和测试集(test_set) 训练集:一般用于训练模型,需要尽可能保证训练的数据具有代表性。 测试集:用于测试模型,检测模型的性能(包括了运行时间,模型的效果等) trian_test_split( arrays,train 阅读全文
posted @ 2018-08-31 09:57 WoLykos 阅读(1163) 评论(0) 推荐(0)
摘要:创建画布或子图 函数名称函数作用 plt.figure 创建一个空白画布,可以指定画布大小,像素。 figure.add_subplot 创建并选中子图,可以指定子图的行数,列数,与选中图片编号。 创建画布或子图 函数名称函数作用 plt.figure 创建一个空白画布,可以指定画布大小,像素。 f 阅读全文
posted @ 2018-08-04 09:50 WoLykos 阅读(827) 评论(0) 推荐(0)
摘要:1透视表 数据透视表(Pivot Table)是一种交互式的表,可以进行某些计算,如求和与计数等。所进行的计算与数据跟数据透视表中的排列有关。 之所以称为数据透视表,是因为可以动态地改变它们的版面布置,以便按照不同方式分析数据,也可以重新安排行号、列标和页字段。 数据分析中的透析表十分强大,甚至可以 阅读全文
posted @ 2018-08-04 09:25 WoLykos 阅读(1576) 评论(1) 推荐(0)
摘要:1哑变量处理 也叫独热编码,英文:One-hot Encoding。可将任意离散型数据变为0-1数值。 哑变量函数: pd.get_dummies(data, prefix=None, prefixsep='', dummy_na=False, columns=None, sparse=False, 阅读全文
posted @ 2018-07-30 20:39 WoLykos 阅读(1726) 评论(0) 推荐(0)
摘要:1数据堆叠 数据堆叠分为以下两种: 行堆叠 列堆叠 行堆叠 列堆叠 pd.concat(objs, axis=0) objs:参与合并的多个DataFrame。无默认 axis:表示轴向,axis=0表示行合并,axis=1表示列合并 当然,如果axis=0(行堆叠)时,也可以使用append函数 阅读全文
posted @ 2018-07-28 15:42 WoLykos 阅读(782) 评论(0) 推荐(0)
摘要:时间类型数据的转换(字符串转为时间) pd.to_datetime(arg, errors='raise', dayfirst=False, yearfirst=False, utc=None, box=True, format=None, exact=True, unit=None, infer_ 阅读全文
posted @ 2018-07-28 09:35 WoLykos 阅读(1175) 评论(0) 推荐(0)
摘要:一、3σ原则 3σ原则又称为拉依达准则,该准则具体来说,就是先假设一组检测数据只含有随机误差,对原始数据进行计算处理得到标准差,然后按一定的概率确定一个区间,认为误差超过这个区间的就属于异常值。 正态分布状况下,数值分布表: 注:在正态分布中σ代表标准差,μ代表均值,x=μ为图形的对称轴 二、箱线图 阅读全文
posted @ 2018-07-28 09:15 WoLykos 阅读(13240) 评论(0) 推荐(0)
摘要:数据导入可见:《Python之Pandas知识点》 此文图方便,就直接输入数据了。 1缺失值处理 1.1删除法 DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False) axis:表示轴向。默认为0,表示 阅读全文
posted @ 2018-07-28 08:54 WoLykos 阅读(3582) 评论(0) 推荐(0)
摘要:很多时候在数据分析之前,我们需要对样本进行校验,以确定样本的价值。 先写入数据: 1完整性校验 笔记:这里也可以用到describe方法,如下: 忘了describe方法的话,请查看《Python之Pandas知识点》 2时间跨度检验 很多样本的时间数据并不是以datatime64类型存储的,此时我 阅读全文
posted @ 2018-07-25 22:31 WoLykos 阅读(1964) 评论(0) 推荐(0)
摘要:很多人都分不清Numpy,Scipy,pandas三个库的区别。 在这里简单分别一下: NumPy:数学计算库,以矩阵为基础的数学计算模块,包括基本的四则运行,方程式以及其他方面的计算什么的,纯数学; SciPy :科学计算库,有一些高阶抽象和物理模型,在NumPy基础上,封装了一层,没有那么纯数学 阅读全文
posted @ 2018-07-22 11:49 WoLykos 阅读(8470) 评论(0) 推荐(3)
摘要:1实验环境 操作系统:Windows10 编码语言:Python3.6 编译平台:Pycharm Python库:os、datetime、matplotlib、opencv-python、time 2实验代码流程图 3代码运行步骤和结果等 3.1 手机和电脑用数据线连接 使用通过数据线连接手机,将开 阅读全文
posted @ 2018-06-29 00:14 WoLykos 阅读(7396) 评论(7) 推荐(1)
摘要:今天主要讲xadmin库的下载和安装的.......各种问题。。。。。。。 先注明:我使用的是python3.6,Django2.0,所以xadmin也应该是2.0版本会比较适配。 所以这里先给个xadmin的资源,很多人都会下载成master的,要是不知道怎么找Django版本的朋友直接点击这里。 阅读全文
posted @ 2018-04-25 02:09 WoLykos 阅读(3341) 评论(1) 推荐(0)
摘要:在Django默认的admin后台创建超级用户时, 报错pymysql.err.DataError: (1406, "Data too long for column 'gender' at row 1")的解决方法。 创建过程为: 点击tool菜单的run manage.py task,输入cre 阅读全文
posted @ 2018-04-22 17:05 WoLykos 阅读(2484) 评论(0) 推荐(0)
摘要:Pycharm强大的功能总是让我很是着迷,比如它的makemigrations 和 migrate。 然而某一次,当我再次敲下这熟悉的命令时,它报错了。。。。 不想看上边的朋友我还截了个大图。 错误是:django.db.migrations.exceptions.InconsistentMigra 阅读全文
posted @ 2018-04-19 23:28 WoLykos 阅读(8536) 评论(0) 推荐(1)
摘要:简单地总结就一句话: Python2的mysql库为:mysqldb,而Python3的为:pymysql。 当我们使用Pycharm开发项目时,首先需要下载安装相对应的数据库,以及在项目根目录下的setting.py文件中连接数据库,代码如下: (我用的框架是Django) 值得注意的是:如果你是 阅读全文
posted @ 2018-04-19 23:14 WoLykos 阅读(910) 评论(0) 推荐(0)
摘要:一样,咱的计算机还是得先拥有Python,并且安装了Numpy库。有疑问的话可以看这里呦~~~~ 下面开讲: NumPy的主要对象是齐次多维数组。它是一个元素表(通常是数字),并且都是相同类型,由正整数的元组索引。 其他暂且略过,咱主要说一些可以听懂的并且有实际效用的。 首先,我们得创建有一个nda 阅读全文
posted @ 2018-03-20 21:30 WoLykos 阅读(933) 评论(0) 推荐(0)