上一页 1 ··· 5 6 7 8 9 10 11 下一页
摘要: 有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据。 防止表中出现重复数据 你可以在MySQL数据表中设置指定的字段为 PRIMARY KEY(主键) 或者 UNIQUE(唯一) 索引来保证数据的唯一性。 让我们尝试一个实例:下表中无索 阅读全文
posted @ 2018-11-06 13:58 时间带着假象流淌 阅读(701) 评论(0) 推荐(0)
摘要: 方法一:直接del df['column-name'] 删除sub_grade_列, 输入del df['sub_grade_x'] 方法二:采用drop方法,有下面三种等价的表达式: 1. df= df.drop('column_name', 1) 输入:df,drop('num',axix=1) 阅读全文
posted @ 2018-11-01 15:12 时间带着假象流淌 阅读(94300) 评论(3) 推荐(2)
摘要: 读入数据: 数据分组:我们可以看到num这列它的数字在0-20之间变化,我们可以对其增加一列,用来对其分组 df['新增一列的名称']=pd.cut(df['要分组的列'],要分组的区间,新增一列后对应区间分组的名称) 数据的分列: 可以分析数据grade这一列,可以用split函数就行分列 分列以 阅读全文
posted @ 2018-11-01 14:30 时间带着假象流淌 阅读(3100) 评论(0) 推荐(1)
摘要: 一. mysqldump工具基本用法,不适用于大数据备份 1. 备份所有数据库: mysqldump -u root -p --all-databases > all_database_sql 2. 备份mysql数据库:mysqldump -u root -p --databases mysql 阅读全文
posted @ 2018-11-01 10:38 时间带着假象流淌 阅读(1787) 评论(0) 推荐(0)
摘要: 首先,我们查看自己的数据结构: 导出数据到某一固定文件夹,当然,你最后可以选择保存为CSV或者txt格式都是可以的 mysql> select * from student3 -> into outfile 'C://Users/SHNU/desktop/s3.csv' -> ; 导出数据库: 此时 阅读全文
posted @ 2018-11-01 09:04 时间带着假象流淌 阅读(173) 评论(0) 推荐(0)
摘要: 首先,我们先要读入数据: 然后检查数据出现的问题: 1.没有表头,增加表头 2.去除重复值: df.duplicate()使用布尔数据查看数据表中是否有重复值,df.drop_duplicates(),删去重复的值 这里有两点需要说明:第一,数据表中两个条目间所有列的内容都相等时duplicated 阅读全文
posted @ 2018-10-31 15:45 时间带着假象流淌 阅读(989) 评论(0) 推荐(0)
摘要: dnorm,pnorm,qnorm,rnorm的表达式: 其中x和q是由数值型变量构成的向量,p是由概率构成的向量,n是随机产生的个数 mean是要计算正态分布的均值,缺省值为0,sd是计算正态分布的标准差, 缺省值为1 其中dnorm返回值是正态分布的概率密度函数 其中pnorm返回的是正态分布的 阅读全文
posted @ 2018-10-30 13:50 时间带着假象流淌 阅读(13570) 评论(0) 推荐(0)
摘要: 直方图: 核密度函数: 练习题目1: 绘制出15位同学体重的直方图和核密度估计图,并与正态分布的概率密度函数作对比 代码如下: > w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5,+ 66.6, 64.0, 57.0, 69.0, 56.9 阅读全文
posted @ 2018-10-30 13:16 时间带着假象流淌 阅读(4355) 评论(0) 推荐(0)
摘要: 与直方图相比,茎叶图更能细致的看出数据分布情况! 代码: > x<-c(25, 45, 50, 54, 55, 61, 64, 68, 72, 75, 75,+ 78, 79, 81, 83, 84, 84, 84, 85, 86, 86, 86,+ 87, 89, 89, 89, 90, 91, 阅读全文
posted @ 2018-10-30 10:47 时间带着假象流淌 阅读(3444) 评论(0) 推荐(0)
摘要: 无论是直方图还是经验分布图,要从比较上鉴别样本是否处近似于某种类型的分布是困难的 QQ图可以帮我们鉴别样本的分布是否近似于某种类型的分布 R语言,代码如下: > qqnorm(w);qqline(w)> w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 阅读全文
posted @ 2018-10-30 10:14 时间带着假象流淌 阅读(14895) 评论(0) 推荐(0)
上一页 1 ··· 5 6 7 8 9 10 11 下一页