摘要: 二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。但是,折半查找要求线性表必须采用顺序存储结构,而且表中元素按关键字有序排列 查找过程 编辑 首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成 阅读全文
posted @ 2020-07-05 17:20 Arish 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 重新索引 pandas对象的一个重要反复是reindex,其作用是创建一个适应新索引的新对象。 如果某个索引值不存在,就引入缺失值 对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理,method选项即可达到目的 reindex的(插值) method选项 fill或pad:前向填充(或搬 阅读全文
posted @ 2018-11-18 20:20 Arish 阅读(365) 评论(0) 推荐(0) 编辑
摘要: 要使用pandas,需要熟悉它的两个主要的数据结构,Series和DataFrame。 Series series是一种类似于以为数组的对象,它由一组数据(各种numpy的数据类型)以及一组与之相关的数据标签(索引)组成。仅有一组数据即可产生简单的Series: series的字符串表现形式为:索引 阅读全文
posted @ 2018-11-18 14:27 Arish 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 目录: 1. pandas的数据结构介绍 2.基本功能 3.汇总和计算描述统计 4.处理缺失数据 5.层次化索引 6.其他 阅读全文
posted @ 2018-11-18 13:29 Arish 阅读(162) 评论(0) 推荐(0) 编辑
摘要: numpy.random模块对Python内置的random进行了补充,增加了一些用于高效生成多种概率分布的样本值的函数。如可以用normal来得到一个标准正态分布的4*4的样本数组: 而Python内置的random模块则只能一次生成一个样本值。从下面的测试结果可以看到,如果需要产生大量的样本值, 阅读全文
posted @ 2018-11-18 13:24 Arish 阅读(368) 评论(0) 推荐(0) 编辑
摘要: 利用数组的文件输入输出 1. 将数组以二进制格式保存到磁盘 np.save和np.load是读写磁盘数组数据的两个主要函数。默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的。 如果文件路径末尾没有扩展名.npy,则该扩展名会自动加上。然后就可以通过np.load读取磁盘上数 阅读全文
posted @ 2018-11-18 13:12 Arish 阅读(629) 评论(0) 推荐(0) 编辑
摘要: Numpy的ndarry:一种多维数组对象 Numpy最重要的一个特点就是其N维数组对象(即ndarry),该对象是一个快速而灵活的大数据集容器。你可以利用这种数组对整块数据执行一些数学运算,其语法跟标量元素之间的运算一样: ndarry是一个通用的同构数据多维容器,也就是说,其中的所有元素必须是相 阅读全文
posted @ 2018-11-17 21:03 Arish 阅读(1411) 评论(0) 推荐(0) 编辑
摘要: 目录: 1. numpy的ndarry:一种多维数组对象 2.通用函数:快速的元素级数组函数 3.利用数组进行数据处理 4.利用数组的文件输入输出 5.随机数生成 阅读全文
posted @ 2018-11-17 21:00 Arish 阅读(207) 评论(0) 推荐(0) 编辑
摘要: Numpy数组使你可以将许多种数据处理任务表述为简洁的数组表达式。利用数组表达式代替循环的做法,通常被称为矢量化。一般来说,矢量化数组运算要比等价的纯Python方式快上一两个数量级(甚至更多)尤其是各种数值计算。 假如我们想要在一组值上计算函数sqrt(x^2+y^2)。np.meshgrid函数 阅读全文
posted @ 2018-10-21 14:18 Arish 阅读(740) 评论(0) 推荐(0) 编辑
摘要: 索引类型 先创建表 1.普通索引 是最基本的索引,它没有任何的限制。有以下几种创建方式 (1)直接创建索引: 实例: CREATE INDEX test_username ON test (username(10)); -->单列索引 indexName为索引名,mytable表名,username 阅读全文
posted @ 2018-10-16 20:58 Arish 阅读(161) 评论(0) 推荐(0) 编辑