随笔分类 - python数据分析
使用python numpy,pandas,matplotlib进行数据处理,数据分析
摘要:本节我们主要介绍pandas对象series和dataframe当中的一些重要的方法 reindex方法 reindex方法会根据index对series和dataframe进行重排序,对于找不到的index会用NAN值进行填充。 In [151]: obj Out[151]: d 4.5 b 7.
阅读全文
摘要:算术运算和数据对齐 对于series而言,对于index相同的值,会自动对齐相加,对于未重叠的部分,会将他们展示并用NAN值填充(类似于数据库当中的外连接所不同的是用NAN值填充了) In [26]: s1 = pd.Series([7.3, -2.5, 3.4, 1.5], index=['a',
阅读全文
摘要:要使用pandas,你首先得熟悉他的两个数据结构:Series和Dataframe。 Series series 是一种类似于 一维数组的的对象,他由一组数据以及与之相关的数据标签组成。 In [42]: import pandas as pd In [43]: pd.Series([2,3,7,1
阅读全文
摘要:1.数组当中的函数 通用函数是一种对ndarray中的数据执行元素级运算的函数。数组当中的函数与python当中内置的函数没有什么太大的区别,区别就是数组当中的函数可以对数组当中的每一个值进行函数运算不需要编写循环(矢量化)。 一元函数 接受一个数组进行运算的函数叫做一元函数,如sqrt,exp I
阅读全文
摘要:Numpy数组的运算: numpy数组最大的特点是任何运算,都会自动的对数组当中的所有变量进行运算,所以千万不要试图自己去使用循环去取数组当中的值进行运算(非常愚蠢)。 1.相同大小的数组之间的运算 数组可以不编写循环而对数据执行批量运算,称之为矢量化,大小相同数组之间的算术运算将会应用到元素级。
阅读全文
摘要:Numpy numpy是数值计算最重要的基础包,几乎所有的科学运算的模块底层所用的都是numpy数组。 Numpy本身没有提供多么高级的数据分析功能,他所提供的功能主要是: 1.具有矢量算术运算(用数组表达式代替循环的做法通常称为矢量化),矢量化计算因为不使用循环,因此速度会快1到两个数量级 2.广
阅读全文
摘要:python当中内置了多种数据类型,了解python内置的基本数据类型,有助于进行进行数据处理。第一篇我们将介绍python当中的数字。 我们将介绍每一种数字类型,他们适用的操作符,以及用于处理的内建函数。 python支持多种数字类型分别是:整形,布尔型,双精度浮点型和复数。 1.数字变量的赋值,
阅读全文

浙公网安备 33010602011771号