文章分类 - 数据分析
Pandas 统计列字符串的长度
摘要:1,使用pandas内置的.str.len()函数 df["contentLen”]=df["column"].str.len() 2.使用pandas内置函数map+lamda df["contentLen"]=df["column"].map(lambda x:len(x))
阅读全文
pandas常用方法
摘要:获取DataFrame数据的行数和列数 row,col=df.shape row,col=df.shape[0],df.shape[1] 获取DataFrame前3条数据 # 默认是5 df.head(3) 获取DataFrame指定条件下的指定列(多个条件用&或|连接,并且每个条件加上括号())
阅读全文
Pandas之DataFrame
摘要:DataFrame对象既有行索引,又有列索引。行索引,表明不同行,横向索引,叫index,0轴,axis=0。列索引,表明不同列,纵向索引,叫columns,1轴,axis=1。 import pandas as pd import numpy as np # 创建DataFrame t1=pd.D
阅读全文
pandas
摘要:numpy能够帮助处理数据,但是pandas除了处理数值之外(基于numpy)。还能够帮助处理其他类型的数据。 1,Series 一维,带标签数组。 2,DataFrame 二维,Series容器。 创建Series import pandas as pd import numpy as np im
阅读全文
numpy
摘要:一个在python中做科学计算的基础库,重在数值计算,也是大部分python科学技术库的基础库,多用在大型、多维数组上执行数值运算。 广播原则: 如果两个数组的后缘维度(trailing dimension,即从末尾开始算起的维度)的轴长度相符或其中一方的长度为1,则认为它们是广播兼容的。广播会在缺
阅读全文
matplotlib
摘要:数据分析是用适当的方法对收集的大量数据进行分析,帮助作出判断,以便采取适当行动。 matplotlib 最流行的python底层绘图库,主要做数据可视化图表。 1,能将数据进行可视化,更直观的呈现。 2,使数据更加客观,更具说服力。 折线图:以折线的上升或下降来表示统计数据的增减变化的统计图。 特点
阅读全文
浙公网安备 33010602011771号