文章分类 -  数据分析

Pandas 统计列字符串的长度
摘要:1,使用pandas内置的.str.len()函数 df["contentLen”]=df["column"].str.len() 2.使用pandas内置函数map+lamda df["contentLen"]=df["column"].map(lambda x:len(x)) 阅读全文
posted @ 2024-05-05 11:29 会飞的金鱼 阅读(35) 评论(0) 推荐(0)
pandas常用方法
摘要:获取DataFrame数据的行数和列数 row,col=df.shape row,col=df.shape[0],df.shape[1] 获取DataFrame前3条数据 # 默认是5 df.head(3) 获取DataFrame指定条件下的指定列(多个条件用&或|连接,并且每个条件加上括号()) 阅读全文
posted @ 2024-04-13 19:15 会飞的金鱼 阅读(34) 评论(0) 推荐(0)
Pandas之DataFrame
摘要:DataFrame对象既有行索引,又有列索引。行索引,表明不同行,横向索引,叫index,0轴,axis=0。列索引,表明不同列,纵向索引,叫columns,1轴,axis=1。 import pandas as pd import numpy as np # 创建DataFrame t1=pd.D 阅读全文
posted @ 2024-01-23 21:44 会飞的金鱼 阅读(74) 评论(0) 推荐(0)
pandas
摘要:numpy能够帮助处理数据,但是pandas除了处理数值之外(基于numpy)。还能够帮助处理其他类型的数据。 1,Series 一维,带标签数组。 2,DataFrame 二维,Series容器。 创建Series import pandas as pd import numpy as np im 阅读全文
posted @ 2024-01-13 15:42 会飞的金鱼 阅读(18) 评论(0) 推荐(0)
numpy
摘要:一个在python中做科学计算的基础库,重在数值计算,也是大部分python科学技术库的基础库,多用在大型、多维数组上执行数值运算。 广播原则: 如果两个数组的后缘维度(trailing dimension,即从末尾开始算起的维度)的轴长度相符或其中一方的长度为1,则认为它们是广播兼容的。广播会在缺 阅读全文
posted @ 2024-01-09 21:38 会飞的金鱼 阅读(33) 评论(0) 推荐(0)
matplotlib
摘要:数据分析是用适当的方法对收集的大量数据进行分析,帮助作出判断,以便采取适当行动。 matplotlib 最流行的python底层绘图库,主要做数据可视化图表。 1,能将数据进行可视化,更直观的呈现。 2,使数据更加客观,更具说服力。 折线图:以折线的上升或下降来表示统计数据的增减变化的统计图。 特点 阅读全文
posted @ 2024-01-06 22:31 会飞的金鱼 阅读(25) 评论(0) 推荐(0)