数据的清洗(2.1)

参考文章内容较多,一点一点写

https://mp.weixin.qq.com/s?__biz=MzU5Mjg2OTQ1MA%3D%3D&chksm=fe186225c96feb330e129a47ff979301f6dcdc042ce24fa7b23f61e21d6c13a30e25d00f469d&idx=1&mid=2247484160&scene=21&sn=c1ed435f441c2b53751fec3558e7edee#wechat_redirect

 

首先,导入案例数据集。因为案例数据存放在同一个Excel表的不同Sheet下,我们需要指定sheetname分别读取:

注意:应该是sheet_name不是sheetname

--------------------------------------------------------------------------------------
学习1:数据展示设置:防止列名过多无法展示
pd.set_option('display.max_rows', 500)
pd.set_option('display.max_columns', 500)
pd.set_option('display.width', 1000)
------------------------------------------------------------------------------------
学习2:read_excel参数设置
d1 = pd.read_excel('清洗数据集.xlsx',sheet_name = 0,header= None,names = ['a','b','c','d','e','f'])
d1 = pd.read_excel('清洗数据集.xlsx',sheet_name ='一级流量') 
d1 = pd.read_excel('清洗数据集.xlsx',sheet_name = 0)

sheet_name为0时对应excel第一个表,以此类推,或者直接等于对应的sheet表名
header为0时excel第一行为列名,None时没有列名,此时names用来起列名

参考excel参数设置:https://blog.csdn.net/leenuxcore/article/details/106407522


 

posted @ 2022-07-27 20:08  萧六弟  阅读(53)  评论(0)    收藏  举报