数据的清洗(2.1)
参考文章内容较多,一点一点写
https://mp.weixin.qq.com/s?__biz=MzU5Mjg2OTQ1MA%3D%3D&chksm=fe186225c96feb330e129a47ff979301f6dcdc042ce24fa7b23f61e21d6c13a30e25d00f469d&idx=1&mid=2247484160&scene=21&sn=c1ed435f441c2b53751fec3558e7edee#wechat_redirect
首先,导入案例数据集。因为案例数据存放在同一个Excel表的不同Sheet下,我们需要指定sheetname分别读取:
注意:应该是sheet_name不是sheetname

--------------------------------------------------------------------------------------
学习1:数据展示设置:防止列名过多无法展示
pd.set_option('display.max_rows', 500)
pd.set_option('display.max_columns', 500)
pd.set_option('display.width', 1000)
------------------------------------------------------------------------------------
学习2:read_excel参数设置
d1 = pd.read_excel('清洗数据集.xlsx',sheet_name = 0,header= None,names = ['a','b','c','d','e','f'])
d1 = pd.read_excel('清洗数据集.xlsx',sheet_name ='一级流量')
d1 = pd.read_excel('清洗数据集.xlsx',sheet_name = 0)
sheet_name为0时对应excel第一个表,以此类推,或者直接等于对应的sheet表名
header为0时excel第一行为列名,None时没有列名,此时names用来起列名
参考excel参数设置:https://blog.csdn.net/leenuxcore/article/details/106407522

浙公网安备 33010602011771号