PANDAS

pandas的使用

  • DataFrame的使用

    • 列表产生

      import plotly as py
      from plotly import figure_factory as ff
      import pandas as pd
      
      pyplt=py.offline.plot  # 离线模式
      data=pd.DataFrame([["20191001730","kx","4.00"],
                         ["20191000456","fgy","1.00"] ],
                        columns=("学号","姓名","成绩"))  #表头
      table=ff.create_table(data)   #用plotly输出表格
      pyplt(table,show_link=False)
      

      处理结果:

    • 字典产生

      import plotly as py
      from plotly import figure_factory as ff
      import pandas as pd
      
      pyplt=py.offline.plot  # 离线模式
      data=pd.DataFrame({'学号':['201910010288','20191001730','201011192983'],
                        '专业':['计算机系','金融系','空间系'],'成绩':[66,99,120]})  #表头
      table=ff.create_table(data)   #用plotly输出表格
      pyplt(table,show_link=False)
      

      处理结果:

    • 对一些用法的说明

      函数 用法
      data.at[行,列] 找到位置
      data.iloc[0] 第一行的信息
      data['xxx'] 'xxx'列的信息
  • 用Pandas读写各种类型的文件

    • 读取csv和表格

      读:read_csv()

      写:to_csv()

      • read_csv()常用参数

        参数 含义
        sep/delimiter 列分隔符
        header 列名,如果有自己的列名列表,传递None
        index_col 作为索引的列名
        skiprows 要跳过的文件头行数
        na_values 用于处理缺失数据的字符串
        encoding 字符编码方式

      举例:

      (GB2312是中国制定的中文编码,GBK是GB2312的拓展,CP936是在GB2312的基础上开发的汉字编码)

      import plotly as py
      from plotly import figure_factory as ff
      import pandas as pd 
      import plotly.graph_objs as pygo
      
      pyplt=py.offline.plot  # 离线模式
      data=pd.read_csv('score.csv',encoding='GBK') #读取
      table=ff.create_table(data)   #用plotly输出表格
      pyplt(table,show_link=False)
      

    • 写网页文件

      基本和上一个相同

      import plotly as py
      from plotly import figure_factory as ff
      import pandas as pd 
      import plotly.graph_objs as pygo
      
      pyplt=py.offline.plot  # 离线模式
      data=pd.read_csv('score.csv',encoding='GBK') #读取
      table=ff.create_table(data)   #用plotly输出表格
      pyplt(table,filename='scoregp.html',show_link=False)
      
    • 读写EXCAL

      读:read_excal('文件名')

      写:to_excal(‘文件名’)

      import plotly as py
      from plotly import figure_factory as ff
      import pandas as pd 
      import plotly.graph_objs as pygo
      
      pyplt=py.offline.plot  # 离线模式
      data=pd.read_excel('score.xlsx') #读取
      data['总评']=data['成绩']/120*65
      data.to_excel('score.xlsx',index=0)
      

      没有index=0:

      有index=0:

名字都是乱打的,不代表本人的任何观点和立场

posted @ 2020-09-19 17:39  life_if_forever  阅读(184)  评论(0)    收藏  举报