pandas简单解析
此博客仅是我平时学习遇到的一些小代码
import pandas as pd
1.pandas就是读取数据用的,对于处理大型数据集很方便。
2.pandas的切片索引左右都是闭,不相python一样,左闭右开。
1.pd.DataFrame(a) #此时a为一个字典
2.W = pd.read_csv(' ') #''里面输入路径,文件名尽量不要包含中文。
3.W.head() #显示W内前五行数据,括号内可以加参数
4.W.tail() #显示末尾几行。
5.W.name.value_counts() #显示文件内各类别的数目,(name)可以换成其他的。
6.pd.get_dummies() #onehot编码,将文字特征变为0或1
7.W.values #将数据转化为矩阵。
8.W.groupby('name').min() #以name为分界区间,对词文件内其他所有的列取最小值。
#同理还有sum,max,mean等操作。取得各个位置的元素都为最小值,他们在文件内并不一定属于同一行。

浙公网安备 33010602011771号