python3

pandas .csv文件 删除Dataframe 列:

  

方法一:直接del DF['column-name']

方法二:采用drop方法,有下面三种等价的表达式:

1. DF= DF.drop('column_name', 1);

2. DF.drop('column_name',axis=1, inplace=True)

3. DF.drop([DF.columns[[0,1, 3]]], axis=1,inplace=True)

 

注意:凡是会对原数组作出修改并返回一个新数组的,往往都有一个 inplace可选参数。如果手动设定为True(默认为False),那么原数组直接就被替换。也就是说,采用inplace=True之后,原数组名(如2和3情况所示)对应的内存值直接改变;而采用inplace=False之后,原数组名对应的内存值并不改变,需要将新的结果赋给一个新的数组或者覆盖原数组的内存位置(如1情况所示)

 

将RDD转换成DataFrame:

val studentDF = studentRDD.toDF()

 

同时给多个值赋值:

 

>>> a,b = (1,2)
>>> a
1
>>> b
2
>>> a,b = [10,2]
>>> a,b,c = range(3)
交换值:
>>> a,b = b,a >>> a,b,c = c,a,b >>> a,b,c = c,a,a-c

 

posted @ 2019-04-05 23:57  甘泉0811  阅读(105)  评论(0编辑  收藏  举报