pandas使用[持续增加]
1、处理缺失值
DataFrame.dropna(self,axis = 0,how ='any',thresh = None,subset = None,inplace = False)
axis: 0 代表行 1 代表列
how: 'any'==>如果存在任何NA值,则删除该行或列。 'all'==>如果所有值均为NA,则删除该行或列
thresh: 需要多少非Nan的值
subset:要考虑的其他轴上的标签,例如,如果要删除行,这些标签将是要包括的列的列表
inplace:如果为True,则执行就地操作并返回None
2、替换缺失值
DataFrame.fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
value:用于填充位的值(例如0),或者是dict/Series/DataFrame的值,该值指定用于每个索引(对于Series)或列(对于DataFrame)使用哪个值。不在dict/Series/DataFrame中的值将不被填充。该值不能是列表。
method:
axis:填充缺失值所沿的轴 0==>代表行 1==>代表列
inplace:如果为True,则就地填充。注意:这将修改此对象上的任何其他视图(例如,DataFrame中列的无复制切片)
limit:如果指定了method,则这是要向前/向后填充的连续NaN值的最大数量。换句话说,如果存在连续的NaN数量大于此数量的缺口,它将仅被部分填充。如果未指定method,则这是将填写NaN的整个轴上的最大条目数。如果不为None,则必须大于0。
downcast:item-> dtype的字典,如果可能的话,将向下转换,或者是字符串“infer”,它将尝试向下转换为适当的相等类型(例如,如果可能,则从float64到int64)
3、对DateFrame对象的值进行更新替换
DataFrame.update(self, other, join='left', overwrite=True, filter_func=None, errors='ignore')
other: DataFrame或可以强制转换为DataFrame对象至少有一个匹配的索引/列标签。如果传递了Series,则必须设置其name属性,并将其用作列名与原始DataFrame对齐
join:仅实现左连接,保留原始对象的索引和列
overwrite:如何处理重叠键的非NA值 True:覆盖原有的数据框的值与值等 False:仅更新原始DataFrame中NA的值。
filter_func:可以选择替换NA以外的值。对于应更新的值,返回True
errors:如果为'raise',则当DataFrame和其他 两者在同一位置包含非NA数据时,将引发ValueError

浙公网安备 33010602011771号