随笔档案「2018年12月」 - 秋雨秋雨秋雨

知识点小结1

摘要：1.通过pd.DataFrame新建数据框 2.通过df.iloc[]选择特定的列或对象 3.使用Pandas的isnull()判断值是否为空 4.使用all()和any()判断每列包含至少一个为Ture或全部为Ture的情况 5.使用pandas的dropna可以直接删除缺失值 6.使用SKlea 阅读全文

posted @ 2018-12-06 11:02 秋雨秋雨秋雨阅读(111) 评论(0) 推荐(0)

重复值处理

摘要：import pandas as pd #生成重复数据 data1 = ['a',3] data2 = ['b',2] data3 = ['a',3] data4 = ['c',2] df = pd.DataFrame([data1,data2,data3,data4],columns=['col1','col2']) print(df) #判断重复数据 isDuplicated = df.d... 阅读全文

posted @ 2018-12-03 20:23 秋雨秋雨秋雨阅读(277) 评论(0) 推荐(0)

如何判断异常值

摘要：使用Z标准化得到的阈值作为判断标准，标准化后的得分超过阈值则为正常：阅读全文

posted @ 2018-12-03 20:05 秋雨秋雨秋雨阅读(1823) 评论(0) 推荐(0)

缺失值处理

摘要：import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputer#生成缺失数据df = pd.DataFrame(np.random.randn(6,4),columns=['col1','col2','co 阅读全文

posted @ 2018-12-03 16:23 秋雨秋雨秋雨阅读(486) 评论(0) 推荐(0)

秋雨秋雨秋雨

12 2018 档案

公告