摘要:
import pandas as pd #生成重复数据 data1 = ['a',3] data2 = ['b',2] data3 = ['a',3] data4 = ['c',2] df = pd.DataFrame([data1,data2,data3,data4],columns=['col1','col2']) print(df) #判断重复数据 isDuplicated = df.d... 阅读全文
posted @ 2018-12-03 20:23
秋雨秋雨秋雨
阅读(273)
评论(0)
推荐(0)
摘要:
使用Z标准化得到的阈值作为判断标准,标准化后的得分超过阈值则为正常: 阅读全文
posted @ 2018-12-03 20:05
秋雨秋雨秋雨
阅读(1819)
评论(0)
推荐(0)
摘要:
import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputer#生成缺失数据df = pd.DataFrame(np.random.randn(6,4),columns=['col1','col2','co 阅读全文
posted @ 2018-12-03 16:23
秋雨秋雨秋雨
阅读(481)
评论(0)
推荐(0)
浙公网安备 33010602011771号