机器学习变量技巧

二分赋值法: data["Sex"]=(data["Sex"]=="male").astype("int")

data.loc[:,"Sex"]所有的行 全Sex列

data.loc[:,3]所有的行 错误写法

data.iloc[:,3]第三列

Y = pd.DataFrame(data["Ar_tpm"]) 取Ar_tpm这一列

data=Y[(Y.Ar_tpm<100) & (Y.Ar_tpm>10)]范围性

T=pd.DataFrame(train_data.values.T, index=train_data.columns, columns=train_data.index)矩阵转置

T[0:4]取0~4行

X_train=train_data.iloc[:,0:299]直接取

data.iloc[:,lambda data2:[index1,index2]]//data2为另一个数

#添加一列

fit_data=Y_test_std
fit_data.insert(1,'predict',predict)

或者

df1=df1.append(new,ignore_index=True)

#添加行

df3 = pd.concat([df1,df2],axis=1)

#重置索引

Y.index=range(len(Y))

 

区间频数计算

from itertools import groupby
for k, g in groupby(sorted(smalldata[substance]), key=lambda x: x//0.2):
    print('{}-{}-{}'.format(round(0.2*k), round(k*0.2+0.2,2), len(list(g))))

 

posted @ 2021-08-03 15:25  她与我的点点滴滴  阅读(109)  评论(0)    收藏  举报