机器学习变量技巧
二分赋值法: data["Sex"]=(data["Sex"]=="male").astype("int")
data.loc[:,"Sex"]所有的行 全Sex列
data.loc[:,3]所有的行 错误写法
data.iloc[:,3]第三列
Y = pd.DataFrame(data["Ar_tpm"]) 取Ar_tpm这一列
data=Y[(Y.Ar_tpm<100) & (Y.Ar_tpm>10)]范围性
T=pd.DataFrame(train_data.values.T, index=train_data.columns, columns=train_data.index)矩阵转置
T[0:4]取0~4行
X_train=train_data.iloc[:,0:299]直接取
data.iloc[:,lambda data2:[index1,index2]]//data2为另一个数
#添加一列
fit_data=Y_test_std
fit_data.insert(1,'predict',predict)
或者
df1=df1.append(new,ignore_index=True)
#添加行
df3 = pd.concat([df1,df2],axis=1)
#重置索引
Y.index=range(len(Y))
区间频数计算
from itertools import groupby for k, g in groupby(sorted(smalldata[substance]), key=lambda x: x//0.2): print('{}-{}-{}'.format(round(0.2*k), round(k*0.2+0.2,2), len(list(g))))

浙公网安备 33010602011771号