Python数据分析——变量相关性分析与标准化
画heatmap图,显示变量相关性
import seaborn as sns sns.set_style('white') plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus']=False
#括号中的参数是要分析的变量名
#stats_salary是dataframe名 heat_salary = stats_salary[['salary17_18','Pos','MPG','PPG','APG', 'RPG','TOPG','BPG','SPG','Age','PER']] #变量相关性 dfData = heat_salary.corr() #画图 sns.heatmap(dfData).set( xlabel='variance', ylabel='variance')
标准化
from sklearn import preprocessing zscore = preprocessing.StandardScaler() data= pd.DataFrame(zscore.fit_transform('需要标准化的dataframe数据') #标准化后索引与标准化前的索引相同 data.index='需要标准化的dataframe数据'.index data.columns=['Age','PER','MPG','PPG','APG','RPG','TOPG','BPG','SPG','salary17_18']
本文来自博客园,作者:会飞的大斗篷,转载请注明原文链接:https://www.cnblogs.com/sherlockids/p/15000763.html

浙公网安备 33010602011771号