Python数据分析——变量相关性分析与标准化

画heatmap图,显示变量相关性

import seaborn as sns
sns.set_style('white')
plt.rcParams['font.sans-serif']=['SimHei'] 
plt.rcParams['axes.unicode_minus']=False
#括号中的参数是要分析的变量名
#stats_salary是dataframe名 heat_salary
= stats_salary[['salary17_18','Pos','MPG','PPG','APG', 'RPG','TOPG','BPG','SPG','Age','PER']] #变量相关性 dfData = heat_salary.corr() #画图 sns.heatmap(dfData).set( xlabel='variance', ylabel='variance')

标准化

from sklearn import preprocessing
zscore = preprocessing.StandardScaler()
data= pd.DataFrame(zscore.fit_transform('需要标准化的dataframe数据')
#标准化后索引与标准化前的索引相同
data.index='需要标准化的dataframe数据'.index
data.columns=['Age','PER','MPG','PPG','APG','RPG','TOPG','BPG','SPG','salary17_18']

 

posted @ 2021-07-12 09:50  会飞的大斗篷  阅读(526)  评论(0)    收藏  举报