摘要:
pandas、spark计算相关性系数速度对比 相关性计算有三种算法:pearson、spearman,kenall。 在pandas库中,对一个Dataframe,可以直接计算这三个算法的相关系数correlation,方法为:data.corr() 底层是依赖scipy库的算法。 为了提升计算速 阅读全文
posted @ 2020-07-02 15:55
MyStitch
阅读(2506)
评论(0)
推荐(0)