pyspark中使用累加器Accumulator统计指标
摘要:
评价分类模型的性能时需要用到以下四个指标 最开始使用以下代码计算,发现代码需要跑近一个小时,而且这一个小时都花在这四行代码上 心想着理论上可以只扫描一遍数据就可以计算出这四个指标。 一开始在foreach函数中传递一个自定义评估函数,这个函数来统计上面四个指标,然后在函数里再使用全局变量TP,TN等 阅读全文
posted @ 2017-04-14 21:42 WOTGL 阅读(2213) 评论(0) 推荐(0)
浙公网安备 33010602011771号