随笔分类 -  Pandas

摘要:Pandas是一个非常好用的数据处理包,那么处理同样的数据,不同的方法其效率能差多少呢? 首先看一下数据的形式,很小的一组数据,不到34万行,10列。 数据的处理方法也很简单,就是一个简单的条件语句if,用其中的一列,对比另外一列的大小,条件满足,在状态列表里加个1,条件不满足就加个0。 测试1: 阅读全文
posted @ 2018-12-26 23:28 Pythonicanus 阅读(905) 评论(0) 推荐(0)
摘要:导入需要的模块,相应数据下载地址:https://grouplens.org/datasets/movielens/ 为了看一下Pandas的效率,这里计算了要处理文件的大小,以及load文件所需要的时间。结果显示,对于一个509Mb的csv文件,加载时间只需要8秒,效率还是比较高的。通过Panda 阅读全文
posted @ 2018-11-06 17:36 Pythonicanus 阅读(971) 评论(0) 推荐(0)