随笔分类 - Pandas
摘要:Pandas是一个非常好用的数据处理包,那么处理同样的数据,不同的方法其效率能差多少呢? 首先看一下数据的形式,很小的一组数据,不到34万行,10列。 数据的处理方法也很简单,就是一个简单的条件语句if,用其中的一列,对比另外一列的大小,条件满足,在状态列表里加个1,条件不满足就加个0。 测试1:
阅读全文
摘要:导入需要的模块,相应数据下载地址:https://grouplens.org/datasets/movielens/ 为了看一下Pandas的效率,这里计算了要处理文件的大小,以及load文件所需要的时间。结果显示,对于一个509Mb的csv文件,加载时间只需要8秒,效率还是比较高的。通过Panda
阅读全文

浙公网安备 33010602011771号