10 2016 档案

摘要:不得不说DataFrame现在很火,现在已经有很多库都是基于DataFrame写的,而且它用起来也很方便,读excel只需要一行代码,想当初xlrd可是让我头疼了好久,所以对于用python处理大数据的人来说,pandas是必须要了解的。对于一个数据处理工具... 阅读全文
posted @ 2016-10-26 22:53 xtfge0915 阅读(1483) 评论(0) 推荐(0)
摘要:裁剪数据大概是我们最常用的功能之一了吧,geotrellis的Tile类有两个方法,一个是localMask,一个是mask,tile.localMask(r: Tile, readMask: Int, writeMask: Int) 的作用是把对数据ti... 阅读全文
posted @ 2016-10-17 17:51 xtfge0915 阅读(547) 评论(0) 推荐(0)
摘要:spark的机器学习库(MLlib)下有简单的回归分析方法,今天只说最简单的线性回归,spark提供有两个回归分析库(mllib和ml),我学习的时候在网上也查了不少资料,有一个奇怪的现象是网上关于spark回归分析的资料基本全是mllib,关于ml的基本没... 阅读全文
posted @ 2016-10-17 16:36 xtfge0915 阅读(370) 评论(0) 推荐(0)