10 2016 档案
摘要:不得不说DataFrame现在很火,现在已经有很多库都是基于DataFrame写的,而且它用起来也很方便,读excel只需要一行代码,想当初xlrd可是让我头疼了好久,所以对于用python处理大数据的人来说,pandas是必须要了解的。对于一个数据处理工具...
阅读全文
摘要:裁剪数据大概是我们最常用的功能之一了吧,geotrellis的Tile类有两个方法,一个是localMask,一个是mask,tile.localMask(r: Tile, readMask: Int, writeMask: Int) 的作用是把对数据ti...
阅读全文
摘要:spark的机器学习库(MLlib)下有简单的回归分析方法,今天只说最简单的线性回归,spark提供有两个回归分析库(mllib和ml),我学习的时候在网上也查了不少资料,有一个奇怪的现象是网上关于spark回归分析的资料基本全是mllib,关于ml的基本没...
阅读全文

浙公网安备 33010602011771号