09 2015 档案
如何能让hadoop或者spark等处理excel文件——保存成csv
摘要:工作中遇到一个表,用来筛选信息。但是表现在是excel,为了能在spark中使用,找了下解决办法http://stackoverflow.com/questions/4125385/java-how-to-convert-xls-data-into-txt-file最简单的办法就是保存成csv格式。
阅读全文
SPARK SQL 中registerTempTable与saveAsTable的区别
摘要:使用registerTempTable注册表是一个临时表,生命周期只在所定义的sqlContext或hiveContext实例之中。换而言之,在一个sqlontext(或hiveContext)中registerTempTable的表不能在另一个sqlContext(或hiveContext)中使用...
阅读全文
第一篇博客 如小蜂定一个计划
摘要:每周工作学习时间 10*工作日 + 1 * 休息日每周至少一篇分享。提高自己的数据分析挖掘,做code,学算法,学架构,学机器学习,学大数据。
阅读全文
浙公网安备 33010602011771号