• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
人生之路,职业之路
读书使人充实,交谈使人机敏,写记使人精确;
“动因+兴趣”——决心-持之以恒-见效
博客园    首页    新随笔    联系   管理    订阅  订阅

随笔分类 -  pig

(转)Pig 重写加载函数和存储函数UDF

摘要:pig自带的pigstorage不能指定行分隔符,所以自己重写了一个简单的UDF类,可以指定列和行的分隔符,之前研究过的简单的,http://blog.csdn.net/ruishenh/article/details/12048067但是弊端大,所以这次重写一下。操作步骤打好包上传到服务器,gru... 阅读全文
posted @ 2014-04-18 16:41 FreeBird 阅读(2008) 评论(0) 推荐(0)
pig 自定义udf中读取hdfs 文件

摘要:最近几天,在研究怎么样把日志中的IP地址转化成具体省份城市。希望写一个pig udfIP数据库采用的纯真IP数据库文件qqwry.dat,可以从http://www.cz88.net/下载。这里关键点在于怎么样读取这个文件,浪费了二天时间,现在把代码记录下来供和我遇到相同问题的朋友参考。pig sc... 阅读全文
posted @ 2014-04-18 15:50 FreeBird 阅读(2406) 评论(0) 推荐(0)

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3