One-Way
爱一人,攀一山,追一梦
上一页 1 2 3 4 5 6 ··· 12 下一页
摘要: Java 命令行编译成class,然后在打包成jar文件。 编译成class 可以通过javac 命令查看帮助 -classpath 指定依赖的class,:进行分隔 -d 生成的class存放的目录 打包成jar 将class目录下的内容全部打包,并且将自己写的MANIFEST.MF文件打包,以便 阅读全文
posted @ 2017-09-25 16:05 单行道| 阅读(4634) 评论(0) 推荐(0) 编辑
摘要: Mapreduce打印调试内容: 一、启动JobHistoryServer 通过jps查看JobHistoryServer进程存在,启动成功。 在8088端口,查看作业,点击History: 点击logs: 提示: 接下来修改配置 二、修改yarn配置文件 yarn-site.xml 重启hadoo 阅读全文
posted @ 2017-09-21 23:37 单行道| 阅读(763) 评论(0) 推荐(0) 编辑
摘要: Hive表的分区就是一个目录,分区字段不和表的字段重复 创建分区表: 加载数据到hive分区表中 方法一:通过load方式加载 方法二:insert select 方式 方法三:可通过手动上传文件到分区目录,进行加载 虽然方法三手动上传文件到分区目录,但是查询表的时候是查询不到数据的,需要更新元数据 阅读全文
posted @ 2017-09-19 11:13 单行道| 阅读(19009) 评论(0) 推荐(2) 编辑
摘要: 数据的导入: 通过文件导入,使用load命令 一、导入本地文件: 二、导入hdfs文件: 差别主要在 local 参数, overwrite 参数会删除之前的数据,然后再进行插入。 通过过已有的表数据进行导入,使用insert命令: 注意,这里的数据导入,是在已经存在表结构的前提下进行的。 数据导出 阅读全文
posted @ 2017-09-18 17:17 单行道| 阅读(300) 评论(0) 推荐(0) 编辑
摘要: 创建表的三种方式: 方式一:新建表结构 方式二:复用已有的表结构 方式三:拷贝表结构和表数据 内部表:managed_table外部表:external_table 内部表被删除时,hdfs上的数据,和元数据(mysql)上的数据都被删除。 外部表被删除时,hdfs上的数据还在,只删除元数据(mys 阅读全文
posted @ 2017-09-18 16:53 单行道| 阅读(672) 评论(0) 推荐(0) 编辑
摘要: 创建表: 执行查询SQL: 阅读全文
posted @ 2017-09-18 16:27 单行道| 阅读(356) 评论(0) 推荐(0) 编辑
摘要: 又重新安装Hive,记录一下吧: hadoop早已经装上了。 cdh5的hive下载地址: http://archive.cloudera.com/cdh5/cdh/5/ 下载文件:hive-1.1.0-cdh5.10.0.tar.gz 操作系统版本:CentOS CentOS Linux rele 阅读全文
posted @ 2017-09-18 15:49 单行道| 阅读(2010) 评论(0) 推荐(0) 编辑
摘要: 需求:ftp获取远程数据的文件,根据文件的创建时间点下载文件。 可以自行扩展根据文件的大小等其他需求。 知识点总结: 1、获取文件的时间: 时间内容: Sep 8 16:03 2、时间格式转换 转换结果: 201709081603 3、指定文件名,正则匹配 注意awk里面模式变量用' '括起来,.* 阅读全文
posted @ 2017-09-15 15:19 单行道| 阅读(5154) 评论(0) 推荐(0) 编辑
摘要: 图例参考:http://matplotlib.org/gallery.html API参考:http://matplotlib.org/api/pyplot_summary.html 阅读全文
posted @ 2017-08-28 12:50 单行道| 阅读(420) 评论(0) 推荐(0) 编辑
摘要: 一、使用git更新GitHub 准备:本地已经安装好git 登录GitHub,选择好仓库,点击 Clone or download 拷贝地址 这里的地址为:https://github.com/edward0130/Coursera-ML.git 本地在要存放仓库的文件目录上点击右键: 进入bash 阅读全文
posted @ 2017-08-25 12:27 单行道| 阅读(390) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 12 下一页