会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
再抽烟是
博客园
首页
新随笔
联系
订阅
管理
2020年11月25日
hive学习笔记
摘要: Hive使用 (一)概念 概念: 由Facebook 开源用于解决海量结构化日志的数据统计工具 基于hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类sql查询功能 本质:将 hql 转化成 mapreduce 程序 Hive 处理的数据存储在 HDFS Hive 分析数
阅读全文
posted @ 2020-11-25 20:26 再抽烟是
阅读(102)
评论(0)
推荐(0)
2020年11月12日
hadoop HDFS数据流程
摘要: Hadoop理论 HDFS数据写流程 收到写入数据请求,通过创建Distributed Filesystem(分布式文件系统) 向namenode发送请求、检查文件和路径是否存在 namenode --> 客户端: 是否可以上传 客户端 -->namenode: 第一个 block 上传到哪个dat
阅读全文
posted @ 2020-11-12 21:43 再抽烟是
阅读(45)
评论(0)
推荐(0)
2020年11月11日
hadoop 安装过程
摘要: Hadoop 的安装 使用配置好的单台虚拟机、要克隆出 3台 。创建集群。 步骤:打开VMware Workstation 虚拟机 -- 选择完整的关闭状态的虚拟机 右键 -- 管理 --克隆(1.1) -- 下一步 (1.2)-下一步 (1.3)--选中创建完整克隆(1.4)--设置名称和存储位置
阅读全文
posted @ 2020-11-11 20:31 再抽烟是
阅读(146)
评论(0)
推荐(0)
2020年11月10日
大数据生态体系
摘要: (四)大数据生态体系 数据来源层: 结构化数据、非结构化数据、半结构化数据(文件日志) 数据传输层:sqoop 传输数据库数据的软件 、 flume 是传输日志文件 、 kafka传输非结构化数据的 数据存储层:Hadoop 中 HDFS 主要存储工具、 Hbase 非关系型数据库、kafka也可以
阅读全文
posted @ 2020-11-10 20:46 再抽烟是
阅读(213)
评论(0)
推荐(0)
Mavnen 问答题
摘要: 什么是Maven? Maven 是一个开源的自动化构建工具,管理项目。 maven 是利用 (project object model)项目对象模型、控制构建的过程,管理依赖 使用Maven的好处以及原因? 节约存储空间、让项目更轻巧、避免重复文件、节约时间 节约存储空间:使用maven不用每次创建
阅读全文
posted @ 2020-11-10 07:51 再抽烟是
阅读(75)
评论(0)
推荐(0)
2020年11月9日
Maven笔记
摘要: Maven使用 (一)定义 架构 浏览器 表示层 --视图层(H5、css)、控制层(Servlet/Action) 业务逻辑:业务逻辑处理(spring IOC AOP) 持久化层: jdbc 操作数据库:mysql、sql lite 当前问题 一个项目就是一个工程:模块太多不适合package来
阅读全文
posted @ 2020-11-09 20:41 再抽烟是
阅读(58)
评论(0)
推荐(0)
2020年10月27日
jdbc笔记
摘要: 二、JDBC使用 (一)定义 主要定义 java DataBase Connectivity -- java 数据库链接(低级接口)(Hibermate 开源代码对JDBC进行轻量封装) 官方定义的一套操作所有关系型数据库的规则、及接口。各个数据库厂商实现这个接口,可以根据数据库厂商提供数据库驱动j
阅读全文
posted @ 2020-10-27 21:31 再抽烟是
阅读(61)
评论(0)
推荐(0)
2020年10月23日
mysql 简单函数总结
摘要: (9)常见函数 一、字符串函数 concat(a,b,c) 字符串 s1,s2 等多个字符串合并为一个字符串 insert(a,x,len,b) 字符串 b 替换 a 的第x 个位置 替换长度为 len .如果len 过大 、超过的消失 lower(s) 所有字母变小写 upper(s) 所有字母专
阅读全文
posted @ 2020-10-23 21:30 再抽烟是
阅读(119)
评论(0)
推荐(0)
2020年10月21日
mysql笔记
摘要: (5)索引 (1)是对数据库表中一列或者多列的值进行排序的一种结构, (2)单独的、物理的数据库结构 (3)索引消耗数据库空间的、 (4)某一列或多列的值集合和相应的指向表中物理标识、数据页的逻辑指针清单 (5)加快了 查询速度、降低了 增、删、改速度(索引页文件较大) (6)普通索引、唯一性索引、
阅读全文
posted @ 2020-10-21 22:34 再抽烟是
阅读(88)
评论(0)
推荐(0)
2020年10月20日
MySQL笔记
摘要: 一、数据库 1、持久化:把数据保存到掉电式存储设备中以供之后使用、(内存 > 数据库中(磁盘、xml数据文件)) 2、定义:Database 存储数据的“仓库”,保存一系列有组织的数据。 3、DBMS : 数据库管理系统 : 用来管理数据库的大型软件、建立和使用、维护数据库。 4、MySQL 44.
阅读全文
posted @ 2020-10-20 20:52 再抽烟是
阅读(105)
评论(0)
推荐(0)
公告