会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
苗苗姨的小狼狗
博客园
首页
新随笔
联系
订阅
管理
2019年7月16日
C++常见面试题:
摘要: 一、进程和线程的概念和区别 1、进程是系统进行资源调度的基本单位 2、线程是系统进行运算调度(处理器分配{CPU、内存})的基本单位 二、进程间的通信 进程间的通信共有5种: 1、管道 通常指无名管道 它可以看成是一种特殊的文件,对于它的读写也可以使用普通的read、write 等函数。但是它不是普
阅读全文
posted @ 2019-07-16 10:30 苗苗姨的小狼狗
阅读(438)
评论(0)
推荐(0)
2019年7月12日
强-大数据第九讲
摘要: Spark基础 第一节:什么是Spark?Spark的特点和结构 1、什么是Spark? Spark是一个针对大规模数据处理的快速通用引擎。 类似MapReduce,都进行数据的处理 2、Spark的特点: (1)基于Scala语言、Spark基于内存的计算 (2)快:基于内存 (3)易用:支持Sc
阅读全文
posted @ 2019-07-12 11:48 苗苗姨的小狼狗
阅读(177)
评论(0)
推荐(0)
强-大数据第八讲
摘要: 基于Hadoop的WordCount源码示例: 一、WordCountMain.java package demo; import java.io.IOException; import org.apache.hadoop.conf.Configuration;import org.apache.h
阅读全文
posted @ 2019-07-12 11:38 苗苗姨的小狼狗
阅读(142)
评论(0)
推荐(0)
强-大数据第七讲
摘要: MapReduce入门 第一节:回顾:MapReduce的编程模型 第二节:WordCount的流程分析 1、伪分布环境运行WordCount hadoop jar hadoop-mapreduce-examples-2.4.1.jar wordcount /data/input/data.txt
阅读全文
posted @ 2019-07-12 11:33 苗苗姨的小狼狗
阅读(129)
评论(0)
推荐(0)
强-大数据第六讲
摘要: HDFS的基本操作 第一节:HDFS的相关命令 -mkdir 在HDFS创建目录 hdfs dfs -mkdir /data -ls 查看当前目录 hdfs dfs -ls / -ls -R 查看目录与子目录 -put 上传一个文件 hdfs dfs -put data.txt /data/inpu
阅读全文
posted @ 2019-07-12 11:29 苗苗姨的小狼狗
阅读(134)
评论(0)
推荐(0)
强-大数据第五讲
摘要: 搭建Hadoop的环境 准备实验的环境: 1、安装Linux、JDK 2、配置主机名、免密码登录 3、约定:安装目录:/root/training 安装: 1、解压 : tar -zxvf hadoop-2.4.1.tar.gz -C /root/training/ 2、设置环境变量: vi ~/.
阅读全文
posted @ 2019-07-12 11:25 苗苗姨的小狼狗
阅读(146)
评论(0)
推荐(0)
强-大数据第四讲
摘要: Hadoop的背景起源三 : BigTable > 大表 > NoSQL数据库:HBase 第一节:关系型数据库(Oracle、MySQL、SQL Server)的特点 1、什么是关系型数据库?基于关系模型(基于二维表)所提出的一种数据库 2、ER(Entity-Relationalship)模型:
阅读全文
posted @ 2019-07-12 11:15 苗苗姨的小狼狗
阅读(129)
评论(0)
推荐(0)
强-大数据第三讲
摘要: Hadoop的背景起源二:MapReduce 一、什么是大数据,本质? (1)数据的存储:分布式文件系统(分布式存储) > HDFS: Hadoop Distributed File System (2)数据的计算:分布式计算 二、如何解决大数据的计算?分布式计算 (1)什么是PageRank(Ma
阅读全文
posted @ 2019-07-12 10:58 苗苗姨的小狼狗
阅读(114)
评论(0)
推荐(0)
强-大数据第二讲
摘要: Hadoop的背景起源一: GFS: Google File System 一、什么是大数据,本质? (1)数据的存储:分布式文件系统(分布式存储) > HDFS: Hadoop Distributed File System (2)数据的计算:分布式计算 二、如何解决大数据的存储? > 分布式文件
阅读全文
posted @ 2019-07-12 10:33 苗苗姨的小狼狗
阅读(180)
评论(0)
推荐(0)
大数据第一讲
摘要: 第一讲:大数据基础入门 第一节:为什么要学习大数据 1、目的:很好工作 2、对比:Java开发和大数据开发 第二节:什么是大数据? 举例: 1、商品推荐: 问题:(1)大量的订单如何存储? (2)大量的订单如何计算? 2、天气预报: 问题:(1)大量的天气数据如何存储?(2)大量的天气数据如何计算?
阅读全文
posted @ 2019-07-12 10:32 苗苗姨的小狼狗
阅读(314)
评论(0)
推荐(0)
下一页
公告
昵称:
苗苗姨的小狼狗
园龄:
6年7个月
粉丝:
3
关注:
20
<
2025年6月
>
日
一
二
三
四
五
六
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
4
5
6
7
8
9
10
11
12
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
C++面试大全
(1)
随笔分类
C++(1)
大数据方向(12)
随笔档案
2019年7月(13)
阅读排行榜
1. 基于Spark的电影推荐系统(1948)
2. C++常见面试题:(438)
3. 大数据第一讲(314)
4. 强-大数据第二讲(180)
5. 强-大数据第九讲(177)
点击右上角即可分享