会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
一剑侵心
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
6
7
8
9
10
11
12
13
14
···
16
下一页
2018年2月24日
nginx 配置文件
摘要: nginx的配置文件是 nginx.conf,按照上一篇的配置,是在 /opt/programs/tengine/conf 目录下。 #定义Nginx运行的用户和用户组user shj shjgrp; #nginx进程数,建议设置为等于CPU总核心数 = CPU数 * 核数,如果有4个双核CPU,则
阅读全文
posted @ 2018-02-24 16:36 一剑侵心
阅读(189)
评论(0)
推荐(0)
2018年2月22日
nginx 安装遇到的问题
摘要: 今天想学学 nginx,于是先把它安装起来。按照 http://nginx.org/en/linux_packages.html 上面的方法,在我的 ubuntu 虚拟机上很容易地就安装好了。可是要运行的时候,找了半天也没找到。搜了一下,才知道是放在了 /etc/init.d 下,可是配置文件又不知
阅读全文
posted @ 2018-02-22 21:35 一剑侵心
阅读(523)
评论(0)
推荐(0)
2018年2月1日
Spark BlockManager 概述
摘要: Application 启动的时候: 1. 会在 SparkEnv 中实例化 BlockManagerMaster 和 MapOutputTracker,其中 (a) BlockManagerMaster: 对整个集群的 Block 数据进行管理的 (b) MapoutputTrackerMaste
阅读全文
posted @ 2018-02-01 09:29 一剑侵心
阅读(335)
评论(0)
推荐(0)
2018年1月31日
Hive 学习
摘要: Hive 的官方文档: https://cwiki.apache.org/confluence/display/Hive/Home#Home-HiveVersionsandBranchesHiveVersionsHiveVersionsandBranches 个人感觉官方文档比较乱,一般学习都是从
阅读全文
posted @ 2018-01-31 22:39 一剑侵心
阅读(341)
评论(0)
推荐(0)
2018年1月29日
Shell 学习
摘要: Shell编程 shell :弱类型、 解释型语言 解释器:bash 一、变量 bash的变量类型: 环境变量 本地变量(局部变量) 位置变量 特殊变量:bash内置的用来保存某些特殊数据的变量。(也叫系统变量) 本地变量:只属于某一个bash的变量。 var_name=值 作用域:整个bash进程
阅读全文
posted @ 2018-01-29 20:38 一剑侵心
阅读(225)
评论(0)
推荐(0)
2018年1月19日
Spark 性能调优零散知识
摘要: 1. 如果 Spark 中 CPU 的使用率不够高,可以考虑为当前的程序分配更多的 Executor, 或者增加更多的 Worker 实例来充分的使用多核的潜能 2. 适当设置 Partition 分片数是非常重要的,过少的 Partition 分片数可能会因为每个 Partition 数据量太大而
阅读全文
posted @ 2018-01-19 19:59 一剑侵心
阅读(396)
评论(0)
推荐(0)
2018年1月14日
Spark Checkpoint 概述
摘要: 有时候,Transformation 的 RDD 非常多或者具体 Transformation 产生的 RDD 本身计算特别复杂和耗时,此时我们必须考虑对计算结果数据进行持久化。与 persist 不同,persist 是优先将结果放入内存,内存不够的情况下,会放在磁盘。无论是放内存还是磁盘,都是不
阅读全文
posted @ 2018-01-14 21:58 一剑侵心
阅读(998)
评论(0)
推荐(0)
2018年1月11日
CacheManager 概述
摘要: 1. CacheManager 管理缓存,而缓存可以是基于内存的缓存,也可以是基于磁盘的缓存 2. CacheManager 需要通过 BlockMananger 来操作数据; 3. 当 Task 运行的时候会调用 RDD 的 compute 方法来进行计算,而 compute 方法会调用 iter
阅读全文
posted @ 2018-01-11 20:21 一剑侵心
阅读(974)
评论(0)
推荐(0)
2018年1月8日
某人视频教学中提到的一些问题
摘要: 1. RDD1 和 RDD2 进行 Join 操作, 其中采用采样的方式发现 RDD1 中有严重的数据倾斜的 Key 第一步: 采用 Spark RDD 中提供的采样接口,基于采样的数据可以计算出哪个(哪些)Key 的 Values 个数最多 第二步:把全休数据分成两部分,即把原来一个RDD1 变成
阅读全文
posted @ 2018-01-08 21:40 一剑侵心
阅读(169)
评论(0)
推荐(0)
某人视频中提到的 Spark Streaming 优化的几点事项
摘要: 某人,并未提他的名字,是因为看的视频是1年前的,视频里他吹得厉害。我看视频时,查了一下他在视频里说的要做到的东西,结果上网一查,就看到了很多人说他骗了钱后,就不管交了学费的人了。真假无从查起。但是无风不起浪。也真没查到他说的要做出来的东西发布出来。所以这里不那人的名字了。只把他说的知识拿过来,做些笔
阅读全文
posted @ 2018-01-08 21:39 一剑侵心
阅读(1467)
评论(0)
推荐(0)
上一页
1
···
6
7
8
9
10
11
12
13
14
···
16
下一页
公告