随笔分类 -  大数据

2018年sxt视频学习
摘要:如下拓扑图 ## 上表代码输出 11!!!,22!!! 阅读全文
posted @ 2019-09-29 23:48 星回中道 阅读(534) 评论(0) 推荐(0)
摘要:straggling 美 ['strægl] v. 杂乱地蔓延;落伍(straggle 的现在分词) adj. 凌乱的 推测执行机制:默认是关闭的(spark任务慢,启动新线程从头执行);对于ELT数据入库,不能开启此机制,避免数据重复。 v. 杂乱地蔓延;落伍(straggle 的现在分词) ad 阅读全文
posted @ 2019-09-17 00:13 星回中道 阅读(327) 评论(0) 推荐(0)
摘要:https://www.scala-lang.org/ http://spark.apache.org/docs/1.6.3/ java、scala 基于jvm concise adj. 简明的,简洁的 The Scala Programming Language Scala combines object-oriented and functional programming in... 阅读全文
posted @ 2019-09-14 23:36 星回中道 阅读(424) 评论(0) 推荐(0)
摘要:lucene : 倒排索引 如下: 我 (1:1) {0} 表示第一行出现一次,索引位置为0 elasticsearch 部署 elasticsearch-2.2.1.zip 192.168.112.101 node1 192.168.112.102 node2 192.168.112.103 node3 三台机器,每台机器上都部署。 es不能以roo... 阅读全文
posted @ 2019-09-10 22:07 星回中道 阅读(375) 评论(0) 推荐(0)
摘要:时间参数格式举例: js-sdk,java-sdk startURL工具画时序图 node204 上安装nginx(tengine) js-sdk,java-sdk访问方法: 亦可以在命令行运行时的参数。 单节点配置 多节点配置 AVRO 格式(通过RPC发送数据) kafka 与flume一般组对 阅读全文
posted @ 2019-08-25 12:07 星回中道 阅读(2081) 评论(0) 推荐(0)