随笔分类 - 大数据
2018年sxt视频学习
摘要:straggling 美 ['strægl] v. 杂乱地蔓延;落伍(straggle 的现在分词) adj. 凌乱的 推测执行机制:默认是关闭的(spark任务慢,启动新线程从头执行);对于ELT数据入库,不能开启此机制,避免数据重复。 v. 杂乱地蔓延;落伍(straggle 的现在分词) ad
阅读全文
摘要:https://www.scala-lang.org/ http://spark.apache.org/docs/1.6.3/ java、scala 基于jvm concise adj. 简明的,简洁的 The Scala Programming Language Scala combines object-oriented and functional programming in...
阅读全文
摘要:lucene : 倒排索引 如下: 我 (1:1) {0} 表示第一行出现一次,索引位置为0 elasticsearch 部署 elasticsearch-2.2.1.zip 192.168.112.101 node1 192.168.112.102 node2 192.168.112.103 node3 三台机器,每台机器上都部署。 es不能以roo...
阅读全文
摘要:时间参数格式举例: js-sdk,java-sdk startURL工具画时序图 node204 上安装nginx(tengine) js-sdk,java-sdk访问方法: 亦可以在命令行运行时的参数。 单节点配置 多节点配置 AVRO 格式(通过RPC发送数据) kafka 与flume一般组对
阅读全文


浙公网安备 33010602011771号