上一页 1 ··· 3 4 5 6 7
摘要: 首先ES没有库和表的概念,只有index,type,document(详细术语可以看ES的系列一 http://www.cnblogs.com/ulysses-you/p/6736926.html),如果要加快理解的话,可以和一般关系型数据库做简单映射 下面是对这些概念的理解 Index 1.ES的 阅读全文
posted @ 2017-05-15 19:36 ulysses_you 阅读(4533) 评论(0) 推荐(0) 编辑
摘要: 环境准备 linux centOS(工作环境) python3.4及以上 pip3 JDK8 git1.9及以上 gradle2.13及以上 准备过程中的坑 这些环境准备没什么太大问题,都是wget下来安装就行,唯一有一个python3安装的坑。 由于本人安装的是python3.6.1,pip3和s 阅读全文
posted @ 2017-05-10 08:30 ulysses_you 阅读(7302) 评论(3) 推荐(0) 编辑
摘要: elasticsearch(以下简称es)是一款开源的搜索引擎,基于apach lucene。最近在做nlp的时候顺便研究一下。 下面是官方列举的术语解释 Near Realtime 接近实时的查询,通常情况下,延迟在1s以内 Cluster 一个集群由1个或者多个节点组成,这些节点提供整个数据和索 阅读全文
posted @ 2017-04-20 09:07 ulysses_you 阅读(3171) 评论(0) 推荐(1) 编辑
摘要: 随着对spark的业务更深入,对spark的了解也越多,然而目前还处于知道的越多,不知道的更多阶段,当然这也是成长最快的阶段。这篇文章用作总结最近收集及理解的spark相关概念及其关系。 名词 driver driver物理层面是指输入提交spark命令的启动程序,逻辑层面是负责调度spark运行流 阅读全文
posted @ 2017-04-12 09:01 ulysses_you 阅读(683) 评论(0) 推荐(0) 编辑
摘要: 概述 常见的网络io分为两种情况,BIO(block-io)和NIO(non-block-io),分别位于java.io和java.nio。 BIO,是阻塞的io,采用一个线程处理一个连接的方式,就算这个连接什么消息都没有传递,该线程也无法去处理另外的连接。 NIO,相对于BIO,采用一个线程处理所 阅读全文
posted @ 2017-03-13 21:58 ulysses_you 阅读(349) 评论(0) 推荐(0) 编辑
摘要: The Zookeeper data model Zookeeper有一个树形的namespace,就像分布式文件系统一样,唯一区别就是这个namespace包括其子节点可以有关联的数据。就像文件系统允许有文件或者文件夹一样。节点的路径通常用绝对的,带/分隔的字符串表示。任何字符串都可以被使用除了下 阅读全文
posted @ 2017-02-27 08:48 ulysses_you 阅读(1865) 评论(0) 推荐(0) 编辑
摘要: 新的一年,新的开始,新的习惯,现在开始。 1.简介 Flink是德国一家公司名为dataArtisans的产品,2016年正式被apache提升为顶级项目(地位同spark、storm等开源架构)。并且在2016年里,共发布了包括1.0.0版本在内的10个版本,发展速度可想而知。这次学习的是Flin 阅读全文
posted @ 2017-01-28 16:27 ulysses_you 阅读(1461) 评论(0) 推荐(0) 编辑
上一页 1 ··· 3 4 5 6 7