随笔分类 -  技术概念

摘要:Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像Hadoop的一样的日志数据和离线分析系统, 阅读全文
posted @ 2017-12-13 11:46 w_band 阅读(140) 评论(0) 推荐(0)
摘要:ANTLR是指可以根据输入自动生成语法树并可视化的显示出来的开源语法分析器。ANTLR—Another Tool for Language Recognition,其前身是PCCTS,它为包括Java,C++,C#在内的语言提供了一个通过语法描述来自动构造自定义语言的识别器(recognizer), 阅读全文
posted @ 2017-12-11 09:25 w_band 阅读(236) 评论(0) 推荐(0)
摘要:Elastic Search是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定, 阅读全文
posted @ 2017-12-10 17:26 w_band 阅读(303) 评论(0) 推荐(0)
摘要:RPC(Remote Procedure Call)——远程过程调用,它是一种通过网络从远程计算机程序上请求服务,而不需要了解底层网络技术的协议。RPC协议假定某些传输协议的存在,如TCP或UDP,为通信程序之间携带信息数据。在OSI网络通信模型中,RPC跨越了传输层和应用层。RPC使得开发包括网络 阅读全文
posted @ 2017-12-10 17:07 w_band 阅读(145) 评论(0) 推荐(0)
摘要:埋点(event tracking)埋点分析,是网站分析的一种常用的数据采集方法。数据埋点分为初级、中级、高级三种方式。数据埋点是一种良好的私有化部署数据采集方式。 埋点技术如何采集数据,有何优缺点? 数据埋点分为初级、中级、高级三种方式,分别为: 初级:在产品、服务转化关键点植入统计代码,据其独立 阅读全文
posted @ 2017-12-10 16:01 w_band 阅读(179) 评论(0) 推荐(0)
摘要:QPS:Query Per Second。每秒查询率QPS是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。 因特网上,作为域名系统服务器的机器的性能经常用每秒查询率来衡量。对应fetches/sec,即每秒的响应请求数,也即是最大吞吐能力。 一个系统吞吐量通常由QPS(TPS)、并发数 阅读全文
posted @ 2017-12-10 15:50 w_band 阅读(428) 评论(0) 推荐(0)
摘要:Flink 是一个针对流数据和批数据的分布式处理引擎。它主要是由 Java 代码实现。目前主要还是依靠开源社区的贡献而发展。对 Flink 而言,其所要处理的主要场景就是流数据,批数据只是流数据的一个极限特例而已。再换句话说,Flink 会把所有任务当成流来处理,这也是其最大的特点。Flink 可以 阅读全文
posted @ 2017-11-29 11:10 w_band 阅读(151) 评论(0) 推荐(0)
摘要:MetaQ(全称Metamorphosis)是一个高性能、高可用、可扩展的分布式消息中间件,思路起源于LinkedIn的Kafka,但并不是Kafka的一个Copy。MetaQ具有消息存储顺序写、吞吐量大和支持本地和XA事务等特性,适用于大吞吐量、顺序消息、广播和日志数据传输等场景,目前在淘宝和支付 阅读全文
posted @ 2017-11-22 21:06 w_band 阅读(251) 评论(0) 推荐(0)
摘要:Memcached 是一个高性能的分布式内存对象缓存系统,用于动态Web应用以减轻数据库负载。它通过在内存中缓存数据和对象来减少读取数据库的次数,从而提高动态、数据库驱动网站的速度。Memcached基于一个存储键/值对的hashmap。其守护进程(daemon )是用C写的,但是客户端可以用任何语 阅读全文
posted @ 2017-11-22 21:01 w_band 阅读(126) 评论(0) 推荐(0)
摘要:MemcacheDB是 一个开源项目,给memcached分布式缓存服务器添加了Berkeley DB的持久化存储机制和异步主辅复制机制,让memcached具备了事务恢复能力、持久化能力和分布式复制能力,非常适合于需要超高性能读写速度,但是 不需要严格事务约束,能够被持久化保存的应用场景。 Mem 阅读全文
posted @ 2017-11-22 20:58 w_band 阅读(241) 评论(0) 推荐(0)
摘要:Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。 Redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set( 阅读全文
posted @ 2017-11-22 20:54 w_band 阅读(210) 评论(0) 推荐(0)
摘要:Dubbo是Alibaba开源的分布式高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和Spring框架无缝集成。 Dubbo最大的特点是按照分层的方式来架构,使用这种方式可以使各个层之间解耦合(或者最大限度地松耦合)。从服务模型的角度来看,Dubbo采用的是一种 阅读全文
posted @ 2017-11-22 20:48 w_band 阅读(96) 评论(0) 推荐(0)
摘要:Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。 Docker 使用客户端-服务器 (C/S) 架构模式,使用远程API来管理和创建Docke 阅读全文
posted @ 2017-11-22 20:42 w_band 阅读(1009) 评论(0) 推荐(0)
摘要:YAML是“另一种标记语言”的外语缩写。它是一种直观的能够被电脑识别的数据序列化格式,是一个可读性高并且容易被人类阅读,容易和脚本语言交互,用来表达资料序列的编程语言。 它是类似于标准通用标记语言的子集XML的数据描述语言,语法比XML简单很多。 阅读全文
posted @ 2017-11-22 20:38 w_band 阅读(160) 评论(0) 推荐(0)