随笔分类 -  java

摘要:Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现..随着内容管理应用程序的日益普及,对用于内容仓库的普通、标准化 API 的需求已凸现出来。Content Repository for Java Technology API (JS... 阅读全文
posted @ 2016-01-05 17:23 二郎那个三郎
摘要:Apache Camel 是一个非常强大的基于规则的路由以及媒介引擎,该引擎提供了一个基于POJO的 企业应用模式(Enterprise Integration Patterns)的实现,你可以采用其异常强大且十分易用的API (可以说是一种Java的领域定义语言 Domain Specific L... 阅读全文
posted @ 2016-01-05 17:22 二郎那个三郎
摘要:安全是企业应用中不可缺少的功能,在众多权限框架中,Shiro(其前身是JSecurity)因其简单而又不失强大的特点引起了不少开发者的注 意。随着Grails的关注度越来越高,在Grails社区也出现了Shiro的插件。 Shiro最早的名字是JSecurity,后来更名为Shiro并成为Apach 阅读全文
posted @ 2016-01-05 17:20 二郎那个三郎
摘要:Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。Hive是Facebook 2008年8月刚开源的一个数据仓库框架,其系统目标与... 阅读全文
posted @ 2016-01-05 17:20 二郎那个三郎
摘要:solr 名称来源Search On Lucene Replicationsolr 基本概况Apache Solr (读音:SOLer)是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 ApacheLucene实现。Apache Solr 中存储的资源是以 Docu... 阅读全文
posted @ 2016-01-05 17:19 二郎那个三郎
摘要:HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HB... 阅读全文
posted @ 2016-01-05 17:18 二郎那个三郎
摘要:ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。Zookeeper是Google的Chubb... 阅读全文
posted @ 2016-01-05 17:17 二郎那个三郎
摘要:PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。主要特性包括:从PDF提取文本合并PDF文档PDF 文档加密与解密与Lucene搜索引擎的集成填充PDF/XFDF表单数据从文本文件创建PDF文档从PDF页面创 建图片打印PD... 阅读全文
posted @ 2016-01-05 17:16 二郎那个三郎
摘要:Log4j是Apache的一个开放源代码项目,通过使用Log4j,我们可以控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务 器、NT的事件记录器、UNIX Syslog守护进程等;我们也可以控制每一条日志的输出格式;通过定义每一条日志信息的级别,我们能够更加细致地控制日志的生成过... 阅读全文
posted @ 2016-01-05 17:14 二郎那个三郎
摘要:HttpComponents 也就是以前的httpclient项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端/服务器编程工具包,并且它支持 HTTP 协议最新的版本和建议。不过现在的 HttpComponents 包含多个子项目,有:HttpComponents CoreH... 阅读全文
posted @ 2016-01-05 17:14 二郎那个三郎
摘要:JMeter是Apache组织的开放源代码项目,它是功能和性能测试的工具,100%的用java实现。 阅读全文
posted @ 2016-01-05 17:13 二郎那个三郎
摘要:Apache POI是一个开源的Java读写Excel、WORD等微软OLE2组件文档的项目。目前POI已经有了Ruby版本。结构:HSSF - 提供读写Microsoft Excel XLS格式档案的功能。XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。H... 阅读全文
posted @ 2016-01-05 17:12 二郎那个三郎
摘要:Facebook 在官方博客上宣布推出HBase数据库的升级版——HydraBase, Facebook是HBase的重度用户,Facebook的HBase数据库系统存储着Facebook的很多关键业务数据,包括内部监控系统、搜索索 引、流数据分析以及数据抓取等。HydraBase相比HBase稳定... 阅读全文
posted @ 2016-01-05 17:10 二郎那个三郎
摘要:Apache Commons Imaging 前身是 Apache Commons Sanselan ,这是一个用来读写各种图像格式的 Java 类库,包括快速解析图片的基本信息(大小、色彩空间、ICC配置等)和元数据。尽管慢点但非常好的可移植性。比起 ImageIO/JAI/Toolkit 更容易... 阅读全文
posted @ 2016-01-05 17:08 二郎那个三郎
摘要:Gora 是一个应用于NoSQL数据库的 ORM 框架,支持包括:ApacheHBase/ApacheCassandra 阅读全文
posted @ 2016-01-05 17:08 二郎那个三郎
摘要:Lens 提供了一个统一数据分析接口。通过提供一个跨多个数据存储的单一视图来实现数据分析任务切分,同时优化了执行的环境。无缝的集成Hadoop实现类似传统数据仓库的功能。该项目主要特性:简单元数据层为数据存储提供抽象视图层单一的共享模式服务器,基于 Hive 元存储。模式通过数据管道 HCatalo... 阅读全文
posted @ 2016-01-05 17:07 二郎那个三郎
摘要:Apache NiFi 是一个易于使用、功能强大而且可靠的数据处理和分发系统。Apache NiFi 是为数据流设计。它支持高度可配置的指示图的数据路由、转换和系统中介逻辑。架构:集群管理器:主界面:关键特性包括:基于web的用户界面无缝体验设计、控制和监视高度可配置的数据丢失容错和保证交付低延迟和... 阅读全文
posted @ 2016-01-05 17:03 二郎那个三郎
摘要:Apache Ignite 内存数组组织框架是一个高性能、集成和分布式的内存计算和事务平台,用于大规模的数据集处理。Ignite 为应用和不同的数据源之间提供一个高性能、分布式内存中数据组织管理的框架。集群计算特性:动态集群Fork-Join & MapReduce 处理分布式闭包执行负载均衡和容错... 阅读全文
posted @ 2016-01-05 17:02 二郎那个三郎
摘要:Kylin 是一个开源的分布式的 OLAP 分析引擎,来自 eBay 公司开发,基于 Hadoop 提供 SQL 接口和 OLAP 接口,支持 TB 到 PB 级别的数据量。Kylin 是:超级快的 OLAP 引擎,具备可伸缩性为 Hadoop 提供 ANSI-SQL 接口交互式查询能力MOLAP ... 阅读全文
posted @ 2016-01-05 17:01 二郎那个三郎
摘要:Apache CouchDB 是一个面向文档的数据库管理系统。它提供以 JSON 作为数据格式的 REST 接口来对其进行操作,并可以通过视图来操纵文档的组织和呈现。 CouchDB 是 Apache 基金会的顶级开源项目。CouchDB落实到最底层的数据结构就是两类B+Tree 。与现在流行的关系... 阅读全文
posted @ 2016-01-05 16:59 二郎那个三郎