01 2016 档案
摘要:以前的机器学习似乎是阳春白雪,只有大公司和尖端高校实验室才能玩得转。有一群人,他们的梦想是使机器学习技术变得下里巴人,让人人都能用机器学习。他们分布在两类从事机器学习技术研发的公司:提供机器学习技术平台机器学习API提供者专业造轮子工程师们的一句口头禅就是“不要重复造轮子”,意思是告诫工程师们应该把...
阅读全文
posted @ 2016-01-06 15:58
二郎那个三郎
摘要:阿里阿里的开源项目很多,这也跟@淘宝正明的开源态度密不可分。有很多重量级的项目,例如LVS、Tengine,或者很有实践价值的中间件,例如 MetaQ(分布式消息系统)、dubbo(RPC框架)、cobar(数据库中间件),或者是Java世界的工具,例如druid、fastjson。都说国内Java...
阅读全文
posted @ 2016-01-06 15:41
二郎那个三郎
摘要:struts简介Struts是Apache软件基金会(ASF)赞助的一个开源项目。它最初是jakarta项目中的一个子项目,并在2004年3月成为ASF的顶级项目。它通过采用JavaServlet/JSP技术,实现了基于JavaEEWeb应用的MVC设计模式的应用框架,是MVC经典设计模式中的一个经...
阅读全文
posted @ 2016-01-06 13:58
二郎那个三郎
摘要:Subversion exists to be universally recognized and adopted as an open-source, centralized version control system characterized by its reliability as...
阅读全文
posted @ 2016-01-06 13:51
二郎那个三郎
摘要:Apache Syncope is an Open Source system for managing digital identities in enterprise environments, implemented in Java EE technology and released und...
阅读全文
posted @ 2016-01-06 13:47
二郎那个三郎
摘要:Apache Synapse一个易于使用、轻量级的XML与Web Services管理和集成中间件。可用于搭建SOA和ESB的基础平台。Apache Synapse支持多种标准包括:XML、XSLT、XQuery、XPath、SOAP、POX/REST、HTTP/S、JMS、、FTP、 SFTP、W...
阅读全文
posted @ 2016-01-06 13:44
二郎那个三郎
摘要:为了更高效地运行存在依赖关系的作业(比如Pig和Hive产生的MapReduce作业),减少磁盘和网络IO,Hortonworks开发了DAG计 算框架Tez。Tez是从MapReduce计算框架演化而来的通用DAG计算框架,可作为MapReduceR/Pig/Hive等系统的底层数据处理 引擎,它...
阅读全文
posted @ 2016-01-06 13:37
二郎那个三郎
摘要:一、体系架构 Tajo采用了Master-Worker架构(下图虚线框目前还在计划中),Master-Worker-Client之间的RPC通信是使用Protocol buffer + Netty来实现的,具体如下:(1) TajoMaster:为客户端提供查询服务和管理各个QueryMaster...
阅读全文
posted @ 2016-01-06 13:33
二郎那个三郎
摘要:Apache TomEE,发音是“Tommy”,是一个经Apache、JavaEE6、Web框架认证的适配器,其在Tomcat服务器中是最强大的。Apache TomEE是由香草项目(简化常见编程任务领域的I / O,数据库,网络I / O,一般的数据格式)、Apache Tomcat、压缩文件等组...
阅读全文
posted @ 2016-01-06 13:24
二郎那个三郎
摘要:1. 缘起Jetspeed是Apache Jakarta小组的开放源码门户系统。它使得最终用户可以通过WAP手机、浏览器、PDA等各种设备来使用各种各样的网络资源(比如应用程序、数据以及这之外的任何网络资源)。在这里,Jetspeed扮演了一个处于信息和用户间的hub的角色。1999 年左右,Jet...
阅读全文
posted @ 2016-01-06 13:19
二郎那个三郎
摘要:tuscany是Apache组织关于SOA实现的一个开放源码的工程项目,目前处于孵化期阶段。 该项目主要基于SCA,SDO,DAS等技术上实现的。SCA 的基本概念以及 SCA 规范的具体内容并不在本文的范畴之内,有兴趣的读者可以通过一些相关文档了解相关内容,这也是阅读本文的基础。下面本文首先对 ...
阅读全文
posted @ 2016-01-06 13:17
二郎那个三郎
摘要:UIMA (Unstructured Information Management applications) 是一个软件系统,用来分析大量的非结构化信息从而发掘中对最终用户有用的知识点,一个最典型的 UIM 应用就是从文本文件中提取有用信息,例如人员、地址和组织等相关信息。下面是 UIMA 的结构...
阅读全文
posted @ 2016-01-06 13:13
二郎那个三郎
摘要:Ed Anuff上周宣布第一版 Usergrid 的代码已经发布,Usergrid 是一款适用于移动和富客户端应用的综合性平台。Ed 认为,良好的移动性指的是将设备中运行应用的良好交互带到云中,其中既包含服务,也包含相关的数据。 通常服务包含以下几个层面:用户管理社交互动应用对象和 API 集成内...
阅读全文
posted @ 2016-01-06 13:10
二郎那个三郎
摘要:Velocity是一个基于java的模板引擎(template engine)。它允许任何人仅仅简单的使用模板语言(template language)来引用由java代码定义的对象。 当Velocity应用于web开发时,界面设计人员可以和java程序开发人员同步开发一个遵循MVC架构的web站点...
阅读全文
posted @ 2016-01-06 12:02
二郎那个三郎
摘要:Apache VXQuery 是一个兼容标准的 XML 查询处理器的实现。主要适合非常大量的 XML 数据处理。参考:http://www.apache.org/
阅读全文
posted @ 2016-01-06 11:55
二郎那个三郎
摘要:【infoq】 Apache Wicket是一个功能强大、基于组件的轻量级Web应用框架,能将展现和业务逻辑很好地分离开来。你能用它创建易于测试、调试和支持的高质量Web 2.0应用。假设其他团队交付了一个基于Wicket的应用,你必须扩展该应用,但又不能修改他们的代码;或者你必须要交付一个模块化...
阅读全文
posted @ 2016-01-06 11:41
二郎那个三郎
摘要:从非技术的角度,来看待技术的发展,是一件很有意思的事情。 也是一件很有很现实的事儿。 换一个角度来看待自己从事的事情,会有不同的看法。
阅读全文
posted @ 2016-01-06 10:52
二郎那个三郎
摘要:原则上这不能说是一个持久层框架,它提供了一些Jdbc的操作封装来简化数据查询和记录读取操作。本站就是采用这个项目来读写数据库,代码非常简洁,如果你厌烦了Hibernate的庞大,不妨可以试试——DbUtils。给出一小段代码看看DbUtils是怎么用的:QueryRunner run = new Q...
阅读全文
posted @ 2016-01-05 17:50
二郎那个三郎
摘要:Apache MINA(Multipurpose Infrastructure for Network Applications) 是 Apache 组织一个较新的项目,它为开发高性能和高可用性的网络应用程序提供了非常便利的框架。当前发行的 MINA 版本支持基于 Java NIO 技术的 TCP/...
阅读全文
posted @ 2016-01-05 17:48
二郎那个三郎
摘要:OpenMeetings是一个多语言可定制的视频会议和协作系统。它支持音频、视频,能让你查看每个与会者的桌面。OpenMeetings还包含一个白板,通过白板可以导入各种格式的图片和涂鸦。在线演示:http://www.openmeetings.de/
阅读全文
posted @ 2016-01-05 17:47
二郎那个三郎
摘要:lume 是一个分布式、可靠和高可用的服务,用于收集、聚合以及移动大量日志数据,使用一个简单灵活的架构,就流数据模型。这是一个可靠、容错的服务。
阅读全文
posted @ 2016-01-05 17:46
二郎那个三郎
摘要:Apache Sirona 为 Java 应用程序提供了一个简单但可扩展的监控解决方案。apache/sirona
阅读全文
posted @ 2016-01-05 17:45
二郎那个三郎
摘要:Apache Derby是Apache软件基金会所研发的开放源码数据库管理系统;由于Derby是一个纯Java程式,因此只需要操作系统支援Java虚拟机,Derby便可执行。Derby是特别地为Java环境进行优化,Derby本身不仅是一个纯Java程式,而且Derby在执行用户的SQL程式时,能够...
阅读全文
posted @ 2016-01-05 17:43
二郎那个三郎
摘要:为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法,Apache 软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了Google's Dremel.Apache Drill 在基于 SQL 的数据分析和商业智能(BI)上引入了 JSON 文件模型,这使得用户...
阅读全文
posted @ 2016-01-05 17:39
二郎那个三郎
摘要:Apache OODT (Object Oriented Data Technology)OODT 面向对象的数据技术,开发和促进科学数据管理和归档制度,使跨学科和天体物理学之间的互操作性,行星和空间科学数据系统。使用OODT的分布式对象和数据库的框架内,由来自世界各地科学家和工程师在这些不同的学科...
阅读全文
posted @ 2016-01-05 17:36
二郎那个三郎
摘要:Mavibot™ 是个Java 的多版本并发控制 BTree,是 JDBM(当前Apache Directory 服务器的后端)的替代品, 但是有着更强的功能,能适应任意需要实现 Java MVCC BTree 的项目。
阅读全文
posted @ 2016-01-05 17:31
二郎那个三郎
摘要:ApacheDS(Apache Directory Server)的核心是目录服务,可以保存数据,并对不同类型的数据进行搜索操作。协议的实现在目录服务器顶层工作,提供与数据存储、搜索和检索有关的 Internet 服务。ApacheDS最重要的特性可能是利用不同协议公开目录服务的能力...
阅读全文
posted @ 2016-01-05 17:26
二郎那个三郎
摘要:Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI,Pdfbox并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。在当前的0.2-SNAPSHOT版本中, Tika提供了对如下...
阅读全文
posted @ 2016-01-05 17:25
二郎那个三郎
摘要:Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包...
阅读全文
posted @ 2016-01-05 17:24
二郎那个三郎
摘要:Apache Jackrabbit 是由 Apache Foundation 提供的 JSR-170 的开放源码实现..随着内容管理应用程序的日益普及,对用于内容仓库的普通、标准化 API 的需求已凸现出来。Content Repository for Java Technology API (JS...
阅读全文
posted @ 2016-01-05 17:23
二郎那个三郎
摘要:Apache Camel 是一个非常强大的基于规则的路由以及媒介引擎,该引擎提供了一个基于POJO的 企业应用模式(Enterprise Integration Patterns)的实现,你可以采用其异常强大且十分易用的API (可以说是一种Java的领域定义语言 Domain Specific L...
阅读全文
posted @ 2016-01-05 17:22
二郎那个三郎
摘要:安全是企业应用中不可缺少的功能,在众多权限框架中,Shiro(其前身是JSecurity)因其简单而又不失强大的特点引起了不少开发者的注 意。随着Grails的关注度越来越高,在Grails社区也出现了Shiro的插件。 Shiro最早的名字是JSecurity,后来更名为Shiro并成为Apach
阅读全文
posted @ 2016-01-05 17:20
二郎那个三郎
摘要:Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。Hive是Facebook 2008年8月刚开源的一个数据仓库框架,其系统目标与...
阅读全文
posted @ 2016-01-05 17:20
二郎那个三郎
摘要:solr 名称来源Search On Lucene Replicationsolr 基本概况Apache Solr (读音:SOLer)是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 ApacheLucene实现。Apache Solr 中存储的资源是以 Docu...
阅读全文
posted @ 2016-01-05 17:19
二郎那个三郎
摘要:HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HB...
阅读全文
posted @ 2016-01-05 17:18
二郎那个三郎
摘要:ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。Zookeeper是Google的Chubb...
阅读全文
posted @ 2016-01-05 17:17
二郎那个三郎
摘要:PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。主要特性包括:从PDF提取文本合并PDF文档PDF 文档加密与解密与Lucene搜索引擎的集成填充PDF/XFDF表单数据从文本文件创建PDF文档从PDF页面创 建图片打印PD...
阅读全文
posted @ 2016-01-05 17:16
二郎那个三郎
摘要:Log4j是Apache的一个开放源代码项目,通过使用Log4j,我们可以控制日志信息输送的目的地是控制台、文件、GUI组件、甚至是套接口服务 器、NT的事件记录器、UNIX Syslog守护进程等;我们也可以控制每一条日志的输出格式;通过定义每一条日志信息的级别,我们能够更加细致地控制日志的生成过...
阅读全文
posted @ 2016-01-05 17:14
二郎那个三郎
摘要:HttpComponents 也就是以前的httpclient项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端/服务器编程工具包,并且它支持 HTTP 协议最新的版本和建议。不过现在的 HttpComponents 包含多个子项目,有:HttpComponents CoreH...
阅读全文
posted @ 2016-01-05 17:14
二郎那个三郎
摘要:JMeter是Apache组织的开放源代码项目,它是功能和性能测试的工具,100%的用java实现。
阅读全文
posted @ 2016-01-05 17:13
二郎那个三郎
摘要:Apache POI是一个开源的Java读写Excel、WORD等微软OLE2组件文档的项目。目前POI已经有了Ruby版本。结构:HSSF - 提供读写Microsoft Excel XLS格式档案的功能。XSSF - 提供读写Microsoft Excel OOXML XLSX格式档案的功能。H...
阅读全文
posted @ 2016-01-05 17:12
二郎那个三郎
摘要:Hadoop 是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有着高容错性的特点,...
阅读全文
posted @ 2016-01-05 17:11
二郎那个三郎
摘要:Facebook 在官方博客上宣布推出HBase数据库的升级版——HydraBase, Facebook是HBase的重度用户,Facebook的HBase数据库系统存储着Facebook的很多关键业务数据,包括内部监控系统、搜索索 引、流数据分析以及数据抓取等。HydraBase相比HBase稳定...
阅读全文
posted @ 2016-01-05 17:10
二郎那个三郎
摘要:Apache Commons Imaging 前身是 Apache Commons Sanselan ,这是一个用来读写各种图像格式的 Java 类库,包括快速解析图片的基本信息(大小、色彩空间、ICC配置等)和元数据。尽管慢点但非常好的可移植性。比起 ImageIO/JAI/Toolkit 更容易...
阅读全文
posted @ 2016-01-05 17:08
二郎那个三郎
摘要:Gora 是一个应用于NoSQL数据库的 ORM 框架,支持包括:ApacheHBase/ApacheCassandra
阅读全文
posted @ 2016-01-05 17:08
二郎那个三郎
摘要:Lens 提供了一个统一数据分析接口。通过提供一个跨多个数据存储的单一视图来实现数据分析任务切分,同时优化了执行的环境。无缝的集成Hadoop实现类似传统数据仓库的功能。该项目主要特性:简单元数据层为数据存储提供抽象视图层单一的共享模式服务器,基于 Hive 元存储。模式通过数据管道 HCatalo...
阅读全文
posted @ 2016-01-05 17:07
二郎那个三郎
摘要:Apache NiFi 是一个易于使用、功能强大而且可靠的数据处理和分发系统。Apache NiFi 是为数据流设计。它支持高度可配置的指示图的数据路由、转换和系统中介逻辑。架构:集群管理器:主界面:关键特性包括:基于web的用户界面无缝体验设计、控制和监视高度可配置的数据丢失容错和保证交付低延迟和...
阅读全文
posted @ 2016-01-05 17:03
二郎那个三郎
摘要:Apache Ignite 内存数组组织框架是一个高性能、集成和分布式的内存计算和事务平台,用于大规模的数据集处理。Ignite 为应用和不同的数据源之间提供一个高性能、分布式内存中数据组织管理的框架。集群计算特性:动态集群Fork-Join & MapReduce 处理分布式闭包执行负载均衡和容错...
阅读全文
posted @ 2016-01-05 17:02
二郎那个三郎
摘要:Kylin 是一个开源的分布式的 OLAP 分析引擎,来自 eBay 公司开发,基于 Hadoop 提供 SQL 接口和 OLAP 接口,支持 TB 到 PB 级别的数据量。Kylin 是:超级快的 OLAP 引擎,具备可伸缩性为 Hadoop 提供 ANSI-SQL 接口交互式查询能力MOLAP ...
阅读全文
posted @ 2016-01-05 17:01
二郎那个三郎
摘要:Apache CouchDB 是一个面向文档的数据库管理系统。它提供以 JSON 作为数据格式的 REST 接口来对其进行操作,并可以通过视图来操纵文档的组织和呈现。 CouchDB 是 Apache 基金会的顶级开源项目。CouchDB落实到最底层的数据结构就是两类B+Tree 。与现在流行的关系...
阅读全文
posted @ 2016-01-05 16:59
二郎那个三郎
摘要:关于kafka说明可以参考: http://kafka.apache.org/documentation.html kafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性: 通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。 高吞吐量:
阅读全文
posted @ 2016-01-05 16:58
二郎那个三郎
摘要:Apache Cassandra是一套开源分布式Key-Value存储系统。它最初由Facebook开发,用于储存特别大的数据。Facebook目前在使用此系统。主要特性:分布式基于column的结构化高伸展性Cassandra的主要特点就是它不是一个数据库,而是由一堆数据库节点共同构成的一个分布式...
阅读全文
posted @ 2016-01-05 16:57
二郎那个三郎
摘要:Thrift 是一个软件框架(远程过程调用框架),用来进行可扩展且跨语言的服务的开发。它结合了功能强大的软件堆栈和代码生成引 擎,以构建在 C++, Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, JavaScript, Node...
阅读全文
posted @ 2016-01-05 16:55
二郎那个三郎
摘要:iBATIS一词来源于“internet”和“abatis”的组合,是一个由Clinton Begin在2001年发起的开放源代码项目。最初侧重于密码软件的开发,现在是一个基于Java的持久层框架。iBATIS提供的持久层框架包括SQL Maps和Data Access Objects(DAO),同...
阅读全文
posted @ 2016-01-05 16:54
二郎那个三郎
摘要:Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch的创始人是Doug Cutting,他同时也是Lucene、Hadoop和Avro开源项目的创始人。Nutch诞生于2002年8月,是Apache旗下的一个用Java实现的开...
阅读全文
posted @ 2016-01-05 16:52
二郎那个三郎
摘要:Lucene 是apache软件基金会一个开放源代码的全文检索引擎工具包,是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lu...
阅读全文
posted @ 2016-01-05 16:51
二郎那个三郎
摘要:hibernatespringspring MVCmybatisactivitistrutsjquery
阅读全文
posted @ 2016-01-05 16:12
二郎那个三郎
摘要:2015,我都做了什么,硕士毕了业,上了班,开始朝九晚五的生活,开始做别人的前辈指导后辈,谈了一两段恋爱。。。其实也没什么。很平淡,有时感觉人生也就这样,稀里糊涂,就这样过来了。现在的我没有那么多不舍,朋友也越来越少。是因为抽烟抽多了吗,呵呵。以前,脑子里对于生活和人生的撕裂感,都渐渐在消失。可能以...
阅读全文
posted @ 2016-01-05 15:06
二郎那个三郎

浙公网安备 33010602011771号