君子博学而日参省乎己 则知明而行无过矣

博客园 首页 新随笔 联系 订阅 管理

随笔分类 -  lucene.net&solr

上一页 1 2 3 4 5 6 7 下一页

摘要:本文接着分析连接器及其构造工厂相关设计及源码,先浏览一下下面的UML模型图:ConnectorFactory为Connector类型连接器接口,ConnectorInstanceFactor为工厂实现类(这里是反射工厂);Connector接口下面的实现类均为具体的连接器类;ConnectorFac... 阅读全文
posted @ 2013-03-20 00:22 刺猬的温驯 阅读(496) 评论(0) 推荐(0) 编辑

摘要:前面的源码分析由于沿着方法调用跟踪,还有部分类及接口未来得及分析,这里要说的是LoadManagerFactory接口与LoadManager接口及相关类等,先浏览一下UML模型图:这里又是工厂模式,这里的LoadManagerFactory接口及实现类HostLoadManagerFactory源码我就不贴出来了下面分析LoadManager接口源码:/** * Interface for a {@link LoadManager} implementations. */public interface LoadManager extends BatchResultRecorder { /. 阅读全文
posted @ 2013-03-19 04:13 刺猬的温驯 阅读(292) 评论(0) 推荐(0) 编辑

摘要:这里分析一下FeedConnection接口及其实现类GsaFeedConnection相关源码:FeedConnection接口源码如下:/** * Interface for a feed connection. This takes in a data source name and a data * source object that contains the data to be sent. The actual connection to * the feed server should be established by the implementation during *. 阅读全文
posted @ 2013-03-19 03:33 刺猬的温驯 阅读(408) 评论(0) 推荐(0) 编辑

摘要:接下来继续分析PusherFactory类及Pusher类的相关源码实现先浏览一下相关UML模型图:我们从该图可以看到,连接器最终是通过FeedConnection类型对象向应用中心发送xmlfeed数据的(勘误:企业搜索引擎开发之连接器connector(六)中的UML图 这部分有点出入)PusherFactory类是Pusher类的工厂类,现在来看PusherFactory源码:/** * Interface for a factory that creates {@link Pusher} instances for use by a * {@link com.google.enterp 阅读全文
posted @ 2013-03-19 03:10 刺猬的温驯 阅读(328) 评论(0) 推荐(0) 编辑

摘要:接下来继续分析TimedCancelable类及QueryTraverser类TimedCancelable类的源码如下:/** * A {@link TimedCancelable} for running a {@link Connector} batch using * a {@link Traverser} */class CancelableBatch implements TimedCancelable { private static final Logger LOGGER = Logger.getLogger(CancelableBatch.class.getName(... 阅读全文
posted @ 2013-03-19 01:48 刺猬的温驯 阅读(308) 评论(0) 推荐(0) 编辑

摘要:在继续分析TimedCancelable类及QueryTraverser类之前有必要熟悉一下ThreadPool类和TaskHandle类, 这两者的作用是以线程池的方式执行连接器的功能ThreadPool类源码如下:/** * Pool for running {@link TimedCancel... 阅读全文
posted @ 2013-03-19 01:14 刺猬的温驯 阅读(399) 评论(0) 推荐(0) 编辑

摘要:在继续分析源码前,有必要熟悉一下连接器的UML模型图,不然面对那错综芜杂的依赖关系难免使人无法理清头绪先熟悉一下下面的uml模型:我画的该图示不全的,为的是避免细节的干扰而更能够清晰的表述连接器的UML模型ConnectorCoordinatorImpl类通过成员变量ThreadPool调用实现多线... 阅读全文
posted @ 2013-03-18 22:13 刺猬的温驯 阅读(390) 评论(0) 推荐(0) 编辑

摘要:沿着方法的调用一路这么跟踪源码,有时未免使人陷入细节而找不到方向,可是对于全局的把握而又不得不跟踪这些源码入手上文的Instantiator接口及其实现类SpringInstantiator管理着全局的连接器类型及其实例现在接下来跟踪ConnectorCoordinator接口,该接口主要是操作具体... 阅读全文
posted @ 2013-03-18 05:07 刺猬的温驯 阅读(460) 评论(0) 推荐(0) 编辑

摘要:实例化类Instantiator的功能主要是提供操作连接器实例的一些接口,基本上servlet对外提供的接口最终都会调用实例化类的相关方法先浏览一下Instantiator接口的源码/** * Interface for instantiator component. */public interf... 阅读全文
posted @ 2013-03-17 04:32 刺猬的温驯 阅读(460) 评论(0) 推荐(0) 编辑

摘要:由于一直忙于公司产品的开发工作,企业搜索引擎的连接器分析及constellio源码分析因此长时间没有更新,本次继续这项未竟事业连接器管理都是通过servlet对外提供通信接口,由此从连接器管理提供的servlet着手,寻求分析连接器的入口该系统提供的servlet的uml模型图如下这些servlet... 阅读全文
posted @ 2013-03-17 03:23 刺猬的温驯 阅读(719) 评论(0) 推荐(0) 编辑

摘要:插件工厂类PluginFactory.java/** * Constellio, Open Source Enterprise Search * Copyright (C) 2010 DocuLibre inc. * * This copyrighted material is made avail... 阅读全文
posted @ 2013-02-17 22:30 刺猬的温驯 阅读(544) 评论(0) 推荐(0) 编辑

摘要:我们再看constellio系统实现索引功能的源码IndexingManager.java/** * Constellio, Open Source Enterprise Search * Copyright (C) 2010 DocuLibre inc. * * This copyrighted material is made available to anyone wishing to use, modify, * copy, or redistribute it subject to the terms and conditions of the GNU * Lesser Genera 阅读全文
posted @ 2013-02-17 03:12 刺猬的温驯 阅读(477) 评论(0) 推荐(0) 编辑

摘要:先看搜索功能的实现源码,下面是搜索功能接口SearchServices.java/** * Constellio, Open Source Enterprise Search * Copyright (C) 2010 DocuLibre inc. * * This copyrighted material is made available to anyone wishing to use, modify, * copy, or redistribute it subject to the terms and conditions of the GNU * Lesser General Pub 阅读全文
posted @ 2013-02-17 02:55 刺猬的温驯 阅读(730) 评论(0) 推荐(0) 编辑

摘要:因为constellio系统的类比较多,先从搜索引擎最本质的功能模块索引与检索入手,看constellio系统实现索引与检索功能的源码首先是获取solr上下文,下面是SolrCoreContext.java源码/** * Constellio, Open Source Enterprise Search * Copyright (C) 2010 DocuLibre inc. * * This copyrighted material is made available to anyone wishing to use, modify, * copy, or redistribute it su 阅读全文
posted @ 2013-02-17 02:42 刺猬的温驯 阅读(597) 评论(0) 推荐(1) 编辑

摘要:以下为spring的配置文件 constellio.xml,对基础服务类进行配置<?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:util="http://www.springframework.org/schema/util& 阅读全文
posted @ 2013-02-17 02:17 刺猬的温驯 阅读(941) 评论(1) 推荐(0) 编辑

摘要:转载:http://wiki.fnil.net/index.php?title=Solr4.0%E5%8D%87%E7%BA%A7%E5%8F%82%E8%80%83声明本Wiki上的任何文字信息均在GNU自由文档许可证1.3或更高版本下发布,如果用于任何商业用途都需经本人同意。任何转载都请注明出处。本Wiki上的内容来自本人的学习笔记,来源可能包括原创、书籍、网页、链接等,如果侵犯了您的知识产权,请与本人联系,我将及时删除。我的联系方式killme2008@gmail.com介绍最近负责solr集群的升级,从solr 3.x的一个shard集群升级到solr 4.0的cloud集群。WhyS 阅读全文
posted @ 2013-02-04 00:31 刺猬的温驯 阅读(1638) 评论(0) 推荐(0) 编辑

摘要:applicationContext.xml配置文件 OFF 19900 10000 1000 ... 阅读全文
posted @ 2013-01-27 23:51 刺猬的温驯 阅读(373) 评论(0) 推荐(0) 编辑

摘要:spring貌似要一统天下,不断的给人以惊喜请看官方发言:我很高兴的宣布 Spring Data Solr 项目首个里程碑发布,这是由Christoph Strobl领导开发的项目,实现了 Spring Data 访问 Solr 存储并提供了 Spring Data JPA 模型的访问方式。此次之外,Spring Data Solr 提供了一个更底层的 SolrTemplate 以方便启动一个嵌入式的 Solr 服务器https://github.com/SpringSource/spring-data-solrhttps://github.com/SpringSource/spring-da 阅读全文
posted @ 2013-01-05 22:30 刺猬的温驯 阅读(1027) 评论(0) 推荐(0) 编辑

摘要:http://code.google.com/p/google-enterprise-connector-manager/http://code.google.com/p/googlesearchapplianceconnectors/Connector developper guidehttps:... 阅读全文
posted @ 2012-12-02 15:55 刺猬的温驯 阅读(690) 评论(0) 推荐(0) 编辑

摘要:简介在本教程中,我们将通过解释性的例子介绍 Apache Tika 框架并解释它的概念(比如 N-gram、解析、mime 检测以及内容分析),这些例子不仅适用于老练的软件开发人员,而且也同样适用于内容分析和编程的初学者。我们假设您具有 Java™ 编程语言的应用知识以及用于分析的足够内容。通过本教程,您将学会:Apache Tika 的 API、最相关的模块以及相关的函数Apache Nutch (Tika 的先驱之一)以及它的 NgramProfiler 和 LanguageIdentifier 类,它们最近被移植到了 Tika代码页检测器项目 cpdetector 及其功能什么是 Apa 阅读全文
posted @ 2012-10-31 17:52 刺猬的温驯 阅读(809) 评论(1) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 下一页