[ solr入门 ] - Searching过程粗略梳理

solr-searching过程分析（一）

——searching过程粗略梳理

下午看了一会solr的启动过程，往细的看相当繁琐。换个头绪先看看solr的searching过程。

1.拦截请求，解析请求并构建相应的handler。

首先他将被SolrDispatchFilter拦截。

doFilter(ServletRequest request, ServletResponse response, FilterChain chain)

通过对request的分析，获知当前request是做什么的（/select），并构造相应的handler（SearchHandler）。

2.SolrCore出面处理上层工作（具体工作交由handler处理）

将handler、SolrQueryRequest、SolrQueryResponse交由solrCore的execute方法处理

public void execute(SolrRequestHandler handler, SolrQueryRequest req, SolrQueryResponse rsp)

在该方法中主要还是由handler来完成的。

SolrRequestHandler是一个接口，他主要的方法就是：

public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp);

SolrRequestHandler的实现类的结构图如下：

其中RequestHandlerBase为大部分的Handler实现了部分功能，主要包括

public void handleRequest(SolrQueryRequest req, SolrQueryResponse rsp){
　　......
　　handleRequestBody( req, rsp );
　　......
}

然而具体怎么做就交给具体的子类去执行了！（handleRequestBody( req, rsp );）

例如：这里是做检索，那么就交由SearchHandler处理。

（这里的设计方式有点类似于servlet，GenericSerlet实现了一些公用方法，而具体的则有其子类完成，例如HttpServlet）

3.SearchHandler具体的检索过程

现在的检索没有使用shards，在跟踪代码的过程中，发现以下过程是检索的主要环节。

if(!rb.isDebug()) {
        // Process
        for( SearchComponent c : components ) {
          c.process(rb);
        }
      }

从中可知真正的检索需要经过多个SearchComponent，在当前的实验环境下包括6个，如下：

4.各个SearchComponent配合工作完成检索

我们先重点了解QueryComponent。

获得SolrIndexSearcher，这个对象是检索的主要执行者。

同时获取SolrIndexSearcher.QueryCommand、SolrIndexSearcher.QueryResult，并将其作为查询条件和查询结果提交给SolrIndexSearcher进行检索。

searcher.search(result,cmd);

在SolrIndexSearcher中search方法如下：

public QueryResult search(QueryResult qr, QueryCommand cmd) throws IOException {
    getDocListC(qr,cmd);
    return qr;
  }

getDocListC又是一个比较复杂的方法，在这里加入的cache。

如果当前检索被缓存了（缓存也是个重点内容，后续详细分析！），那么直接返回结果，否则重新进行检索，检索的方法是：

private void getDocListNC(QueryResult qr,QueryCommand cmd)

在该方法中，和我们使用lucene进行检索十分相似，采用的具体方法是：

super.search(query, luceneFilter, collector);

检索完成将结果进行封装，放入QueryResult当中。

qr.setDocList(new DocSlice(0,sliceLen,ids,scores,totalHits,maxScore));

检索完成后，将结果放入缓存中，“造福后人”！

至此QueryComponent的工作就算完成了。

那么后面5个Component就直接过了（没有真正被执行）。

5.收尾工作

将结果封装好，写入相应的ResponseHeaders，关闭SolrQueryRequest、solrCore。

-----------------------------------------------------

以上是solr-searching最粗略的过程，本着先脉络后细节的思想，以后再对各个重要环节做深入分析。

searching主要执行方法如下：

SolrDispatchFilter（doFilter,execute）

->SolrCore(execute)

->RequestHandlerBase(handleRequest)

->SearchHandler(handleRequestBody) //有可能执行多个Component

->QueryComponent(process)

->SolrIndexSearcher(search,getDocListC)

posted on 2012-02-09 23:33 huangfox 阅读(3007) 评论(0) 编辑收藏举报

刷新页面返回顶部