solr学习入门

像Solr这样的搜索引擎处理的数据的特点

以文本为中心:文档的文本包含用户感兴趣的内容,考虑文本中的字段是否包含需要查询的信息

读主导:写入的时候做好了多次读取和重复读取的准备,如果需要对已有的 数据进行快速的随机的写操作,用Cassandra

面向文档:文档是平面结构,不存在嵌套,不依赖于别的文档,像视频文件(二进制)应该存储在CDN内容分发网络中

灵活的模式:索引的文档不必具有统一的结构。如房屋出租和销售的搜索应用里有共用的字段。

 

Solr不是google这样的网络搜索引擎,solr不具备网络搜索引擎优化(SEO)方面的功能。提供了强大的关键词搜索,排名检索和信息发现,通过分片与复制两个维度进行扩展。

 

倒排索引是一种专门用于匹配查询词项与文本文档的数据结构。Google使用MapReduce技术构建大规模的倒排索引。

 

posted on 2018-03-06 14:04  mingfi  阅读(167)  评论(0)    收藏  举报

导航