摘要: 数据在千万级别上进行全文检索有哪些技术?强大的大数据全文索引解决方案-ClouderaSearch 1.lucene (solr, elasticsearch 都是基于它) 2.sphinx 3.elasticsearch 简单易用。天生分布式。 4.HBasene(注意HBase后面加了ne就是 HBase+lucene)。 solr的请求基本都封装为了http,如果是http服务效率不好呢绕过它,直接透过lucene的API进行查询。 但是solr云的方式部署进行了负载均衡,效率不会太差。 应用查询条件最多20个左右,10个solr节点,每个节点的数据1亿左右。 但是索引不是写在本地磁盘,是写在hdfs上的。 阅读全文
posted @ 2017-01-16 16:28 大自然的流风 阅读(8049) 评论(0) 推荐(0)