Elasticsearch,使用scroll实现遍历(分页)查询

在使用 es 中，当某个 index 存贮的数据超过 10000 时，只能查询到 10000 的数据。因为 index.max_result_window 默认值是 10000。并且使用游标查询可以在一次查询中获取大量文档，并且保持查询快照状态，允许用户多次检索数据而不影响其他并发请求。

进行GET请求查询，返回结果中会多一个scroll_id,该id是有时效性。

GET demo/_search?scroll=1m
{
  "query": {
    "match_all": {}
  }
}

将请求体中修改成scroll和scroll_id的形式，请求内容会根据第一次请求。

GET demo/_search/scroll
{
   "scroll":"1m",
   "scroll_id":[scroll_id]
}

返回一个新的scroll_id，作为下一次请求参数。

如同第二步，不过每一次都要把上一次请求返回的的scroll_id作为下一次的参数。
所以在代码中可以使用循环来获取所有数据。
当数据请求完成后，就结束循环。

posted @ 2024-04-08 10:32 急鲨车阅读(1143) 评论(0) 收藏举报

刷新页面返回顶部

G-Sucker