当前位置：

Elasticsearch深度分页全解：从原理到跳页实战

时间:2025-11-03 18:24:07 出处:应用开发阅读（143）

在数据爆炸的度分到跳时代，分页查询已成为系统标配功能。页全原理页实但当面对亿级数据量时，度分到跳传统的页全原理页实分页方式却可能成为压垮系统的最后一根稻草。本文将深入剖析Elasticsearch深度分页的度分到跳成因，并提供常见的页全原理页实解决方案.

1.深度分页：你以为的翻页，其实是度分到跳性能炸弹

分页机制剖析

当使用from+size进行分页时，Elasticsearch的站群服务器页全原理页实处理流程暗藏隐患

Elasticsearch深度分页全解：从原理到跳页实战

复制# 典型分页请求示例 GET /orders/_search { "from": 1000, "size": 10, "sort": [{"create_time": "desc"}] }1.2.3.4.5.6.7. 处理流程客户端请求第N页数据（from = 1000, size = 10）协调节点向所有分片广播查询请求每个分片在内存中计算排序，准备前1010条结果合并所有分片返回的度分到跳1010×分片数次数据最终截取第1000-1010条数据返回客户端性能灾难三宗罪复制# 查看默认最大分页限制 GET /_settings?include_defaults # 输出结果片段 "index.max_result_window" : "10000"1.2.3.4.

致命影响

内存黑洞：翻到第1000页时，单个分片需处理1000×size数据量网络风暴：分片数×数据量的页全原理页实跨节点传输消耗响应悬崖：页码超过max_result_window（默认1w）时直接报错

2.破局之道：Search After与Scroll API原理解析

Search After（游标分页核心原理）复制graph LR A[请求第一页] --> B(返回排序值游标) B --> C[携带游标请求下一页] C --> D{是否还有数据} D -- 是 --> C D -- 否 --> E[结束查询]1.2.3.4.5.6. 技术本质基于上一页最后一条记录的排序值进行分页避免全局排序，仅保持单次查询的度分到跳顺序一致性时间复杂度稳定为O(size)适用场景移动端瀑布流浏览后台连续分页查询需要实时性的分页需求Spring Boot实现复制// 构建基础查询 SearchSourceBuilder builder = new SearchSourceBuilder() .size(10) .sort(SortBuilders.fieldSort("create_time").order(SortOrder.DESC)) .sort(SortBuilders.fieldSort("_id")); // 保证排序唯一性 // 设置search_after参数 if (lastCreateTime != null && lastId != null) { builder.searchAfter(new Object[]{lastCreateTime, lastId}); } SearchRequest request = new SearchRequest("orders") .source(builder);1.2.3.4.5.6.7.8.9.10.11. Scroll API（滚动查询）核心原理复制graph TB A[初始化Scroll] --> B(获取scroll_id) B --> C[使用scroll_id分批获取] C --> D{是否完成} D -- 否 --> C D -- 是 --> E[清除Scroll上下文]1.2.3.4.5.6. 技术本质创建查询的快照视图通过保持搜索上下文实现批次获取适合非实时的云南idc服务商大数据量处理适用场景全量数据导出离线数据分析大数据迁移场景Spring Boot实现复制// 初始化滚动查询 SearchRequest request = new SearchRequest("orders"); request.scroll(TimeValue.timeValueMinutes(1L)); // 保持上下文1分钟 // 后续获取批次数据 SearchScrollRequest scrollRequest = new SearchScrollRequest(scrollId); scrollRequest.scroll(TimeValue.timeValueSeconds(30L));1.2.3.4.5.6.

3.跳页难题解决方案

跳页问题本质剖析复制graph TD A[用户请求第N页] --> B{是否缓存过位置} B -- 是 --> C[直接使用缓存游标] B -- 否 --> D[估算近似位置] D --> E[二次校准查询] E --> F[返回精确结果]1.2.3.4.5.6. 技术挑战无法直接定位到任意偏移量传统分页方式性能不可接受需要平衡准确性与性能混合分页策略复制public SearchResult queryProducts(int targetPage) { if (targetPage <= 100) { return traditionalPaging(targetPage); // 传统分页 } else if (targetPage <= cachedMaxPage) { return searchAfterWithCache(targetPage); // 带缓存的search_after } else { return timeRangeFilterPaging(targetPage); // 时间范围过滤分页 } }1.2.3.4.5.6.7.8.9. 跳页缓存层设计复制// Redis存储分页快照 public void cachePageSnapshot(int pageNum, Object[] searchAfterValues) { String key = "product_list:page:" + pageNum; redisTemplate.opsForValue().set(key, searchAfterValues, 5, TimeUnit.MINUTES); } // 获取缓存游标 public Object[] getCachedSnapshot(int pageNum) { String key = "product_list:page:" + pageNum; return (Object[]) redisTemplate.opsForValue().get(key); }1.2.3.4.5.6.7.8.9.10.

4.性能优化全景方案

实测数据对比

分页方式

10页耗时

100页耗时

1000页耗时

内存消耗

From/Size

120ms

450ms

超时失败

高

Search_After

80ms

85ms

90ms

低

Scroll

100ms

110ms

120ms

中

测试环境：3节点集群，单个索引10个分片，页全原理页实500万测试数据

5.最佳实践指南

前端设计原则使用无限滚动替代传统分页提供精准过滤条件展示总条数范围而非精确值后端防御策略复制// 分页参数校验 public void validatePageParams(int page,度分到跳 int size) { if (page > MAX_ALLOWED_PAGE) { throw new BusinessException("超出最大可查询页数"); } if (size > 100) { throw new BusinessException("单页数量不可超过100"); } }1.2.3.4.5.6.7.8.9. 监控预警方案复制# 监控search_after上下文 GET _nodes/stats/indices/search?filter_path=**.open_contexts # 检查scroll上下文 GET _nodes/stats/indices/search?filter_path=**.scroll_current1.2.3.4.

当面对强制要求的精确跳页场景时，可考虑预计算+二级缓存方案。页全原理页实通过定时任务预先建立热点页的度分到跳游标映射表，结合短时缓存实现快速跳转。您在实际项目中是如何解决这个难题的？

源码库

分享到：

上一篇：Win10自由截图快捷键探秘（轻松掌握Win10自由截图的快捷键技巧）

下一篇：如何更换旧电脑的网卡（简单易懂的教程，轻松升级你的网络连接）

温馨提示：以上内容和图片整理于网络，仅供参考，希望对您有帮助！如有侵权行为请联系删除！

思维库

Elasticsearch深度分页全解：从原理到跳页实战

1.深度分页：你以为的翻页，其实是度分到跳性能炸弹

2.破局之道：Search After与Scroll API原理解析

3.跳页难题解决方案

4.性能优化全景方案

5.最佳实践指南

猜你喜欢

热门排行

看了又看

最新标签

友情链接：