当前位置: 首页 > news >正文

网站的建立服装网站建设策划书可行性分析

网站的建立,服装网站建设策划书可行性分析,计划网站搭建,dedecms网站主页空白背景 以 ES 存储日志#xff0c;且需要对日志进行分页检索#xff0c;当数据量过大时#xff0c;就面临 ES 万条以外的数据检索问题#xff0c;如何利用滚动检索实现这个需求呢#xff1f;本文介绍 ES 分页检索万条以外的数据实现方法及注意事项。 需求分析 用 ES 存储数…背景 以 ES 存储日志且需要对日志进行分页检索当数据量过大时就面临 ES 万条以外的数据检索问题如何利用滚动检索实现这个需求呢本文介绍 ES 分页检索万条以外的数据实现方法及注意事项。 需求分析 用 ES 存储数据分页检索当 ES 数据量过大时在页面上直接点击最后一页时怎么保证请求能正常返回 常规思路就是超过万条以后使用滚动检索但需要注意编写滚动检索的分页查询时滚动请求的 size 一定不能用页面分页参数的 pageSize 要能快速滚动到目标页所在的数据最好以 ES 最大检索窗口值。 算法要点 第一滚动检索的 Request 请求不能包含 from 属性 且设置了 size 参数后以后的每次滚动返回的数据量都以 size 为主。 第二滚动获取数据的 size 选取。 滚动分页检索高效的关键是不能以页面分页参数 pageSize 作为滚动请求的 size 而是以一个较大的数或者直接以 ES 默认的滚动窗口最大值 10000 作为每批次获取的数据量。 第三计算目标页的数据所在的位置。 根据分页参数计算出目标数据的位置是 [(pageSize-1)*pageSize, pageSize * pageNo] 为了拿到目标页的数据总共的数据量 total pageNo * pageSize。目标数据在最终数据中的真正范围决定因素mode total % 10000。计算滚动请求几次能拿到目标数据。实际需要滚动请求的次数 scrollCount mode 0 ? total/ esWindowCount : (total/ esWindowCount 1) 。目标页的数据有没有分布在两次请求中。当 10000 % pageSize !0 时说明这一页的数据会横跨两次 ES 请求。例如 pageSize 15pageNo 2667total 40005目标页的数据包含在最后两次请求中倒数第二次请求中有 10 条数据最后一次请求中有 5 条数据合起来才是一整页的 15 条数据。最后一页数据不足 pageSize 时最后一页数据真正的长度。 第四分页数据所在范围处理。 当最后一批次获取到数据后从中摘出目标页的数据时需要考虑的四种情况主要是 mode 和最终获取的数据总长度直接的关系 case 1上图左mode0 时存在最后一页不足 size 的情况realSize size - (windowSize-length) 。 case 2上图右length mode 时最后一页不足 size 的情况realSize size - (mode -length) 。 最终的数据区间是 [from,to ] [ length -realSize,length -1 ]。 数据总长度 end -start 1 realSize 。 case 3 上图左分页数据在 mode 往前推 size 条。 case 4上图右分页数据横跨两次请求两批数据组合成一页数据。 编码实现 编写 ES 滚动分页检索请求处理超过万条之外的查询操作 import lombok.extern.slf4j.Slf4j; import org.apache.commons.lang3.StringUtils; import org.elasticsearch.action.search.ClearScrollRequest; import org.elasticsearch.action.search.SearchRequest; import org.elasticsearch.action.search.SearchResponse; import org.elasticsearch.action.search.SearchScrollRequest; import org.elasticsearch.client.RequestOptions; import org.elasticsearch.client.RestHighLevelClient; import org.elasticsearch.common.settings.Settings; import org.elasticsearch.common.unit.TimeValue; import org.elasticsearch.common.xcontent.*; import org.elasticsearch.search.Scroll; import org.elasticsearch.search.SearchHit; import org.elasticsearch.search.SearchHits; import org.elasticsearch.search.SearchModule; import org.elasticsearch.search.builder.SearchSourceBuilder;import java.io.IOException; import java.util.*;Slf4j public class EsPageUtil {/*** 真正的 ES 连接对象*/private RestHighLevelClient client;public void initClient() {// TODO 初始化 client 对象}/*** 使用 DSL JSON 配置创建检索请求 Builder* param queryJson* return*/public SearchSourceBuilder createSearchSource(String queryJson) {if (StringUtils.isEmpty(queryJson)) {log.error(ElasticSearch dsl config is empty.);return null;}SearchSourceBuilder searchSourceBuilder new SearchSourceBuilder();try {SearchModule searchModule new SearchModule(Settings.EMPTY, false, Collections.emptyList());NamedXContentRegistry registry new NamedXContentRegistry(searchModule.getNamedXContents());XContentParser parser XContentFactory.xContent(XContentType.JSON).createParser(registry, LoggingDeprecationHandler.INSTANCE, queryJson);searchSourceBuilder.parseXContent(parser);return searchSourceBuilder;} catch (Exception e) {log.error(Parse dsl error., e);return null;}}/*** ES 分页查询:区分万条以内还是万条以外* param pageSize 分页size* param pageNo 查询页数* param indices 目标索引* param queryJson 查询 DSL JSON 格式字符串* return*/public MapString, Object queryByPage(int pageSize, int pageNo, String[] indices, String queryJson) {SearchSourceBuilder searchSourceBuilder createSearchSource(queryJson);if (searchSourceBuilder null) {return null;}// 创建请求对象SearchRequest searchRequest new SearchRequest(indices).source(searchSourceBuilder);MapString, Object result new HashMap();ListMapString, Object data null;int total pageSize * pageNo ;int maxEsWindow 10000;try {if (total 10000) {// 万条以内直接查询设置 from , size 属性searchSourceBuilder .from((pageNo - 1) * pageSize) .size(pageSize);SearchResponse response client.search(searchRequest, RequestOptions.DEFAULT);data parseResponseToListData(response);} else {// 万条以外以 ES 最大窗口值查询只设置size 属性searchSourceBuilder.size(maxEsWindow);data scrollQuery(maxEsWindow, pageSize, total, searchRequest);}} catch (IOException e) {log.error(ElasticSearch query error., e);}result.put(total , 0);result.put(data , data);return result;}/*** 滚动查询** param esWindowCount* param pageSize* param total* param searchRequest* return*/private List scrollQuery(int esWindowCount, int pageSize, int total , SearchRequest searchRequest) {List pageData new ArrayList(pageSize);//创建滚动,指定滚动查询保持的时间final Scroll scroll new Scroll(TimeValue.timeValueMinutes(10L));//添加滚动searchRequest.scroll(scroll);//提交第一次请求SearchResponse searchResponse null;String scrollId null;try {searchResponse client.search(searchRequest, RequestOptions.DEFAULT);//获取滚动查询idscrollId searchResponse.getScrollId();} catch (IOException e) {log.error(Elasticsearch request error., e);return pageData;}int counter 2;int mode total % esWindowCount;int realPageCount mode 0 ? total/ esWindowCount : (total/ esWindowCount 1);while (counter realPageCount) {// 设置滚动查询id从id开始继续向下查询SearchScrollRequest scrollRequest new SearchScrollRequest(scrollId);// 重置查询时间若不进行重置则在提交的第一次请求中设置的时间结束滚动查询将失效scrollRequest.scroll(scroll);// 提交请求获取结果try {searchResponse client.scroll(scrollRequest, RequestOptions.DEFAULT);} catch (IOException e) {log.error(Elasticsearch scroll request error., e);}// size 非 10 的整数则当前页数据横跨两个 Scroll 请求if (mode ! 0 mode pageSize counter (realPageCount -1)) {collectFirstPart(searchResponse, pageData, mode, pageSize);}// 更新滚动查询idscrollId searchResponse.getScrollId();counter;}// 收集最后一次响应结果中的数据collectPageData(searchResponse, pageData, mode, pageSize, esWindowCount);// 滚动查询结束时清除滚动ClearScrollRequest clearScrollRequest new ClearScrollRequest();clearScrollRequest.addScrollId(scrollId);try {client.clearScroll(clearScrollRequest, RequestOptions.DEFAULT);} catch (IOException e) {log.error(Elasticsearch clear scroll info error., e);}return pageData;}/*** param searchResponse* param mode* param size* return*/public void collectFirstPart(SearchResponse searchResponse, ListMapString, Object firstPartData, int mode, int size) {int firstPartCount size - mode;// 只截取响应结果中的 结尾 size - mode 部分的内容SearchHits hits searchResponse.getHits();SearchHit[] dataList hits.getHits();int from dataList.length - firstPartCount;for (int i from; i dataList.length; i) {firstPartData.add(dataList[i].getSourceAsMap());}log.info(Mode less than size, first part data is here {} ., firstPartCount);}/*** 滚动到最后一组数据中包含目标页的数据从中摘出来* param searchResponse* param mode* param size* param esWindowCount* return*/public void collectPageData(SearchResponse searchResponse, ListMapString, Object pageData, int mode, int size, int esWindowCount) {SearchHits hits searchResponse.getHits();SearchHit[] dataList hits.getHits();int from 0;int length dataList.length;if (mode 0) { // 刚好在万条结尾// 不够一页if (length esWindowCount) {int realSize size - (esWindowCount - length);from (length - realSize ) 0 ? (length - realSize ) : 0;} else {// 总长够一页from length esWindowCount ? (length - size) : 0;}} else if (length mode){ // 最后一页且总长不足 sizeint realSize size - (mode - length);from (length - realSize) 0 ? (length - realSize) : 0;} else if (mode size){ // 中间部分from (mode - size) 0 ? (mode -size) : 0;} else { // mode size 说明是一页数据的下半部分from 0;size mode;log.info(Page data is across two request ,this response has {} ., mode);}// 收集目标数据for (int i from; i from size i length; i) {pageData.add(dataList[i].getSourceAsMap());}}/*** 解析 ES 响应结果为数据集合* param response* return*/public static ListMapString, Object parseResponseToListData(SearchResponse response){ListMapString, Object listData new ArrayList();if (response null) {return listData;}// 遍历响应结果SearchHits hits response.getHits();SearchHit[] hitArray hits.getHits();listData new ArrayList(hitArray.length);for (SearchHit hit : hitArray) {MapString, Object sourceAsMap hit.getSourceAsMap();listData.add(sourceAsMap);}// 返回结果return listData;} }启示录 滚动查询时优化了 size 用一万相比用页面的分页参数 pageSize 可以解决数据量过大时直接从页面点击最后一页导致页面卡死长时间无响应的问题。 页面分页参数最大不过 100当总数量几百万、pageSize10分页跳转查询后面某页 如 3000 时ES 的滚动请求次数 是 3000 次而优化后滚动请求 3次第三次中的一万条数据的最后10条即本页的数据。 话说回来ES 数据量过大时用分页查询靠后的数据时也没多大的价值了列表宽泛条件查询结果过大时谁看得过来呢
http://www.yutouwan.com/news/484395/

相关文章:

  • 青岛免费模板建站有好的学网站建设的书吗
  • 基础微网站开发代理商wordpress伪静态格式
  • 中小企业网站制作多少钱十堰网站建设公司
  • 织梦网站如何做二级导航免费wordpress 主题下载
  • 聊城做网站的公司价位南宁企业建站系统模板
  • 开发网站申请企业官网网页设计
  • 做设计有哪些接私活的网站公园网站建设方案 ppt
  • 天河电子商务网站建设火车头 wordpress 发布接口
  • 仿淘宝网站网站seo优化心得
  • 科技企业网站设计南宁网站开发培训
  • 服装网站建设优点有哪些兰州哪有建设网站的
  • 如何查询网站备案时间查询衣柜做网站的关键词
  • 济宁网站制作唐人展示型网页设计
  • 陕西住房和建设厅网站wordpress wp-postviews插件
  • 重庆好的网站制作公司宁德seo公司
  • 国外特效网站wordpress的上传大小
  • 医药电子商务网站建设徐州市工程建设交易平台
  • 千博网站管理系统安装怎么样创建一个网站
  • 如何做网站弹窗广告可以访问违规网站的浏览器
  • 网站换服务器怎么做建设工程施工合同 示范文本
  • wordpress菜单项目边距和填充什么是seo优化推广
  • 阿里云网站托管长沙网站开发微联讯点官网
  • .net 网站开发教程成都中小企业网站建设
  • 网站建设 盘网互联如何做音乐网站
  • 百度怎样建立一个网站wordpress启用GZIP压缩
  • 查询网站备案进度免费登记照制作app
  • 高端网站搭建临汾建设局网站
  • 网站内页一般多久收录优化推荐
  • 网站开发研发工程师岗位职责微商城网站建设市场
  • 做网站怎么赚钱 知乎茶叶网站模板下载