当前位置: 首页 > news >正文

网站开发项目章程示例手机网站开发ios

网站开发项目章程示例,手机网站开发ios,组建局域网,做设备租赁的网站简介#xff1a;随着2021年双11的完美落幕#xff0c;实时数仓技术在阿里双11场景也经历了多年的实践和发展。从早期的基于不同作业的烟囱式开发#xff0c;到基于领域分层建模的数仓引入#xff0c;再到分析服务一体化的新型融合式一站式架构#xff0c;开发效率逐步提升…简介随着2021年双11的完美落幕实时数仓技术在阿里双11场景也经历了多年的实践和发展。从早期的基于不同作业的烟囱式开发到基于领域分层建模的数仓引入再到分析服务一体化的新型融合式一站式架构开发效率逐步提升数据质量更有保证也沉淀了更多技术创新让我们看到了一些未来数仓开发、应用的可能性和趋势。下面我们来聊聊从阿里双11看到的实时数仓发展的一些趋势。 作者 | 梅酱、果贝 来源 | 阿里技术公众号 作者果贝阿里云资深技术专家 实时数仓Hologres负责人 2022年1月7日阿里云实时数仓Hologres举行了年度发布会在发布会上来自阿里的资深技术专家从阿里的核心场景出发为大家解读了实时数仓的新发展趋势“在线化、敏捷化、一站式”。通过本文我们将会深入解读实时数仓发展所面临的问题以及核心发展趋势以帮助大家更好的做产品选型和数仓规划。 实时数仓是现在大数据领域非常热门的一个概念和它同热度的大概就是湖仓一体了。经过十多年的发展大数据已经成为每家公司的标配。传统上离线数仓开源以Hive/Spark为代表闭源以阿里MaxCompute、Snowflake、AWS Redshift、Google BigQuery等为代表以及Vertica、Oracle、HANA等传统IT厂商流式计算以Flink/Spark Structured Streaming为代表数据服务层HBase、MySQL、ES、Redis等共同组成了大数据处理的标准架构Lambda架构。Lambda架构提供了实时数据的服务serving能力。但Lambda架构的典型问题是开发复杂、数据冗余和分析不灵活。 近几年以ClickHouse、Apache Doris、阿里Hologres等为代表的实时数仓兴起通过实时写入明细数据灵活交互式查询部分实现了去Lambda架构在实时性、灵活性、成本、管理和运维等多方面都达到了较好的平衡。 随着2021年双11的完美落幕实时数仓技术在阿里双11场景也经历了多年的实践和发展。从早期的基于不同作业的烟囱式开发到基于领域分层建模的数仓引入再到分析服务一体化的新型融合式一站式架构开发效率逐步提升数据质量更有保证也沉淀了更多技术创新让我们看到了一些未来数仓开发、应用的可能性和趋势。 下面我们来聊聊从阿里双11看到的实时数仓发展的一些趋势。 一 实时数仓已经成为业务标配 第一个趋势是实时数仓已经成为标配。 业务对时效的要求、对灵活性的要求越来越高从而使得实时数据变为一种刚需。而实时数仓在成本、灵活性上的巨大优势使得业务优先选择实时数仓作为实时数据的生产、存储和使用平台。在阿里巴巴Hologres服务了约90%的BU集群规模超过了60万core并保持100%的增长速度。在这些业务中有较常见的实时数仓场景比如 1、数字化运营这种场景上游对接Flink进行数据流式加工下游对接BI工具、数据大屏等实现业务的自助开发和上线。极大提升了开发效率和灵活性支持所见即所得的开发体验。 2、网络流量分析、Metrics分析通过对网络流量、及其他Metrics类数据的实时存储和监控可快速预警和定位设备潜在故障。在万亿级记录上查询秒级响应故障秒级发现。 3、实时物流跟踪通过实时数仓实现物流信息的实时跟踪保证物流流转状态的实时更新、实时查询。 在这些相对常见的实时数仓场景外因为分析服务一体化Hybrid Serving/Analytics Processing以下简称HSAP能力以及与之对应的Hologres高速纯实时写入能力和点查能力Hologres也被用在了很多非典型的实时数仓场景。例如 4、对商家的广告人群圈选通过Hologres对广大商家to B提供高QPS、低延迟的人群圈选和广告投放服务。 5、无人车送货Hologres承载无人车上商品的订单、物流等指标信息面向B端驿站实时汇报物流信息从而帮助驿站老板完成智能化包裹分拣、移动投柜等任务面向用户再通过系统调度运力实现”定时上门、送货到楼”。 6、搜索推荐中的特征存储和样本存储利用Hologres的强大点查能力实现实时样本feature store、实时特征sample store和实时算法效果分析。 7、客户全链路体验客服服务部门通过在Hologres存储客户的相关多渠道数据实现直接对消费者提供各种明细查询能力to C。 … 类似的场景还有很多数据的实时“被看见”“被使用”成为企业高速发展的原动力。 二 实时数仓支撑在线生产系统 第二个趋势就是实时数仓越来越成为生产系统的一部分。 传统上实时数仓数据仓库是一个非生产系统。因为它主要面对的是内部客户所以虽然大屏等重要性很高但实时数仓本质上并不在生产关键链路上也就是说如果实时数仓不可用了对客户的影响并不大。这也是为什么大部分实时数仓产品在高可用性、资源隔离、灾备等能力上和数据库等系统是有很大差距的。 传统上对外的服务是通过离线/流式加工结果点查来提供的即和用户交互的关键链路是结果点查通过HBase、Redis、MySQL这样的系统去承载。这种模式的好处是简单可靠但限制也是巨大的能提供的服务功能非常有限且不灵活。业务迫切希望能将内部的实时数仓能力以可控的方式开放给外部客户to B、to C并且保持内外两套系统在数据和逻辑上的一致性。上面列举的阿里广告、无人车送货、客户全链路体验等场景都是这种to B甚至to C的案例。 随着实时数仓作为一个服务对外提供用户对服务的并发度、可用性、稳定性都提出了更高的需求。这也是Hologres在过去一年中重点发力的地方。Hologres在过去一年中引入了多副本、热升级、快速failover、资源隔离、读写分离、灾备等能力实现了生产级高可用并在今年的双11中得到了很好的应用。举几个例子 阿里巴巴客户体验事业部Chief Customer Office以下简称CCO去年是业务上做了双链路写入和存储冗余来保证高可用。今年双11使用了Hologres原生高可用方案下掉手工双链路省去备用数据链路上实时任务开发、数据比对的人力投入减少链路切换时的数据不一致整体开发人力成本减少200人日环比去年降低50%以上减少了100用于实时重保的备份链路作业减少计算资源2000CU。 阿里巴巴数据技术及产品部Data Technology以下简称DT使用Hologres读写分离方案高吞吐写入和灵活查询互不干扰分析查询QPS增长80%的同时查询抖动明显减少。我们认为实时数仓的生产系统化是一个必然的趋势相信各个实时数仓产品都会逐步加码这方面的开发投入。 三 分析服务一体化HSAP 第三个趋势是分析服务的一体化HSAP。 Hologres是这方面的首倡者源头是阿里集团内的业务对分析服务一体化有强诉求分析服务一体化最佳实践首先在阿里内部落地但我们在业界也看到越来越多的产品和企业在倡导和实践分析服务一体化。 分析服务一体化HSAP可以从几个层面上去理解 最基础的是用户可以使用一套技术栈FlinkHologres去解决Ad-hoc Query分析对内和线上服务对内、to B、to C两个任务从而降低开发运维成本。传统上实时数仓做的是Ad-hoc Query而lambda架构实现的是线上服务。这两个在技术栈、数据链路、开发运维等都完全不同但处理的数据来源往往是同一份数据导致了大量的开发作业冗余同时数据的一致性也是大难题。而通过使用统一技术栈同时满足这两方面的需求开发、运维、治理变的简单。 以阿里CCO的场景为例数据写入到Hologres行存表后行存表写入吞吐高主键查询快更新场景Binlog开销低会通过Hologres表的binlog被Flink二次消费加工后存入Hologres的列存表提供分析列存对于统计类查询速度快。行存表提供线上服务/点查列存表提供分析能力。 更高层次的HSAP是用户可以在一个平台上用一份数据去实现Ad-hoc Query和线上服务两个任务同时实现良好的资源隔离和可用性。 例如今年双11 DT部门上了Hologres读写分离方案由两个Hologres实例分别负责实时写入和实时查询但共享一份底层数据存储同时有多个读实例分别负责不同类型的查询这样就可以保证读写隔离、分析查询和服务查询隔离且只有一份数据。也就是所谓的One DataMulti Workload。 分析服务一体化除了上述的好处外另外一个显著的优势是服务上线速度明显加快。因为一体化后分析和服务的边界变的模糊所以服务的开发和分析差异不大可以认为服务就是一种简单、固定pattern的分析。这样传统上服务上线的复杂流程就被大大简化了。当有紧急需求需要临时开发也能马上就上线无需繁琐的流程了。 我们相信分析服务一体化的理念随着像Hologres这样的产品的发展会在更多的场景落地。而这也会反哺像Hologres这样的HSAP产品将HSAP的理念、方法论、支持能力在产品中更好的沉淀下来从而让更多的用户更容易的从HSAP中获益。 四 实时数据治理成为刚需 第四个趋势是实时数据治理变的越来越重要。 实时数据对于企业来说有着致命的吸引力。因此企业会自觉不自觉的逐步加大实时数仓上的投入。而各企业的实时数仓因为实时性的要求往往没有实施离线数仓那么严密的方法论和管理体系。因为没有治理数据大量冗余或者不合理往往会导致成本急剧增大数据可信度下降。在阿里这样的超大企业中这块的成本就会突显出来这已经成为实时数仓的一种刚需。 通过对实时数仓、离线数仓、流式计算、消息队列等全链路进行数据治理可以实现数据没有“法外之地”从而在节省成本的同时提高数据的质量真正将数据变为企业的资产。 五 实时数仓的类数据库化 第五个趋势是实时数仓的类数据库化。 大数据诞生于对传统数据库的扬弃从NoSQL到NewSQL大数据产品走出了一条独立于数据库的路。但就像从NoSQL到NewSQL一样大数据产品中的实时数仓也在像数据库学习提供了和数据库更好的兼容性从而让用户能以更低的成本使用实时数仓产品。 这包含几个方面 操作SQL化以及和传统数据库在协议、语法上的兼容性从而方便开发同学可以用习惯的工具BI、开发工具等去对接开发。大数据在这方面的积累还是及不上数据库几十年的积累的相当多的业务同学对于数据库很熟练但对于大数据特别是实时数仓就感觉不容易上手了。数据模型和语义向传统数据库靠拢。例如主键Primary Key概念是传统数仓类产品所缺乏的操作的原子性数仓产品往往也不能保证这就限制了很多场景的应用。比方说Clickhouse缺乏数据库意义上的主键CK所说的主键是另外一个东西非唯一性约束所以就不合适处理数据库CDC同步场景。这两年大数据业界可以明显看到对这块的增强。最典型的例子是DeltaLake、Iceberge和Hudi等为代表的近实时数仓增加了ACID能力。当然受制于架构这种近实时ACID在频繁更新场景下的性能和延时是有瓶颈的。 在阿里大量场景需要这种基于主键的更新能力以阿里巴巴内部场景为例 数据库的实时同步通过将上游的分库分表和多个业务库实时同步镜像到一个大数据实时数仓中可以提供对业务数据的强大分析能力而这就需要很好的处理纯实时的高频UPDATE和DELETE操作。Flink 计算产生的UPDATE和DELETERETRACTION操作例如统计GMVFlink在结果更新时会生成UPDATE记录而在有些场景下会生成RETRACTION记录DELETE这都要求下游系统能很好的处理这两类事件。风控等业务的计算是由多路作业共同完成的这些作业共同实时更新一张大宽表每个作业更新部分字段这就要求下游系统能提供基于主键的部分更新能力。 传统上这样的业务是由HBase、Redis这样的NoSQL系统或者MySQL、PostgreSQL等数据库RDS来承接的。但NoSQL的问题是分析能力普通偏弱而数据库问题是写入性能和规模有限制。 这些业务在大数据处理中普遍存在。但在阿里的挑战是因为规模的巨大特别是双11这样的场景对基于主键的更新性能和延迟有苛刻的要求。 Hologres从设计之初就考虑了这两点。Hologres完全兼容了PostgreSQL 11的协议、语法、函数等很多PostgreSQL扩展例如PostGIS可以直接使用。同时Hologres提供了完整的主键概念和强大的更新能力并提供了单SQL的ACID。今年双11有业务测得了每秒350万的实时写入更新性能。这些能力极大的放宽了实时数仓的应用场景将传统由NoSQL和RDS承载的场景改由实时数仓来承载为用户提供了更加强大的分析处理工具。 实时数仓的类数据库化并不就等价于HTAP数据库了。HSAP相比于HTAP在事务能力上是削弱的。因为在服务serving场景并不需要传统数据库完整的事务能力。而这种舍弃带来的是在实时写入性能和查询性能上的极大提升以及可扩展性上的提升因为不需要全局事务管理器了。因此HSAP相比HTAP也就更加适合大数据场景。 六 实时数仓开发敏捷化 最后一个趋势是开发方法论上的变化实时数仓的开发越来越敏捷以适应分析场景的灵活多变。 过去数仓的开发往往按照经典的方法论采用ODS-DWD-DWS-ADS逐层开发的方法层与层之间采用事件驱动或者微批次的方式调度。分层带来更好的语义层抽象和数据复用但也增加了调度的依赖、降低数据的时效性、减少数据灵活分析的敏捷性。 实时数仓驱动了业务决策的实时化在决策时通常需要丰富的上下文信息因此传统的高度依据业务定制ADS的开发方法受到了较大挑战成千上万的ADS表维护困难利用率低更多的业务方希望通过DWS甚至DWD进行多角度数据对比分析这对查询引擎的计算效率、调度效率、IO效率都提出了更高的要求。 随着计算算子向量化重写、精细化索引、异步化执行、多级缓存等多种查询引擎优化技术Hologres的计算力在每个版本都有较大改善。因此我们看到越来越多的用户采用了敏捷化的开发方式在计算前置的阶段只做数据质量清理、基本的大表关联拉宽建模到DWD、DWS即可减少建模层次同时将灵活查询在真正分析时在交互式查询引擎中执行通过秒级的交互式分析体验支撑了数据分析民主化的重要趋势。 七 总结 阿里巴巴在业界是较早应用实时数仓来处理海量数据的公司。实时数仓在阿里的发展也逐渐走入深水区。无论是生产系统化、分析服务一体化、实时数据治理平台化还是类数据库化、敏捷化实时数仓正在随着业务需求的快速发展而快速迭代并在双11这样的年度大戏中焕发出越来越明亮的光彩成为业务必不可少的伙伴和助手。 业务驱动技术数据带来价值实时数仓Hologres同阿里巴巴核心业务一起成长一起打磨从多维复杂OLAP分析到高QPS点查高性能实时写入与更新到高可用为大数据平台提供统一分析服务出口满足一站式实时数仓的存储、开发、治理、服务全流程全场景。 我们相信这些实时数仓的趋势也适用于整个业界我们会逐步把在阿里双11中积累的能力在云上产品中透出帮助客户用好实时数仓共同成长 原文链接 本文为阿里云原创内容未经允许不得转载。
http://www.yutouwan.com/news/469512/

相关文章:

  • 网站关键字怎么写连云港做网站哪家好
  • 外贸网站建设十大标准免费咨询医院
  • 坂田网站建设方案wap网站的好处
  • 淘宝网网页设计作业网站关键词排名seo
  • 门户网站seo前期wordpress前端用户网址
  • 2016织梦小说网站源码深圳市珠宝网站建设
  • 校园网站建设调查问卷基础的网站建设
  • 印度做杂质的网站网站如何更换服务器
  • 隆尧网站建设wordpress 笔记本
  • 网站开发申请报告哈尔滨做网站的公司
  • c 能和php一起做网站吗广州网站建设商
  • 一个电信ip做网站卡不卡wordpress自定义字段
  • 如何做网站二级域名珠海互联网公司有哪些
  • 创建网站公司 徐州韩国风格网站
  • 深圳宝安网站设计公司大赛网站开发需求
  • 富阳网站建设洛洛科技网站域名备案注册证书查询
  • 怎么做专门卖二手衣服的网站seo优化网站教程
  • 上海市网站建设公司便宜正品的购物app
  • 帮朋友做网站不给钱公司企业名录大全
  • 新手学网站建设个人域名备案后不能干什么
  • 民宿网站开发数据流图唐山专业做网站
  • 网站seo优化方案设计电商网站规划设计方案
  • 网站排名效果好景观建设网站
  • 中国招标建设信息网站wordpress设置使用旧版编辑器
  • 百度手机导航官方新版做seo要投入什么
  • asp.net视频网站模板下载@安徽网站建设
  • 合水口网站建设做药物研发的人上什么网站
  • 一起做网站潮汕pc网站做移动端适配
  • 腾讯云网站搭建教程推广软文200字
  • 免费做婚礼邀请函的网站宿迁网站建设