苏州网站排名方案,wordpress 连接丢失,网站备案管局,盐城最专业网站建设网站排名优化事件回顾#xff1a;创业公司“前沿数控”8月5日发文称#xff0c;公司存放在腾讯云上的精准注册用户以及内容数据全部丢失#xff0c;并且不能恢复#xff0c;造成公司平台全部停运的状态。前沿数控表示#xff0c;公司丢失的数据近千万元级#xff0c;对此索赔1000余万… 事件回顾创业公司“前沿数控”8月5日发文称公司存放在腾讯云上的精准注册用户以及内容数据全部丢失并且不能恢复造成公司平台全部停运的状态。前沿数控表示公司丢失的数据近千万元级对此索赔1000余万元。腾讯云对此回应称该事故是因受所在物理硬盘固件版本bug导致的静默错误写入数据和读取出来的不一致影响文件系统元数据损坏仅能赔偿13万余元现金或云资源的额外补偿。截至昨晚双方未能就赔偿方案达成一致。看了双方的申明没看到太多的技术细节前沿数控只是控诉厂商没有做到承诺腾讯云只是简单说了下磁盘静默错误故障以及赔偿的分歧希望后面双方能复盘一下详细过程对业界也是有益的事情。我自己从已经透漏出的信息简单推测一下如果有推测的不对的地方还请指正。首先从腾讯云给出的信息看数据是在『操作系统云盘』上。先看看腾讯云主机的创建界面用户需要定义系统盘以及数据盘。系统盘用来展开操作系统镜像以及存储系统临时文件和日志之类的。数据盘是挂载后用来存数据的。个人推断前沿数控应该是直接申请了一个大的系统盘然后把数据都存在了上面并没有使用独立的数据盘。这个推断通过前沿数控平台的处理流程也可以印证因为如果数据存在了数据盘上主机出了问题首先的恢复方式应该是重新创建一个主机然后把数据盘挂载过来而不是一直等待修复主机系统。但这里的『操作系统云盘』如何理解呢系统进程依赖操作系统盘对网络延迟比较敏感一般不会远程加载同时如果用户正确使用系统盘上的数据也不太重要临时文件日志之类的做同步多写复制也没必要。所以个人推断这里的操作系统云盘和数据云盘实际上是两种东西操作系统云盘并没有做到数据云盘那样的多副本机制或者副本机制不一样。个人认为这也是为什么腾讯云在声明中只字未提副本的原因因为名字都叫云硬盘现在说实现方式不一样给用户说不清楚。但同时这里的『操作系统云盘』也不应该仅仅是本地盘。因为腾讯云对一些高 IO 的主机提供专门的本地盘如下图所示。如果仅仅是本地盘非搞出来两个概念就比较奇怪了。本人不清楚腾讯云的实现方式无法解答上面的疑问更详细的说明得等腾讯云官方给出解释了。所以整个事情的技术分析大致是这个样子的该用户创建了一台主机直接挂了一块大系统盘把数据都写里面了。云主机物理磁盘损坏系统无法启动只能反复和云厂商沟通等待恢复。云厂商的系统盘没有副本或者副本机制不一样最后数据恢复失败就是现在这个结果了。再谈谈赔偿的事情双方对赔偿的数额分歧较大。下图是截取的腾讯云官方的 CBS SLA 协议https://cloud.tencent.com/document/product/301/9515按照上面的协议腾讯云顶多把云硬盘的总使用费退换给用户在腾讯云看来这次做出的赔偿已经是够『良心』的了。因为云厂商认为自己提供的服务类似于出租或者出售硬盘你买租了个硬盘然后拷了一些珍贵的数据进去结果硬盘坏了你找厂商赔偿厂商也最多赔你个新的硬盘啊。如果觉得云厂商的协议是霸王条款不公平那单从法理角度分析。很多人凭直觉认为是云厂商的故障导致了用户的数据丢失就应该赔偿全部或者至少是大部分数据的价值。且不说数据的价值如何客观评估即便是可以准确估值法律也需要考虑社会经济成本从而划分两方的责任比例1. 谁更明白数据的价值对云厂商来说不同用户不同业务的数据之间没太大区别能观测到的指标也仅仅是数据大小。用户自己更清楚自己的哪部分数据重要。2. 谁保护数据的成本更低云厂商因为无法评估数据的价值所以也无法给某些数据以特殊的注意力。而用户清楚自己的数据的价值只需付出很低的成本比如定时做快照就可以避免这种情况。整体而言掌握更多信息的付出成本更低的角色应该承担更大的责任。所以云服务以及快递这样的服务行业赔偿都是按照服务价格的倍数进行赔偿云厂商一般承诺 100 倍的故障时间赔偿快递一般是 2~5 倍的运费。但快递有个特例就是可以『保价』因为有了『保价』信息快递公司可以对保价高的货物付出特殊注意力同时保价费也相当于一种保险。云厂商其实也考虑过引入保险但很多用户不愿意在服务器资源上做投入厂商之间还在打价格战。快递的保价费用一般是千分之五如果云服务也按这个比例千万元价值的数据保价费几万元如果愿意花这份钱到备份机制上或者请个技术顾问也不至于现在这个结果。至于腾讯云方面是否有涉及虚假宣传这个需要腾讯云方面解释了。但即便是有惩罚性赔偿也只是和服务价格的倍数相关和数据本身的价值没关系。通过这个事情给所有的云用户一些建议1. 系统尽量是无状态的数据和系统要分开。多装了几次电脑的人都能明白把系统和数据弄不同的盘上。对云上的虚拟机最好能做到像 Docker 那样系统可以随时还原而不影响应用。2. 尽量不要自己管理机器能用云厂商提供的数据库的就别自己安装数据库。能用对象存储这种 PaaS 服务的就别用主机硬盘。3. 涉及公司生死攸关的数据本地或者跨云备份。创业公司数据不多实际上成本也不高。同时也给云厂商一个建议出了故障进行公开的技术复盘不丢人也是消灭误解的最好方式。这方面可以多向国外同行学习。本人是个云计算的前从业者但和腾讯云没有任何关系不存在『洗地』的动机只是从技术角度进行分析希望总结出一些教训给业界借鉴。相关链接腾讯云给一家创业公司带来的灾难前沿数控 https://weibo.com/ttarticle/p/show?id2309404269756587862904腾讯云的声明 https://weibo.com/5174457807/GtlI3ngjc静默错误为什么看了那么多灾难还是过不好备份这一关 https://mp.weixin.qq.com/s/ra8TP9kfsPPbY8A3Ayopjg 盖国强关于静默错误的技术分析免责声明文章为转载版权归原作者所有。如涉及作品版权问题请与我们联系我们将删除内容或协商版权问题。