ImageVerifierCode 换一换
格式:PPT , 页数:41 ,大小:1.56MB ,
资源ID:581027      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-581027.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(阿里网站技术介绍.ppt)为本站会员(天天快乐)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

阿里网站技术介绍.ppt

1、阿里巴巴网站技术介绍,网站镜像和同步技术,纲要,一、前 言,二、网站部署的三个阶段,三、新的挑战,四、总结,阿里巴巴(A)是一个服务于全球企业的(B2B)电子商务平台。用户遍布中国以及世界各地,为了更好的为这上千万的用户提供网络服务,我们建立了多个站点去为用户提供应用.总体而言,我们的站点发展经历了以下三个阶段:单站点双站点多站点,前 言,纲 要,一、前 言,二、网站部署的三个阶段,三、新的挑战,四、阶段性总结,网站部署的三个阶段,应用都是无状态的 状态数据都保存在以下的设备中数据库存储,第一阶段-单站点,状态数据都保存在数据库和存储,由数据库和存储提供分布式以及HA的解决方案。应用都是无状态

2、的(尽量用Cookie解决session的问题),非常便于扩展。,描述,缺 点,部分地区用户的使用体验不佳系统性能和扩展性不好,第一阶段-单站点,可用性的要求 单个IDC发生故障,例行维护,系统升级都会影响所有的用户,进而降低网站的可用时间。用户体验的问题网站是为全球用户提供服务的,物理距离产生的网络延时是不可避免的。 10000公里 = 延时30毫秒电子商务网站的内容通常都是动态的,CDN只能解决大多数静态资源的问题(图片,css,js)。,驱动力,第二阶段-双站点,DNS负载均衡(IDC之间的负载均衡) 数据同步解决方案 应用拆分镜像,需要解决的问题,第二阶段-双站点,DNS负载均衡,第二

3、阶段-双站点,数据同步1.0-方案选型,第二阶段-双站点,数据同步1.0-实现,基于AOP方式的SQL拦截根据变更的数据找到关联的文件.异步的进行SQL以及文件的复制.,第二阶段-双站点,第二阶段-双站点,数据同步1.0-缺点,数据同步1.0-优点,CAP原理写应用:符合Consistency&Availability读应用:符合Partition tolerance&Availability, 结论:读应用更容易实现跨IDC的部署问题数据同步会放大数据不一致&数据不完整的情况 .这会增加镜像站点应用的复杂性.,应用拆分-分析,第二阶段-双站点,应用拆分-注意事项,第二阶段-双站点,被镜像的读

4、应用需要从设计上避免数据完整性的问题.设计业务流程的时候需要避免跨IDC的Web Flow.,应用拆分示意图,第二阶段-双站点,部署结果,第二阶段-双站点,解决了大多数读应用和少量写应用的用户体验问题. 实现了读应用的跨站点的HA.提高了读应用以及网站的整体可用性. 读应用的数据源尽量迁移到了Search engine和cache上为其性能和可扩展性带来了很大的收益.,收益,第二阶段-双站点,不完全的镜像同步的延迟到导致应用之间数据不一致的问题,尤其在不同IDC之间存在应用的依赖时,这个问题会被放大。数据的双向同步带来了一些不能解决的数据冲突,需要在设计的时候进行规避。,缺 陷,第二阶段-双站

5、点,应用规模的日益复杂同步数据量的增大数据同步1.0的缺点逐渐凸显.数据冲突的问题不能拦截所有的数据变更开始酝酿升级,后 记,第二阶段-双站点,起因,第三阶段-多站点,Disaster,目 标,第三阶段-多站点,挑 战,第三阶段-多站点,多个IDC之间的数据同步数据同步的吞吐量以及数据一致性的问题. 写应用的镜像&数据拆分,变更数据的急剧增长导致同步的效率成为瓶颈.结果:站点之间的数据延迟不断加大应用之间的数据不一致的情况逐渐加剧,数据同步现状,第三阶段-多站点,数据同步的瓶颈并不在于网络数据同步的瓶颈最终受制于为了满足数据一致性而对写入操作进行的排序,数据同步瓶颈分析,第三阶段-多站点,在数

6、据库层面记录数据变更基于Base原则消息驱动并行所有可以并行的内容.有选择的侵入业务简单的处理冲突的逻辑Merge操作,数据同步2.0设计原则,第三阶段-多站点,写应用的镜像方案选择,第三阶段-多站点,Sharding.去中心化,缩小中心Write Sticky:解决跨站点的Web Flow的问题事后补偿异步,写应用的镜像解决方案,第三阶段-多站点,提高对数据不一致窗口的容忍程度数据库记录中的文件路径的问题.降低多点更新数据的冲突可能性引用计数的问题,应用的注意事项&案例,第三阶段-多站点,IDC之间的数据不能遵循ACID,只遵循Base的原则. 下面两个问题是提高用户体验的关键.提高同步性能

7、,缩小数据不一致性窗口尽量保证目的端数据库的数据完整性.单个 IDC内部的数据一致性优于跨IDC的数据环境 .所以。尽量把单个用户的操作行为限制在单个IDC中.,总结,第三阶段-多站点,纲 要,一、前 言,二、网站部署的三个阶段,三、新的挑战,四、阶段性总结,集中的持久化技术已经不足以支撑应用的写入的吞吐量,其他的持久化技术开始引入分布式数据库其他分布式持久化方案的引入:KV-Engine,DFS.分布式事务.,一、应用架构发展的需要,新的挑战,新的挑战,数据复制的节点增加. 硬件成本随之增大一些特殊应用对同步实时性的要求提高.随着分布式持久化技术的引入.单个IDC的数据持久化能力 得到极大的

8、提升.但数据同步技术因为受制于数据一致性 的问题 ,逐渐成为了瓶颈.设备数量的增长对自动化管理提出了新的要求.多站点的发布,自动化测试以及应用监控.跨站点的动态负载均衡,问题,新的挑战,数据同步方案的优化 有效地控制数据备份的数量. 在合适的场景下使用反向代理技术. 水平拆分优于垂直拆分. 应用监控平台 自动化发布和部署的平台.,解决方案,新的挑战,优化数据变更的采集方式根据数据的类型设定不同的通道和策略.解决各种分布式数据源的数据一致性的问题.(分布式事务的场景)纪录和尝试解决数据冲突的问题.,数据同步3.0,新的挑战,适用范围数据总量比较大,访问相对集中的静态资源;例如图片信息.访问量比较小的一些动态应用.效果降低同步数据量降低存储设备的投入减少因为同步延迟而造成的数据不一致.,反向代理,新的挑战,纲 要,一、前 言,二、网站部署的三个阶段,三、新的挑战,四、阶段性总结,镜像的关键是数据同步的问题.根据D&Q的原则.将中心最小化.采用异步或者事后补偿的机制降低中心应用对其他应用的可用性的影响.单个IDC的核心数据保证可以保证强一致性,多个IDC的核心业务数据只保证最终一致性.在业务上解决数据冲突的问题并容忍一定程度的不一致.采用数据Sharding技术,水平拆分优于垂直拆分.,总结,Q & A,谢 谢!,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报