`

分布式系统架构的基本原则和实践

 
阅读更多

采用分布式系统架构是由于业务需求决定的,若系统要求具备如下特性,便可考虑采用分布式架构来实现:

1.数据存储的分区容错,冗余

2.应用的大访问、高性能要求

3.应用的高可用要求,故障转移


分布式系统遵循几个基本原则

1.CAP原理

CAP Theorem,CAP原理中,有三个要素:
一致性(Consistency)
可用性(Availability)
分区容忍性(Partition tolerance)
CAP原理指的是,在分布式系统中这三个要素最多只能同时实现两点,不可能三者兼顾。因此在进行分布式架构设计时,必须做出取舍。而对于分布式数据系统,分区容忍性是基本要求,否则就失去了价值。因此设计分布式数据系统,就是在一致性和可用性之间取一个平衡。对于大多数web应用,其实并不需要强一致性,因此牺牲一致性而换取高可用性,是目前多数分布式数据库产品的方向。

从客户端角度,多进程并发访问时,更新过的数据在不同进程如何获取的不同策略,决定了不同的一致性。对于关系型数据库,要求更新过的数据能被后续的访问都能看到,这是强一致性。如果能容忍后续的部分或者全部访问不到,则是弱一致性。如果经过一段时间后要求能访问到更新后的数据,则是最终一致性。
但web应用也有例外,比如支付宝系统,就要求数据(银行账户)的强一致性,而且面对大量淘宝用户,可用性要求很高,因此只能牺牲数据的分区冗余。这一点也曾在和支付宝工程师交流时,得到验证。

2.C10K问题
分布式系统另一个理论是C10K问题,即系统的并发用户增加1万(customer ten thousand,过去一台服务器承载假设为1万用户,现在平均3~5万),是否意味着增加一台机器就能解决问题?答案通常是否定
因为这涉及到系统的应用架构问题----串行系统和并行系统的架构和性能提升的关系:
串行系统一般设备越多,性能成一条向下弯曲的曲线,最差情况,可能性能不增反降;而并行分布式系统设备越多,性能是正比例线性增长的直线
分布式系统架构的基本原则和实践

3.串行系统和并行系统的可靠性问题
一个大系统一般都有超过 30 个环节(串行):如果每个环节都做到 99% 的准确率,最终系统的准确率是 74%; 如果每个环节都做到98%的准确率,最终系统的准确率 54%。一个 74% 的系统是可用的(有商业价值的),一个 54% 的系统仅比随机稍好一点,不可用。这就是做大系统的魅力和挑战!
而以上描述只是各模块串行系统所遇到的问题

如果是并行系统,准确率=1-(1-A)^B ,其中A是单个模块准确率,B是并行模块个数
如系统中每个模块的准确率是70%,那么3个模块并行,整体准确率=1-0.3^3=97.3%,如果是4个并行,准确率=1-0.3^4=99.19%,我在想这就是负载均衡靠谱的数学原理
5个9或6个9的QoS一定是指数思维的结果,线性思维等于送死

而对系统单一模块优化,准确性和可用性提升一个百分点,越接近100%,难度越大,投入成本越不可控(系统熵永不为零)
因此可靠性系统必然选择并行分布式作为架构的基本方法。

从数据的存储角度,多份冗余也是可靠性保障的一个方法。分布式存储的冗余备份常规是3份(aws就这么干的),古埃及的罗塞塔rosetta石碑用古埃及象形文字、埃及拼音和古希腊文三种文字记录一段历史,就算象形文字缺了一部分,没人能看懂,也能破译补全,这大概也是raid5的思想起源吧
分布式系统架构的基本原则和实践

分布式系统架构的实践

1.分布式存储架构

分布式存储架构现阶段有3种模式

<wbr>1.1</wbr>一种是物理存储采用集中式,存储节点采用多实例的方式,如NFS挂载SAN、NAS等等
分布式系统架构的基本原则和实践


1.2第二种是带有中央控制器的分布式存储,如luster、moosefs、googlefs等等,一般特征是具备2个角色metadata server和storage node,将文件的元数据(描述数据的数据,如文件位置、大小等等)和数据块文件分开存储
其中metadata server除保存文件的元数据外,还维护存储节点的ip、状态等信息

luster的典型架构
MDS--meatadata server
MDT--metadata target
OSS--obj storage server
OST--obj starage target
其中MDT和OST是可以挂在NAS等中央存储上的;可见,luster借鉴了上面中央存储的模式,无论元数据服务还是节点服务都将服务实例和存储分离,但进化了一步,将元数据和数据块分离

luster系统很好解决了数据分布式存储,,在超级计算领域Lustre应用广泛,如美国LLNL国家实验室计算机系统、我国的天河超级计算机系统均采用Lustre搭建分布式存储系统。Lustre在全球排名前30个超级计算机系统中有15个在使用。

但有一个问题,就是metadata server的SPoF(single point of failure)问题,即单点故障;一旦metadata server挂了,整个集群也就挂了。实际应用中,是有解决方案的,如dell的官网有个pdf,就是采用heart beat和drbd网络raid的方式,启动2个实例,再如和keepalived一起组成故障转移的方案等等,可以自己试试

分布式系统架构的基本原则和实践


再来看moosefs架构
moosefs架构和luster很相似,但进化了一步,mater(也就是metadata server)可以有从机备份了,而且可以多个
而且服务实例和存储放在一起,没有像luster,自此服务和数据不离不弃了;其实luster也可以简化成不离不弃模式,moosefs也可以学他搞个后端存储,但随着云计算、追求低成本的趋势,采用SAN这样存储设备就太贵了

分布式系统架构的基本原则和实践

1.3第三种分布式存储是去中心化、全对称的架构(non-center or symmetric)
其设计思想是采用一致性哈希consistent hash算法(DHT的一种实现,关于一致性hash具体参考后面的链接)来定位文件在存储节点中的位置,从而取消了metadata server的角色
分布式系统架构的基本原则和实践


整个系统只有storage node一个角色,不区分元数据和数据块;
典型系统如sheepdog,但sheepdog是为满足kvm镜像和类EBS块存储而设计的,不是常规的分布式文件系统,架构如下
分布式系统架构的基本原则和实践


为了维护存储节点的信息,一般采用P2P技术的totem single ring算法(corosync是一种实现)来维护和更新node路由信息
对称架构有一个问题,采用totem single ring算法的存储节点数量有限,因为node数量超过1000,集群内的通信风暴就会产生(此处更正,应该是环太大,令牌传递效率下降,不会产生通信风暴),效率下降,sheepdog提出了一个解决方案,就是在一致性hash环上做嵌套处理,如图
分布式系统架构的基本原则和实践


1.4半对称结构
其实介于1.2metadata server中央控制和1.3全对称的架构之间还有一种,就是把metadata也做成对称结构,我们可以称半对称结构,典型应用如fastdfs,淘宝一大牛fishman写的,主要用作图片存储,可以实现排重存储
看图,tracker cluster就是metadata server的角色,实现了对称架构设计
国内几个大的网站都使用了fastdfs,在实际使用中,发现storage server之间同步数据较慢,一直没仔细研究

分布式系统架构的基本原则和实践


2.分布式数据库
分布式数据库一般都基于分布式文件系统实现数据的分片sharding,每中数据库都有自己的应用特性,就不做介绍,列出几个典型的应用,供参考
Google的big table,实现数据的追加存储append,顺序写入快速,不适合随机读的场景
hadoop的HBase
mongodb
hypertable 2010年以前,百度在用,今年infoq的中国qcon,百度的杨栋也讲了百度用hypertable的血泪史

3.分布式应用架构
分布式应用架构涉及具体应用场景,设计上除考虑上面的CAP和C10K等等经典分布式理论,还应根据业务进行权衡。
基本的思路是

3.1在做完需求和模块设计后,要对各模块进行解藕Decoupling
传统的企业应用设计一般是一条操作从头跑到尾(串行系统),拿视频网站的流程距离,传统应用设计是先上传是视频,然后存储,编码,最后发布一条龙
如下图
分布式系统架构的基本原则和实践



3.2在进行分布式设计时,先将各模块解藕,通过异步消息通知的方式将各模块链接,如下图
分布式系统架构的基本原则和实践

3.3最后,要考虑这个应用的压力承载点在哪,根据用户规模估算各模块的并行数量(如本例中的encode压力大,就增加encode模块的并行系统数量),如下图
分布式系统架构的基本原则和实践

以上是分布式系统构建的基本原则和实践步骤,在实际应用中,仍有很多细节要考虑。但有一点要再强调,就是要根据业务来选择各层、各模块的技术,做好业务适用、成本和难度之间的权衡

技术本无好坏,在于适当的使用和积累。

参考:
moosefs<wbr></wbr>http://www.moosefs.org
luster<wbr><a target="_blank" href="http://wiki.whamcloud.com/display/PUB/Wiki+Front+Page" style="text-decoration:none; color:rgb(79,160,0)">http://wiki.whamcloud.com/display/PUB/Wiki+Front+Page</a></wbr>
一致性hash<wbr><a target="_blank" href="http://baike.baidu.com/view/1588037.htm" style="text-decoration:none; color:rgb(79,160,0)">http://baike.baidu.com/view/1588037.htm</a><wbr>&amp;<wbr><a target="_blank" href="http://stblog.baidu-tech.com/?p=42" style="text-decoration:none; color:rgb(79,160,0)">http://stblog.baidu-tech.com/?p=42</a></wbr></wbr></wbr>
fastdfs<wbr><a target="_blank" href="http://code.google.com/p/fastdfs/wiki/Overview" style="text-decoration:none; color:rgb(79,160,0)">http://code.google.com/p/fastdfs/wiki/Overview</a></wbr>

转载自:http://blog.sina.com.cn/s/blog_5459f60d01016ntb.html
如果对作者本人造成侵权行为,请联系本人进行删除。
分享到:
评论

相关推荐

    分布式服务框架原理与实践.zip

    从分布式服务框架的架构设计原理到实践经验总结,涵盖了服务化架构演进、订阅发布、路由策略、集群容错和服务治理等多个专题,全方位剖析服务框架的设计原则和原理,结合大量实践案例与读者分享作者对分布式服务框架...

    分布式服务框架原理与实践_李林锋

    从分布式服务框架的架构设计原理到实践经验总结,涵盖了服务化架构演进、订阅发布、路由策略、集群容错和服务治理等多个专题,全方位剖析服务框架的设计原则和原理,结合大量实践案例与读者分享作者对分布式服务框架...

    分布式服务框架原理与实践

    从分布式服务框架的架构设计原理到实践经验总结,涵盖了服务化架构演进、订阅发布、路由策略、集群容错和服务治理等多个专题,全方位剖析服务框架的设计原则和原理,结合大量实践案例与读者分享作者对分布式服务框架...

    分布式服务框架原理与实践_李林锋著

    从分布式服务框架的架构设计原理到实践经验总结,涵盖了服务化架构演进、订阅发布、路由策略、集群容错和服务治理等多个专题,全方位剖析服务框架的设计原则和原理,结合大量实践案例与读者分享作者对分布式服务框架...

    分布式事务实践 解决数据一致性

    介绍了分布式系统的定义、实现原则和几种形式,详细介绍了微服务架构的分布式系统,并使用Spring Cloud框架演示了一个完整的微服务系统的实现过程。 5-1 CAP原则和BASE理论简介 5-2 分布式系统综述 5-3 SpringCloud...

    ArchSummit 2023全球架构师峰会深圳站(公开)PPT汇总(42份).zip

    QUIC协议在分布式系统架构中的实践 Serverless设计原则有效架构选择实践 数据集成稳定性与数据质量保障及可观测实践 超扩展设计用于处理大型扩展应用程序的新数据库 超越边界FaaS的应用实践和未来展望 从数据库历史...

    高可用性的HDFS:Hadoop分布式文件系统深度实践

    1.1 HDFS系统架构 1.2 HA定义 1.3 HDFS HA原因分析及应对措施 1.3.1 可靠性 1.3.2 可维护性 1.4 现有HDFS HA解决方案 1.4.1 Hadoop的元数据备份方案 1.4.2 Hadoop的SecondaryNameNode方案 1.4.3 Hadoop的Checkpoint ...

    软考高级系统架构设计师知识点大全

    软考高级系统架构设计师知识点大全软考高级系统架构设计师是一项国家级认证考试,主要考察考生在计算机系统结构、软件工程、数据库、网络、信息安全等多个领域的专业知识和实践经验。通过这项考试,考生可以获得高级...

    Java思维导图xmind文件+导出图片

    基于Dubbo的分布式系统架构实战 Dubbo负载均衡策略分析 Dubbo服务调试之服务只订阅及服务只注册配置 Dubbo服务接口的设计原则(实战经验) Dubbo设计原理及源码分析 基于Dubbo构建大型分布式电商平台实战雏形 ...

    MySQL性能调优与架构设计.pdf

    全书共分3篇,基础篇介绍了MySQL软件的基础知识、架构组成、存储引擎、安全管理及基本的备份恢复知识。性能优化篇从影响 MySQL 数据库应用系统性能的因素开始,针对性地对各个影响因素进行调优分析。如 MySQL Schema...

    cloud-native-book-demos:云原生样本。 Cloud Native案例大全《 Cloud Native分布式架构原理与实践》示例源码-源码大全

    Cloud Native Samples(Cloud Native案例大全)/《 Cloud Native分布式架构原理与实践》示例源码 内容简介 Cloud Native(云原生)基于云架构为优先的应用开发模式。结果,越来越多的企业已经开始大规模地“拥抱云”...

    Microsoft NLayerApp案例理论与实践

    该项目采用的是经典的DDD架构,而不是CQRS架构,但我觉得整个案例做的非常不错,基本上包含了基于DDD的架构实践的各个方面。因此,应不少社区朋友的要求,我打算花一部分精力来写一个介绍该项目理论与实践的系列文章...

    亿级流量网站架构核心技术

    《亿级流量网站架构核心技术》一书总结并梳理了亿级流量...不管是软件开发人员,还是运维人员,通过阅读《亿级流量网站架构核心技术》都能系统地学习实现亿级流量网站的架构核心技术,并收获解决系统问题的思路和方法。

    基于微服务架构的乐居租房网的设计与实现.rar

    基于微服务架构的乐居租房网是一个分布式、模块化的在线租房平台,采用当前流行的微服务架构设计原则进行构建。这个平台旨在提供灵活、可扩展的租房服务,以满足不同用户的需求。该网站的核心功能包括房源浏览、搜索...

    Mesos架构与去哪儿的统一框架实践

    在官方文档中,Mesos定义成一个分布式系统内核。它使用和Linux内核相同的设计原则,只是设计在不同的抽象层级上。它运行在一个机房的所有服务器上并且通过API的形式给应用(比如Hadoop,Spark,Kafka,ElasticSearch...

Global site tag (gtag.js) - Google Analytics