武汉祥泰伟业商贸有限公司 服务热线:400-027-5771 QQ:3275214726
邮箱:3275214726@qq.com 地址:湖北省武汉市解放大道单洞路特1号国际大厦B栋14楼F座
网站建设:中企动力武汉 鄂ICP备14012979号
分布式系统中常见问题如何解决?
分布式系统中涵盖了很多技术名词,如多副本、数据分区、一致性算法等等,这些技术在系统设计中非常重要。分布式系统中工作性能的而运行可靠性,是指在正常情况下的系统正常工作能力。理论上,系统发生任何异常,都能确保正常工作,即是符合可靠性要求。但实际应用中的突发异常情况很多,需要根据可能异常分析如何在发生时及时恢复。通常这种异常故障,主要分为硬件异常,软件异常两类。
分布式系统中常见问题如何解决?
1. 硬件异常
硬件异常的情况很多,硬盘,电源等中包含的任意组件损坏,都是导致服务器无法正常运作的隐患,比起软件异常,这类故障通常难以避免。但可以利用技术手段修复硬件异常,不论是软件还是硬件恢复,基本的解决方法是与冗余有关。
硬件方面,可通过单机冗余多份硬件,当其中某个硬件发生异常时,快速地用好的硬件替换掉故障的硬件,这种方式的硬件冗余对于数据中心级的故障是没有作用的。从软件角度来讲,可通过多副本(Replication)来实现快速恢复,当某台服务器硬件异常时,可以在软件层面将流量导入到新的副本上。
2. 软件异常
软件异常通常指的是系统的bug,这里面不仅包括自己写的系统的bug,也包括依赖的服务系统的bug。软件异常同样也是不能完全避免的。
因此,在发生软件异常时,也需要有快速恢复的手段。解决方法包括,通过调整软件已有的配置参数,规避问题;重启软件或者依赖的服务,消除异常状态;直接修复bug,并升级版本
标签:分布式系统中常见问题如何解决?
资讯列表
News list