大型网站分布式系统实战解析

发布时间：2021-04-22 14:13:35 所属栏目：评论来源：互联网

导读：批服务器组成一个集合，对于用户来说仍然是一个整体连贯系统。 A. Tanenbaum定义：分布式网络的计算机中的组件之间协调动作是通过消息进行通讯。 G. Coulouris定义：当你知道有一台电脑崩溃，但是你的软件运行从来不会停止。 Leslie Lamport定义：分布式系统

批服务器组成一个集合，对于用户来说仍然是一个整体连贯系统。
A. Tanenbaum定义：分布式网络的计算机中的组件之间协调动作是通过消息进行通讯。
G. Coulouris定义：当你知道有一台电脑崩溃，但是你的软件运行从来不会停止。
Leslie Lamport定义：分布式系统是这样系统：旨在支持应用程序和服务的开发，可以利用物理架构由多个自治的处理元素，不共享主内存，但通过网络发送异步消息合作。
与分层应用区别：分层的应用程序（例如，3层）是划分应用程序逻辑，是一种逻辑分层，而不是物理，而分布式系统DS是物理分层，和实际部署有关。

与传统集中式系统相比：

集中式系统是一种Scale out/in，纵向扩展，要么向上升级服务器到中大型机，要么升级多核，增加CPU核数，集中式纵向扩展适合计算聚合度比较高的数据，而分布式适合计算松散数据，非结构化或半结构化数据。无论采取哪种扩展伸缩方案，需要根据业务数据特点而定。

任何分布式系统总是需要完成两个任务：计算和存储。计算和存储分离是分布式系统的重要特征。而通常在集中式或单机系统中，这两者是可能结合在一起，比如通过一个SQL语句实现查询后排序，查询是从存储中获得数据，排序是属于计算，因此这个SQL语句实际是将计算和存储耦合在一起。在应对大数据或大并发的情况下，这种方便的捆绑带来性能问题，而分布式计算和分布式存储虽然带来复杂性，但是也为系统的处理能力打开了上升拓展的空间。

分布式系统特点：

并发性：共享资源，采取ACID或Base原则，见：CAP定理。
分布式系统设计遵循CAP定理， CAP是：Consistency(一致性)，Availability(可用性), 和 Partition tolerance(分区容错性) 可靠性简称，CAP定理认为，CAP三种之中，只能同时满足其中两种。
可扩展性Scalable是重要特点，通过扩展能够获得高性能高吞吐量低延迟Latency。
可靠性/可用性:故障发现和处理以及恢复容错处理。在一个正常运作系统中存在一个时间比例的条件。如果一个用户不能访问系统比例增大，它被认为是不可用。可用性公式：
Availability = uptime / (uptime + downtime)
容错failover是指一个系统在错误发生的情况下，仍然一切运行正常。表示这个系统是宽容错误的。
消息处理: 具体产品有：RabbitMQ ZeroMQ Netty等等。
异构性：不同操作系统硬件程序语言开发者，中间件是一种解决方案。
安全性：授权认证 SSO单点登录 Oauth等等。

定位命令：

标识资源 URLs
命名服务Naming services
定位寻找Lookup
主要见SOA中的服务查找。如Zookeeper实现服务查找。

透明性：

访问透明度：使用相同的操作本地和远程资源
位置透明：访问资源无需知道其物理或网络位置
并发透明度：多个流程可以同时运行访问使用共享资源，当不能干扰堵塞它们的处理流程
复制透明性：资源的多个实例可以被用来复制以提高可靠性和性能，但无需由用户编制专门的应用程序来实现。
故障透明度：出现软件硬件故障时，使用户和应用方案能继续完成他们的任务不受影响。
移动透明度：允许在系统存在移动的资源和客户。
性能透明度：允许系统重新配置以提高性能负荷变化
缩放透明度：在应用程序结构没有变化的情况下能够在规模上扩展或伸缩系统，以提高吞吐量处理能力。

分布式系统的挑战

分布式系统是难于理解、设计、构建和管理的，他们将比单个机器成倍还要多的变量引入到设计中，使应用程序的根源问题更难发现。SLA(服务水平协议)是衡量停机和/或性能下降的标准，大多数现代应用程序有一个期望的弹性SLA水平，通常按"9"的数量增加(如,每月99.9或99.99%可用性)。每个额外的9变得越来越难实现。

让事情更加复杂的是，我们越来越常见地看到：分布式系统的故障表现为间歇性错误或性能下降(俗称的限电)。这些失败模式耗费更多时间来诊断。例如，Joyent经营一些分布式系统作为其云计算基础设施的一部分。在这样一个系统中，包括高可用性、分布式的键/值存储，Joyent最近经历了瞬态应用程序超时。对于大多数用户系统运行正常，其反应延迟也是在SLA范围内。然而，有百分之5 - 10的请求超出了一个预定义的程序超时。这样的失败问题并没有重现在开发或测试环境中，他们经常会"消失"几分钟到几小时。排除这个故障的根本是需要大量数据存储的系统分析。

（编辑：文章分享网_茂名站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

比亚迪公司DM-i各车型	中国移动上线5G智慧云
平台经济发展怎样严监	世界最丑手机是哪个？