本文为读《大型网站技术架构-核心原理与案例分析》(作者李智慧)的笔记,摘抄。
一、传统企业应用系统与互联网应用系统的区别
- 高并发、大流量
- 高可用
- 需要保证应用7X24小时都可以稳定运行
- 海量数据
- 用户分部广泛,网络情况复杂
- 国内各个运营商网络互通问题
- 安全环境恶劣
- 需求快速变更,且发布频繁
- 渐进式发展
- 与传统软件产品或企业应用系统一开始就规划好全部的功能和非功能需求不同,几乎所有的互联网网站都是从一个小网站开始,渐进地发展起来的。
二、大型网站架构演化发展历程
- 初始网站架构
-
因访问量很小,只需要一台服务器。
初始架构
- 应用服务和数据服务分离
-
分离后整个网站使用三台服务器:应用服务器、文件服务器和数据库服务器。
-
服务器对硬件资源要求各不相同
- 应用服务器需要处理大量的业务逻辑,因此需要更快更强大的CPU
- 数据库服务器需要快速磁盘检索和数据缓存,因此需要更快的硬盘和更大的内存
- 文件服务器需要存储大量用户上传的文件,因此需要更大的硬盘
- 使用缓存改善网站性能
-
网站的访问特点遵循二八定律:80%的业务访问集中在20%的数据上。因此可以把这20%的热点数据放到缓存中
-
网站的缓存分为两种
- 本地缓存(缓存在应用服务器本地)
- 远程缓存(缓存在专门应用与缓存的分布式缓存服务器上)
- 使用应用服务器集群改善网站的并发处理能力
-
给应用增加一台服务器分担原有服务器的访问及存储压力比更换一台更强大的服务器更有效。并且还实现了系统的可伸缩性。以后当应用有更大的压力时可以继续增加服务器。
-
注意此时需要添加一台负载均衡调度服务器
使用应用服务器集群
- 数据库读写分离
-
虽然使用了缓存,但是还会有缓存不命中及缓存过期的情况,并且全部的写操作都需要访问数据库。这时数据库成为了网站的性能瓶颈。
此时可以利用数据库提供的主从热备功能,实现数据库的读写分离,从而改善数据库负载压力。
应用在写数据时访问主数据库,通过从数据库获得数据
(此功能可以使用spring aop及相关的中间件实现)。[图片上传失败...(image-8e9206-1535611615069)]
- 使用反向代理和CDN加速网站响应
-
CDN和反向代理的基本原理都是缓存,区别在于CDN部署在网络提供商的机房,使用户在请求网站服务时,可以从距离自己最近的网络提供商机房获取数据;而反向代理则部署在网站的中心机房,当用户请求到达中心机房后,首先访问的服务器是反向代理服务器,如果反向代理服务器中缓存着用户请求的资源,就将其直接返回给用户。
使用反向代理和CDN后
- 使用分布式文件系统和分布式数据库系统
- 分布式数据库是网站数据库拆分的最后手段,只有在单表数据规模非常庞大的时候才使用。不到不得已时,网站更常用的数据库拆分手段是业务分库,将不同业务的数据库部署在不同的物理服务器上。
- 使用NoSQL和搜索引擎
- 随着网站业务越来越复杂,对数据存储和检索的需求也越来越复杂,网站需要采用一些非关系数据库技术:如NoSQL和非数据库查询技术如:搜索引擎
- 应用拆分
-
通过将不同的业务拆分为不同的产品线,另每条产品线独立开发及部署。
业务拆分
10)分布式服务
- 将共用的业务提取,由A、B、C。。。应用访问共用业务,由共用业务访问数据库,减少数据库连接资源。
- 根据业务拆分后,独立开发及部署
网友评论