延续《广州中软卓越 高并发量网站解决思路(上篇)》未说完的内容,将高并发量网站解决思路剩下的几点说完,和上篇遗留的关于高级和分布式的缓存问题。
5、镜像
镜像是大型网站常采用的提高性能和数据安全性的方式,镜像的技术可以解决不同网络接入商和地域带来的用户访问速度差异,比如ChinaNet和EduNet之间的差异就促使了很多网站在教育网内搭建镜像站点,数据进行定时更新或者实时更新。在镜像的细节技术方面,由于篇幅的关系,这里不作阐述,有很多专业的现成的解决架构和产品可选。也有廉价的通过软件实现的思路,比如Linux上的rsync等工具。
6、负载均衡
负载均衡是大型网站解决高负荷访问和大量并发请求采用的高端解决办法。其发展多年,可选择的专业的服务提供商和产品很多,这里推荐两个架构:硬件、软件四层交换
(1)硬件四层交换
第四层交换使用第三层和第四层信息包的报头信息,根据应用区间识别业务流,将整个区间段的业务流分配到合适的应用服务器进行处理。
第四层交换功能就像是虚IP,指向物理服务器。它传输的业务服从的协议多种多样,有HTTP、FTP、NFS、Telnet或其他协议。这些业务在物理服务器基础上,需要复杂的载量平衡算法。在IP世界,业务类型由终端TCP或UDP端口地址来决定,在第四层交换中的应用区间则由源端和终端IP地址、TCP和UDP端口共同决定。
在硬件四层交换产品领域,有一些知名的产品可以选择,比如Alteon、F5等,这些产品很昂贵,但是物有所值,能够提供非常优秀的性能和很灵活的管理能力。“Yahoo中国”当初接近2000台服务器,只使用了三、四台Alteon就搞定了。
(2)软件四层交换
认识到硬件四层交换机的原理后,基于OSI模型来实现的软件四层交换也就应运而生,原理一致,但性能稍差。对于满足一定量的压力还是游刃有余的,有人说软件实现方式其实更灵活,处理能力完全看你配置的熟悉能力。
软件四层交换可以使用Linux上常用的LVS来解决,LVS就是Linux Virtual Server,提供基于心跳线heartbeat的实时灾难应对解决方案,提高系统的强壮性,同时可供灵活的虚拟VIP配置和管理功能,且同时满足多种应用需求,对于分布式的系统来说必不可少。
一个典型的使用负载均衡的策略就是,在软件或者硬件四层交换的基础上搭建squid集群,这种思路在很多大型网站包括搜索引擎上被采用,这样的架构低成本、高性能还有很强的扩张性,随时往架构里面增减节点都非常容易。
对于大型网站来说,前面提到的每个方法可能都会被同时使用到,这里介绍得比较浅显。有时一个很小的squid参数或者apache参数设置,对于系统性能的影响就会很大。
7、CDN加速技术
什么是CDN?CDN的全称是内容分发网络。其目的是通过在现有的Internet中增加一层新的网络架构,将网站的内容发布到最接近用户的网络“边缘”,使用户可以就近取得所需的内容,提高用户访问网站的响应速度。
CDN有别于镜像,比镜像更智能,或者可以做这样一个比喻:CDN=更智能的镜像+缓存+流量导流。因而,CDN可以明显提高Internet网络中信息流动的效率。从技术上全面解决由于网络带宽小、用户访问量大、网点分布不均等问题,提高用户访问网站的响应速度。
CDN的实现分为三类:镜像、高速缓存、专线。
镜像站点(Mirror Site)是最常见的,它让内容直接发布,适用于静态和准动态的数据同步。但是购买和维护新服务器的费用较高,还必须在各个地区设置镜像服务器,配备专业技术人员进行管理与维护。对于大型网站来说,更新所用的带宽成本也大大提高了。
高速缓存的成本较低,适用于静态内容。Internet的统计表明,超过80%的用户经常访问的是20%的网站的内容,在此规律下,缓存服务器便可处理大部分客户的静态请求,而原始的服务器只需处理约20%左右的非缓存请求和动态请求,就大大加快了客户请求的响应时间,降低了原始服务器的负载。(CDN服务一般会在全国范围内的关键节点上放置缓存服务器。)
至于专线,则是让用户直接访问数据源,又同步实现数据的动态。
CDN的实例
举个例子,当某用户访问网站时,网站会利用全球负载均衡技术,将用户的访问指向到距离用户最近的正常工作的缓存服务器上,直接响应用户的请求。
当用户访问已经使用了CDN服务的网站时,其解析过程与传统解析方式的最大区别就在于网站的授权域名服务器不是以传统的轮询方式来响应本地DNS的解析请求,而是充分考虑用户发起请求的地点和当时网络的情况,来决定把用户的请求定向到离用户最近同时负载相对较轻的节点缓存服务器上。
通过用户定位算法和服务器健康检测算法综合后的数据,可以将用户的请求就近定向到分布在网络“边缘”的缓存服务器上,保证用户的访问能得到更及时可靠的响应。
由于大量的用户访问都由分布在网络边缘的CDN节点缓存服务器直接响应了,这就不仅提高了用户的访问质量,同时有效地降低了源服务器的负载压力。
好了,关于高并发量网站解决思路已经全部讲解完毕,希望有助于大家更好的学习Java课程。去企业,学习企业需要的编程技能!广州中软卓越Java培训,真实企业背景,送你企业入场券!
网友评论