美文网首页
内容概要

内容概要

作者: a9104fed92a0 | 来源:发表于2018-07-23 23:18 被阅读0次

    1 网站的架构演化

    1.1系统特点

    高并发、大流量

    高可用

    海量数据

    用户分布广泛,网络情况复杂

    安全环境恶劣

    需求快速变更,发布频繁

    渐进式发展

    1.2 网站架构演化发展历程

    单体应用:程序,文件,数据库全在一台服务器上

    应用服务和数据服务分离

    使用缓存

    应用服务集群化

    反向代理和CDN加速

    文件和服务分布式化

    使用NoSQL和搜索引擎

    业务拆分

    分布式服务

    2 大型网站架构模式

    2.1 分层

    横向分层,应用层、服务层、数据层

    2.2 分割

    纵向分层,按照业务逻辑进行分层

    2.3 分布式

    分布式应用和服务

    分布式静态资源:静态资源独立分布式部署

    分布式数据和存储:关系数据库和NoSQL

    分布式计算:Hadoop和MapReduce

    分布式配置:配置中心

    分布式锁:分布式环境下实现并发和协同

    分布式文件:云存储

    2.4 集群

    多台服务器部署相同应用构成一个集群,通过负载均衡设备共同对外提供服务。

    2.5 缓存

    使用缓存的两个条件:(1)数据访问的热点不均匀(2)缓存的数据不会马上过期

    从用户访问的次序上,可以做以下几个方面的缓存:

    (1)CDN缓存,主要对静态资源进行缓存

    (2)反向代理服务器:对网站资源的缓存

    (3)本地缓存:应用的本地缓存

    (4)分布式缓存

    2.6 异步

    (1)可以解耦

    (2)提高系统可用性

    (3)加快网站响应速度

    (4)消除并发访问高峰

    2.7 冗余

    冷备、热备、灾备数据中心

    2.8 自动化

    代码管理、测试、安全检测、自动化部署

    2.9 安全

    3 架构要素

    1、性能

    性能指标主要有响应时间、TPS、系统性能计数器

    2、可用性

    可用性的主要手段是冗余

    3、伸缩性

    伸缩性的主要指标是:是否可以用多台服务器构建集群,是否容易向集群中添加新的服务器

    4、可扩展性

    网站增加新的业务产品时,是否对原有的产品不产生影响

    5、安全

    对现有的和潜在的各种攻击手段,是否有应对策略

    4 性能架构

    4.1 性能测试指标

    1.响应时间

    发送请求到收到请求之间的时间

    2.并发数

    系统能同时处理请求的数目,网站系统用户数>>网站在线用户数>>网站并发用户数

    3.吞吐量

    单位时间内系统处理的请求数量,体现系统的整体处理能力。TPS(每秒事务数),HPS(没秒HTTP请求数),QPS(每秒查询数)

    4.性能计数器

    服务器或者操作系统的一些数据指标

    5.性能测试方法

    性能测试

    负载测试

    压力测试

    稳定性测试

    6.性能优化策略

    性能分析->性能优化

    4.2 web前端性能优化

    4.2.1 浏览器优化

    减少http请求

    使用浏览器缓存

    启动压缩

    css放到页面最前面,js放到页面最后面

    减少cookie传输:cookie尽量少,静态资源独立域名放到CDN上

    4.2.2 CDN加速

    访问频率高的静态资源缓存在CDN,可有效增加访问速度。

    4.2.3 反向代理

    反向代理服务器缓存静态资源,或者不经常变化的动态资源(如果资源发生了变化,需要通知反向代理进行更新)

    4.3 应用服务器性能优化

    4.3.1分布式缓存

    性能优化第一定律:优先使用缓存优化性能

    1.原理

    缓存本质是内存hash表,时间复杂度O(1)

    2.合理使用缓存

    频繁修改的数据放到缓存

    必须有热点数据

    数据不一致和脏读

    缓存可用性

    缓存预热

    缓存穿透

    4.3.2 异步操作

    通过消息队列实现调用异步化,可改善网站性能以及可扩展性。具有消峰作用。

    4.3.3 使用集群

    负载均衡

    4.3.1代码优化

    1.多线程:启动线程数=[任务执行时间/(任务执行时间-IO等待时间)] * CPU内核数

    编程上,解决线程安全的手段:

    (1)将对象设计成无状态对象

    (2)使用局部对象

    (3)并发访问资源时使用锁

    2.资源复用:单例和连接池

    3.数据结构

    hash表,解决hash值冲突

    原始字符串-》MD5-》信息指纹-》Hash计算-》HashCode

    4.垃圾回收

    栈:存储线程上下文信息,如方法参数、局部变量等

    堆:存储对象的内存空间,对象的创建和释放在这里机型

    4.4 存储的性能优化

    机械硬盘vs固态硬盘

    B+树 vs LSM 树

    为了改善数据访问特性,文件系统或者数据库系统通常会对数据排序后存储,加快数据检索速度。

    RAID vs HDFS

    相关文章

      网友评论

          本文标题:内容概要

          本文链接:https://www.haomeiwen.com/subject/eaetpftx.html