美文网首页
RDS&DynamoDB&Elasticache

RDS&DynamoDB&Elasticache

作者: 就这些吗 | 来源:发表于2021-03-21 18:34 被阅读0次

    没错,这次是数据库相关三连,很类似所以也很容易混淆,一起来看看吧~

    1.什么是RDS,什么是DynamoDB,什么又是Elasticache呢?

    • Amazon Relational Database Service (RDS)

      • 所谓的RDS就是AWS提供给我们支持的一些关系型数据库啦:

        SQL Server、Oracle、MySQL Server、PostgreSQL、Aurora、MariaDB

      • 关系型数据库中我们可以用来定义一些预设参数,比如姓名,性别,地址,年龄等信息;并且每一来代表不同的实体,比如张三的信息,李四的信息。行和列就构成了数据的集合。

      • AWS会为RDS提供高性能、高可用、安全和兼容性,我们不需要管理任何操作系统层面的东西,不需要为OS打补丁和更新,而是直接管理RDS程序和版本。

    • Amazon DynamoDB

      • DynamoDB 是一项快速灵活的 NoSQL 数据库服务,适合所有需要一致性且延迟低于 10 毫秒的任意规模的应用程序。

      • NoSQL指非关系型数据库,主要用于超大规模数据的存储,这些数据没有固定的模式。

      • NoSQL 无需事先为要存储的数据建立字段,随时可以存储自定义的数据格式。而在关系数据库里,增删字段是一件非常麻烦的事情。

      • 在下面我们还会有一些简单的介绍

    • Elasticache

      • Elasticache是AWS提供的分布式对象缓存系统,可以有效地提升现有应用程序的性能。利用Elasticache,用户可以从高吞吐和低延迟的内存数据存储中检索数据,

      • 一般来说我们会把相对来说更新频繁的“热数据”放在Elasticache中,把“冷数据”还是放在数据库中,以支持及时的更新。

      • 目前Elasticache支持两种引擎: Memcached、Redis

      • 虽然Redis不是仅可以用来进行缓存,但是在AWS这里,既然有DynamoDB,如果有用到NoSQL的场景,还是用DynamoDB吧

      • 缓存与数据库的一致性一直是一个大问题,纵使我们有多种方法去解决,但是无疑会增加系统的复杂度,所以在用缓存前请考虑:系统真的非缓存不可吗?用了缓存之后数据的一致性怎么解决?如何解决缓存的击穿、穿透、雪崩?etc.

      • 缓存和读写分离都是在读多写少情况下,解决数据库负载过高的解决方案,但是并不是说一有性能问题就上缓存、读写分离,而是应该先优化,例如优化慢查询,调整不合理的业务逻辑,只有确定系统没有优化空间后,先考虑缓存(因为缓存比读写分离更更容易实现),才考虑读写分离或者集群

    2.AWS RDS的备份和还原的方法?

    AWS提供了两种备份和还原数据库的方法——自动备份和手动快照

    • 自动备份

      • 就如同这个名字所说的,自动备份我们可以自己设置时间来进行备份,一般会选择业务比较少的时间段,因为会在备份的时候造成主数据库的I/O暂停几秒钟,但是如果开了多可用区部署,那么就没有这个问题,因为他会从备用可用区的实例来备份。

      • 备份会保留7-35天,取决于设置,在这个时间段内我们还原任意的秒数。如下图所示

      截屏2021-03-21 下午3.29.53 截屏2021-03-21 下午3.29.53
    • 手动快照

      • 不同于自动备份,我们可以在任何时候手动拍摄快照,我们仅能恢复到拍这个快照的时间段,不能选其他的时间。

      • 快照会一直保留,直到手动将他删除。

    截屏2021-03-21 下午3.37.28

    3.RDS的Multiple-AZ和Read Replica的区别

    由于备份在备用机上进行,因此对于多可用区数据库部署,不会出现 I/O 暂停。

    • Multiple-AZ(多可用区部署)

      • 以此部署的RDS,数据库会将更新同步地更新到多个可用区的备用副本中,如果遇到正在读写的可用区故障,RDS会自动转移到备用副本,这种同步和自动转移完全是个黑盒,我们无需与备用的其他可用区副本交互,并且他们也不能用来服务读取流量。(对于上一节的问题,多可用区部署会在备用可用区的实例来备份,所以不会有I/O的问题)。

      • 因为是同步复制的,相对于单一可用区的部署,延迟会有所上升。

      • 再次强调,这里的备用副本不可读,他只作为高可用的备份存在。

    截屏2021-03-21 下午3.12.30
    • Read Replica(只读实例)

      • 只读实例需要在自动备份开启的状态下才能生效

      • 只读实例是异步复制

      • 创建只读实例后,如果需要将读请求转发到此数据库,则需要我们在代码里进行更改请求的终端。

      截屏2021-03-21 下午4.33.58
    截屏2021-03-21 下午5.07.54

    4.DynamoDB超简单介绍

    如果要使用DynamoDB,还是得参考官方文档,这里只是作一些简单的介绍:https://docs.aws.amazon.com/zh_cn/amazondynamodb/latest/developerguide/Introduction.html

    • DynamoDB 是一种适用于任何规模的非关系型数据库服务。使用 DynamoDB,客户可以将运行和扩展分布式数据库的管理工作负担交给 AWS,因而无需担心硬件预置、设置和配置、吞吐容量规划、复制、软件修补或集群扩展等问题。

    • DynamoDB 可自动扩展吞吐容量以满足工作负载需求,并随着表大小的增长对数据进行分区和再分区。DynamoDB 还可在一个 AWS 区域的三个数据中心之间同步复制数据,以此提供高可用性和数据持久性。

    • 如下图所示,DynamoDB可以随意更改表结构。

    截屏2021-03-21 下午5.40.49

    4.1DynamoDB的一致性读取:

    可以按需配置DynamoDB的读取方式

    • 最终一致性读取(默认)

      • 最终一致性选项可以最大程度地提高读取吞吐量。

      • 写入后立即读取可能读不到最近的一次写入,所有数据副本通常在一秒内达到一致。

    • 强一致性读取

      • 在写入数据到DynamoDB之后马上读取该数据,会等所有写入操作以及数据同步全部完成后再回馈结果

    5.再补个课,OLTP和OLAP的区别?

    • 联机事务处理OLTP(Online Transaction Processing)

      • OLTP主要用来记录某类业务事件的发生,如购买行为,当行为产生后,系统会记录是谁在何时何地做了何事。

      • OLTP是传统的关系数据库的主要应用,是基本的日常事务处理,例如银行交易等。

    • 联机分析处理OLAP(Online Analytics Processing)

      • OLAP是数据仓库(Data Warehousing)系统的主要应用,支持复杂的分析操作,侧重决策支持,并且能提供直观易懂的查询结果。OLAP是用来做商业智能(Business Intelligence)方面的分析的。

      • OLAP常用的流行工具是AWS Redshift, Greenplum, Hive等

      • 当电商发展到一定的规模,运营者/管理层需要做更加精细的用户群体分析,比如“20-30岁的男性在过去一年内的购买行为与电商促销活动之间的关系”,那么就要用到数据仓库了。

    相关文章

      网友评论

          本文标题:RDS&DynamoDB&Elasticache

          本文链接:https://www.haomeiwen.com/subject/tmlocltx.html