OpenResty+Lua+Redis+Canal实现多级缓存架

作者: javacoo | 来源:发表于2021-07-11 14:03 被阅读0次

1 OpenResty高性能Web站点架构

openresty.png

http://openresty.org/en/
http://openresty.org/cn/
OpenResty® 是一款基于 NGINX 和 LuaJIT 的 Web 平台。

1.1 OpenResty简介

OpenResty® 是一个基于 Nginx 与 Lua 的高性能 Web 平台，其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

OpenResty® 通过汇聚各种设计精良的 Nginx 模块（主要由 OpenResty 团队自主开发），从而将 Nginx 有效地变成一个强大的通用 Web 应用平台。这样，Web 开发人员和系统工程师可以使用 Lua 脚本语言调动 Nginx 支持的各种 C 以及 Lua 模块，快速构造出足以胜任 10K 乃至 1000K 以上单机并发连接的高性能 Web 应用系统。

OpenResty® 的目标是让你的Web服务直接跑在 Nginx 服务内部，充分利用 Nginx 的非阻塞 I/O 模型，不仅仅对 HTTP 客户端请求,甚至于对远程后端诸如 MySQL、PostgreSQL、Memcached 以及 Redis 等都进行一致的高性能响应。

1.2 OpenResty搭建

关于OpenResty的搭建，可以参考官方提供的网址进行搭建。http://openresty.org/cn/installation.html，我们采用源码安装的方式进行安装。官方提供了源码安装的方式：http://openresty.org/cn/linux-packages.html

安装OpenResty

安装依赖库：

yum install libtermcap-devel ncurses-devel libevent-devel readline-devel pcre�devel gcc openssl openssl-devel per perl wget

下载安装包：

wget https://openresty.org/download/openresty-1.11.2.5.tar.gz

解压安装包:
```
tar -xf openresty-1.11.2.5.tar.gz
```

进入安装包，并安装:

#进入安装包
cd openresty-1.11.2.5
#安装
./configure --prefix=/usr/local/openresty --with-luajit --without�http_redis2_module --with-http_stub_status_module --with-http_v2_module --with�http_gzip_static_module --with-http_sub_module --add�module=/usr/local/javacoo/ngx_cache_purge-2.3/
#编译并安装
make && make install

说明：

--prefix=/usr/local/openresty：安装路径
--with-luajit：安装luajit相关库，luajit是lua的一个高效版，LuaJIT的运行速度比标准Lua快数十
倍。
--without-http_redis2_module：现在使用的Redis都是3.x以上版本，这里不推荐使用Redis2，表示
不安装redis2支持的lua库
--with-http_stub_status_module：Http对应状态的库
--with-http_v2_module：对Http2的支持
--with-http_gzip_static_module：gzip服务端压缩支持
--with-http_sub_module：过滤器，可以通过将一个指定的字符串替换为另一个字符串来修改响应
--add-module=/usr/local/javacoo/ngx_cache_purge-2.3/：Nginx代理缓存清理工具

关于每个模块的具体作用，大家可以参考腾讯云的开发者手册：https://cloud.tencent.com/developer/
doc/1158
如下图安装完成后，在 /usr/local/openrestry/nginx 目录下是安装好的nginx，以后我们将在该目
录的nginx下实现网站发布。

配置环境变量：

vi /etc/profile
export PATH=/usr/local/openresty/nginx/sbin:$PATH
source /etc/profile

开机启动：

linux系统结构 /lib/systemd/system/ 目录,该目录自动存放启动文件的配置位置，里面一般包含有
xxx.service ,例如 systemctl enable nginx.service ,就是调用
/lib/systemd/system/nginx.service 文件，使nginx开机启动。
我们可以创建 /usr/lib/systemd/system/nginx.service ，在该文件中编写启动nginx脚本：
```
[Service]
Type=forking
PIDFile=/usr/local/openresty/nginx/logs/nginx.pid
ExecStartPre=/usr/local/openresty/nginx/sbin/nginx -t
ExecStart=/usr/local/openresty/nginx/sbin/nginx
ExecReload=/bin/kill -s HUP $MAINPID
ExecStop=/bin/kill -s QUIT $MAINPID
PrivateTmp=true
[Install]
WantedBy=multi-user.target
```
执行 systemctl daemon-reload :重新加载某个服务的配置文件
执行 systemctl enable nginx.service :开机启动
执行 systemctl start nginx.service :启动nginx

访问 http://192.168.100.130/,效果如下：

2.png

1.3 动静分离站点架构

1.3.1 什么是网站动静分离架构模式？

网站中的动静分离其实就是将动态资源和静态资源分离处理。
传统网站架构模式：jsp、html、img、css、js全部存放在一个服务器上，把静态资源和动态资源共同放到一台服务器上。
大型互联网公司中前端与后端开发是分离，静态资源和动态资源不会部署到同一台服务器上，静态资源部署在一个服务器上(html、css、img、js …)，动态资源部署在一个服务器上(后端代码)

1.3.2 动态资源和静态资源的区别?

静态资源：用户多次访问后，html源代码不会发生改变，例如html、jpg 、css、js 等不需要后台处理的资源。
动态资源：用户多次访问后，html源代码可能会发生改变，例如我们访问的JSP页面 (本质是一个Servlet)或*.do请求等。
区别：判断标准是，刷新多次，html源代码是否发生改变。
误区：并不是页面是动态的，就一定是动态页面，一般动态页面为了提高被搜索引擎搜到的机率，会使用伪静态；也就是说使用动态页面静态化技术将页面静态化，静态化技术有Freemarker、Beetl、Velociity、Thymeleaf 等。

1.3.3 为什么要使用动静分离？

其实就是减轻服务器的压力、提高服务器的响应速度和效率、保证高并发。就像数据库的读写分离一样，也是保证高并发。
静态服务器我们同时也可以使用CDN做内容分发，访问不同的资源转发到不同的服务器。
静态服务器我们一般使用Nginx，Nginx实现静态服务器要比Tomcat 快得多。

1.3.4 动静分离与前后端分离的区别？

动静分离：指的是动态资源和静态资源分离，分别部署在不同的服务器上。
前后端分离：网站架构模式中，微服务开发基于SOA面向服务开发，后台和前端都采用调用接口方式。
动静分离.png

1.3.5 Nginx配置示例

Nginx的nginx.conf文件配置中配置如下：

#静态资源服务配置(一定要配置在动态资源之前，因为动态资源location采用/匹配的，否则请求就被统一当做动态资源处理)
 server {
     listen       80;   # 表示当前的代理服务器监听的端口，默认的是监听80端口。注意，如果我们配置了多个server，这个listen要配置不一样，不然就不能确定转到哪里去了。
     server_name  javacoo;  
     
     #静态资源
     location .*\.(js|css|ico|png|jpg|eot|svg|ttf|woff) {
     root html;
     index index.html index.htm;
     }
     
 }
 
 
 #配置上游服务器 集群，默认轮询机制
 upstream backServer{
     server 127.0.0.1:81;
     server 127.0.0.1:82;
 }
 #动态资源服务配置
    server {
        listen       80;   # 表示当前的代理服务器监听的端口，默认的是监听80端口。注意，如果我们配置了多个server，这个listen要配置不一样，不然就不能确定转到哪里去了。
        server_name  localhost;   # 表示监听到之后需要转到哪里去，这时我们直接转到本地，这时是直接到nginx文件夹内。

        #charset koi8-r;

        #access_log  logs/host.access.log  main;

        location / {    # 表示匹配的路径，这时配置了/表示所有请求都被匹配到这里
            #root   html;   # 里面配置了root这时表示当匹配这个请求的路径时，将会在这个文件夹内寻找相应的文件，这里对我们之后的静态文件伺服很有用。
         #指定上游负载均衡服务器
         proxy_pass http://backServer/;
            #index  index.html index.htm;   # 当没有指定主页时，默认会选择这个指定的文件，它可以有多个，并按顺序来加载，如果第一个不存在，则找第二个，依此类推。
        }
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        }
    }

1.3.6 实际应用

其实我们在实际做动静分离的时候我们一般不这样做。因为大多数网站静态资源比动态资源大得多，往往影响网站加载速度的往往是静态资源，这其实对我们的带宽要求非常高。
例如我服务器带宽是1Mbps（1Mbps≈128kb/s），发一个请求动态资源10kb、静态资源590kb，这时候我们也要（590+10）/128≈5秒才能完成加载，更别说并发访问的情况了，我们虽然也可以提高带宽，而且带宽是非常贵的（比服务器配置还贵），治标不治本，一般我们采用三方服务商CDN来做静态资源缓存，它会将我们的静态资源缓存到各个节点，并支持就近原则访问。
为什么将静态资源存放到第三方服务器效率非常高呢？
1.云服务器签订带宽都是将T算；
2.CDN内容分发，能够将静态资源缓存到全国各地节点能够减少客户端与CDN带宽距离从而提高响应速度；就近原则访问，举个例子，比如说我是四川的用户就访问成都的节点或离四川比较近的节点。
3.春节人口迁徙，根据就近原则会导致某些节点压力很大，这时也会访问其他节点的。

2 Lua语法学习

lua.png

官网：http://www.lua.org/

学习站点：https://www.runoob.com/lua/lua-tutorial.html

2.1 lua简介

Lua 是一个小巧的脚本语言。它是巴西里约热内卢天主教大学（Pontifical Catholic University of Rio de
Janeiro）里的一个由Roberto Ierusalimschy、Waldemar Celes 和 Luiz Henrique de Figueiredo三人
所组成的研究小组于1993年开发的。其设计目的是为了通过灵活嵌入应用程序中从而为应用程序提供灵
活的扩展和定制功能。Lua由标准C编写而成，几乎在所有操作系统和平台上都可以编译，运行。Lua并
没有提供强大的库，这是由它的定位决定的。所以Lua不适合作为开发独立应用程序的语言。Lua 有一
个同时进行的JIT项目，提供在特定平台上的即时编译功能。
Lua脚本可以很容易的被C/C++ 代码调用，也可以反过来调用C/C++的函数，这使得Lua在应用程序中可
以被广泛应用。不仅仅作为扩展脚本，也可以作为普通的配置文件，代替XML,ini等文件格式，并且更容
易理解和维护。 Lua由标准C编写而成，代码简洁优美，几乎在所有操作系统和平台上都可以编译，运
行。一个完整的Lua解释器不过200k，在所有脚本引擎中，Lua的速度是最快的。这一切都决定了Lua是
作为嵌入式脚本的最佳选择。

2.2 Lua特性：

一个小巧的脚本语言
设计目的是为了通过灵活嵌入应用程序中从而为应用程序提供灵活的扩展和定制功能
所有操作系统和平台上都可以编译、运行Lua脚本
所有脚本引擎中，Lua的速度是最快的

2.3 应用场景：

游戏开发
独立应用脚本
高性能Web应用（天猫、京东都有应用）
扩展和数据库插件如：MySQL Proxy 和 MySQL WorkBench
安全系统，如入侵检测系统

2.4 Lua常用语法

2.4.1Lua安装

首先我们准备一个linux虚拟机来安装Lua，在linux系统中按照如下步骤进行安装：

curl -R -O http://www.lua.org/ftp/lua-5.3.5.tar.gz
tar xf lua-5.3.5.tar.gz
cd lua-5.3.5
make linux test

2.4.2 Lua常用操作

Lua 提供了交互式编程模式。我们可以在命令行中输入程序并立即查看效果，这种编程模式类似我们控
制台操作，Lua 交互式编程模式可以通过命令 lua -i 或 lua 来启用：

[root@server1 lua-5.3.5]# lua -i
Lua 5.3.5 Copyright (C) 1994-2018 Lua.org, PUC-Rio
>

打印：

print("springcloud alibaba")

数据类型

Lua 是动态类型语言，变量不要类型定义,只需要为变量赋值。值可以存储在变量中，作为参数传递或结果返回。

Lua 中有 8 个基本类型分别为：nil、boolean、number、string、userdata、function、thread 和 table。

lua-type.png

类型测试：

print(type("Hello world")) --> string
print(type(10.4*3)) --> number
print(type(print)) --> function
print(type(type)) --> function
print(type(true)) --> boolean
print(type(nil)) --> nil
print(type(type(X))) --> string

变量

变量在使用前，需要在代码中进行声明，即创建该变量。Lua 变量有三种类型：全局变量、局部变量、
表中的域。

全局变量定义：

> age=19
> pr

局部变量定义：

> local username=wangwu
> print(username)
nil

此时username不是全局变量，一般在某个方法中使用，不能全局使用，所以输出nil。

对象(table)

> --定义对象resp
> resp = {}
> --往对象resp中添加属性name，赋值为zhangsan
> resp["name"]="zhangsan"
> --往对象resp中添加属性address，赋值为hunanchangsha
> resp["address"]="hunanchangsha"
> --输出对象resp中的name属性值
> print(resp["name"])
zhangsan

函数

创建一个函数，其实就是创建一个方法，函数以function开始，end结束，可以在end之前有返回值，也
可以有入参，定义一个方法如下：

> --定义userinfo方法，入参为age
> function userinfo(age)
>> --age在原有基础上+1
>> age=age+1
>> --返回变化后的age
>> return age
>> --结束
>> end
> print(userinfo(19))
20

拼接

在上面方法调用上拼接一段字符串,可以使用亮点来做..，如下：

> print(userinfo(19).."岁了")
20岁了

逻辑判断:

我们经常会做一些条件判断，在lua中也可以实现,lua中有 if xx then else end 的流程判断语法。

> function userinfo(age)
>> if age>=18 then
>> return "成年人"
>> else
>> return "未成年"
>> end
>> end
> print(userinfo(17))
未成年

脚本编程

我们可以像写java一样，将lua脚本写到一个文件中，并且可以在一个脚本文件引入另外一个脚本文件，
类似java中的导包。
创建 course.lua ，代码如下：

--定义一个对象
local course = {}
--定义一个方法
function course.courseName(id)
if id==1 then
return "java"
else
return "UI"
end
end
return course

创建 student.lua ，代码如下：

--导入course.lua
local cr = require("course")
--调用courseName方法
local result = cr.courseName(1)
print(result)

执行 student.lua ：

[root@server1 lua]# lua student.lua
java

3 多级缓存架构实战

项目运行过程中往往为了提升项目对数据加载效率，一般都会增加缓存，但缓存如何加载效率最高？如
何加载对后端服务造成的压力最小？我们需要设计一套完善的缓存架构体系。

3.1 多级缓存架构分析

缓存设计.png

用户请求到达后端服务，先经过代理层nginx,nginx将请求路由到后端tomcat服务，tomcat去数据库中
取数据，这是一个非常普通的流程，但在大并发场景下，需要做优化，而缓存是最有效的手段之一。缓
存优化有，执行过程如下：

请求到达Nginx，Nginx抗压能力极强。
Tomcat抗压能力很弱，如果直接将所有请求路由给Tomcat，Tomcat压力会非常大，很有可能宕机。我们
可以在Nginx这里设置2道缓存，第1道是Redis缓存，第2道是Nginx缓存。
先加载Redis缓存，如果Redis没有缓存，则加载Nginx缓存，Nginx如果没有缓存，则将请求路由到
Tomcat。
Tomcat发布的程序会加载数据，加载完成后需要做缓存的，及时将数据存入Redis缓存，再响应数据给用
户。
用户下次查询的时候，查询Redis缓存或Nginx缓存。
后面用户请求的时候，就可以直接从Nginx缓存拿数据了，这样就可以实现后端Tomcat发布的服务被调用
的次数大幅减少，负载大幅下降

上面这套缓存架构被多个大厂应用，除了可以有效提高加载速度、降低后端服务负载之外，还可以防止
缓存雪崩，为服务稳定健康打下了坚实的基础，这也就是鼎鼎有名的多级缓存架构体系。

3.2 多级缓存-Lua+Redis

按照上面分析的架构，可以每次在Nginx的时候使用Lua脚本查询Redis，如果Redis有数据，则将数据存
入到Nginx缓存，再将数据响应给用户，此时我们需要实现使用Lua将数据从Redis中加载出来。

我们在 /usr/local/openresty/nginx/lua 中创建文件 aditem.lua ，脚本如下：

--数据响应类型JSON
ngx.header.content_type="application/json;charset=utf8"
--Redis库依赖
local redis = require("resty.redis");
local cjson = require("cjson");
--获取id参数（type）
local id = ngx.req.get_uri_args()["id"];
--key组装
local key = "ad-items-skus::"..id
--创建链接对象
local red = redis:new()
--设置超时时间
red:set_timeout(2000)
--设置服务器链接信息
red:connect("192.168.100.130", 6379)
--查询指定key的数据
local result=red:get(key);
--关闭Redis链接
red:close()修改 nginx.conf 添加如下配置：（最后记得将content_by_lua_file改成rewrite_by_lua_file）
访问 http://www.javacoo.com/sku/aditems/type?id=1 效果如下：
4 Nginx代理缓存
if result==nil or result==null or result==ngx.null then
return true
else
--输出数据
ngx.say(result)
end

修改 nginx.conf 添加如下配置：（最后记得将content_by_lua_file改成rewrite_by_lua_file）

#推广产品查询
location /sku/aditems/type {
content_by_lua_file /usr/local/openresty/nginx/lua/aditem.lua;
}

4 Nginx代理缓存

proxy_cache 是用于 proxy 模式的缓存功能，proxy_cache 在 Nginx 配置的 http 段、server 段中分别
写入不同的配置。http 段中的配置用于定义 proxy_cache 空间，server 段中的配置用于调用 http 段中
的定义，启用对server 的缓存功能。
使用：

1、定义缓存空间
2、在指定地方使用定义的缓存

4.1 Nginx代理缓存学习

开启Proxy_Cache缓存：

我们需要在nginx.conf中配置才能开启缓存：
```
proxy_cache_path /usr/local/openresty/nginx/cache levels=1:2
keys_zone=proxy_cache:10m max_size=1g inactive=60m use_temp_path=off;
```
参数说明：
- 【proxy_cache_path】指定缓存存储的路径，缓存存储在/usr/local/openresty/nginx/cache目录
  【levels=1:2】设置一个两级目录层次结构存储缓存，在单个目录中包含大量文件会降低文件访问速度，因此我们建议对大多数部署使用两级目录层次结构。如果 levels 未包含该参数，Nginx 会将所有文件放在同一目录中。
- 【keys_zone=proxy_cache:10m】设置共享内存区域，用于存储缓存键和元数据，例如使用计时器。拥有内存中的密钥副本，Nginx 可以快速确定请求是否是一个 HIT 或 MISS 不必转到磁盘，从而大大加快了检查速度。1 MB 区域可以存储大约 8,000 个密钥的数据，因此示例中配置的 10 MB 区域可以存储大约
  80,000 个密钥的数据。
- 【max_size=1g】设置缓存大小的上限。它是可选的; 不指定值允许缓存增长以使用所有可用磁盘空间。当缓存大小达到限制时，一个称为缓存管理器的进程将删除最近最少使用的缓存，将大小恢复到限制之下的文件。
- 【inactive=60m】指定项目在未被访问的情况下可以保留在缓存中的时间长度。在此示例中，缓存管理器进程会自动从缓存中删除 60 分钟未请求的文件，无论其是否已过期。默认值为 10 分钟（10m）。非活动内容与过期内容不同。Nginx 不会自动删除缓存 header 定义为已过期内容（例如 CacheControl:max�age=120）。过期（陈旧）内容仅在指定时间内未被访问时被删除。访问过期内容时，Nginx 会从原始服务器刷新它并重置 inactive 计时器。
- 【use_temp_path=off】表示NGINX会将临时文件保存在缓存数据的同一目录中。这是为了避免在更新缓存时，磁盘之间互相复制响应数据，我们一般关闭该功能。
Proxy_Cache属性：
- proxy_cache:设置是否开启对后端响应的缓存，如果开启的话，参数值就是zone的名称，比
  如:proxy_cache。
- proxy_cache_valid:针对不同的response code设定不同的缓存时间，如果不设置code，默认为
  200,301,302,也可以用any指定所有code。
- proxy_cache_min_uses:指定在多少次请求之后才缓存响应内容,这里表示将缓存内容写入到磁盘。
  proxy_cache_lock:默认不开启，开启的话则每次只能有一个请求更新相同的缓存，其他请求要么等待缓存有数据要么限时等待锁释放;nginx 1.1.12才开始有。配套着proxy_cache_lock_timeout一起使用。
- proxy_cache_key:缓存文件的唯一key，可以根据它实现对缓存文件的清理操作。

4.2 Nginx代理缓存热点数据应用

开启代理缓存

修改 nginx.conf ，添加如下配置：

proxy_cache_path /usr/local/openresty/nginx/cache levels=1:2
keys_zone=proxy_cache:10m max_size=1g inactive=60m use_temp_path=off;

修改 nginx.conf ，添加如下配置：

#门户发布
server {
    listen 80;
    server_name www.javacoo.com;
    #推广产品查询
    location /sku/aditems/type {重启nginx或者重新加载配置文件 nginx -s reload ，再次测试，可以发现下面个规律：
    我们还可以发现cache目录下多了目录和一个文件，这就是Nginx缓存：
    4.3 Cache_Purge代理缓存清理
    很多时候我们如果不想等待缓存的过期，想要主动清除缓存，可以采用第三方的缓存清除模块清除缓存
    nginx_ngx_cache_purge 。安装nginx的时候，需要添加 purge 模块， purge 模块我们已经下载了，
    在 /usr/local/javacoo 目录下,添加该模块 --add-module=/usr/local/javacoo/ngx_cache_purge-2.3/ ,
    这一个步骤我们在安装 OpenRestry 的时候已经实现了。
    安装好了后，我们配置一个清理缓存的地址：http://192.168.100.130/purge/sku/aditems/type?id=1
    #先找Nginx缓存
    rewrite_by_lua_file /usr/local/openresty/nginx/lua/aditem.lua;
    #启用缓存openresty_cache
    proxy_cache proxy_cache;
    #针对指定请求缓存
    #proxy_cache_methods GET;
    #设置指定请求会缓存
    proxy_cache_valid 200 304 60s;
    #最少请求1次才会缓存
    proxy_cache_min_uses 1;
    #如果并发请求，只有第1个请求会去服务器获取数据
    #proxy_cache_lock on;
    #唯一的key
    proxy_cache_key $host$uri$is_args$args;
    #动态代理
    proxy_pass http://192.168.100.1:8081;
    }
    #其他所有请求
    location / {
    root /usr/local/javacoo/web/static/frant;
    }
}

重启nginx或者重新加载配置文件 nginx -s reload ，再次测试，可以发现下面个规律：

1:先查找Redis缓存
2:Redis缓存没数据，直接找Nginx缓存
3:Nginx缓存没数据，则找真实服务

我们还可以发现cache目录下多了目录和一个文件，这就是Nginx缓存：

4.3 Cache_Purge代理缓存清理

很多时候我们如果不想等待缓存的过期，想要主动清除缓存，可以采用第三方的缓存清除模块清除缓存
nginx_ngx_cache_purge 。安装nginx的时候，需要添加 purge 模块， purge 模块我们已经下载了，
在 /usr/local/javacoo 目录下,添加该模块 --add-module=/usr/local/javacoo/ngx_cache_purge-2.3/ ,
这一个步骤我们在安装 OpenRestry 的时候已经实现了。

安装好了后，我们配置一个清理缓存的地址：http://192.168.100.130/purge/sku/aditems/type?id=1

#清理缓存
location ~ /purge(/.*) {
#清理缓存
proxy_cache_purge proxy_cache $host$1$is_args$args;
}

此时访问http://www.javacoo.com/purge/sku/aditems/type?id=1，表示清除缓存，如果出现如下
效果表示清理成功：

3.png

5 缓存一致性

上面我们虽然实现了多级缓存架构，但是问题也出现了，如果数据库中数据发生变更，如何更新Redis缓
存呢？如何更新Nginx缓存呢？
我们可以使用阿里巴巴的技术解决方案Canal来实现，通过Canal监听数据库变更，并实时消费变更数
据，并更新缓存。
canal [kə'næl]，译意为水道/管道/沟渠，主要用途是基于 MySQL 数据库增量日志解析，提供增量数据
订阅和消费
学习地址：https://github.com/alibaba/canal
早期阿里巴巴因为杭州和美国双机房部署，存在跨机房同步的业务需求，实现方式主要是基于业务
trigger 获取增量变更。从 2010 年开始，业务逐步尝试数据库日志解析获取增量变更进行同步，由此衍
生出了大量的数据库增量订阅和消费业务。
基于日志增量订阅和消费的业务包括:

数据库镜像
数据库实时备份
索引构建和实时维护(拆分异构索引、倒排索引等)
业务 cache 刷新
带业务逻辑的增量数据处理

当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x。

5.1 Canal原理

MySQL主备复制原理:

MySQL master 将数据变更写入二进制日志( binary log, 其中记录叫做二进制日志事件binary log
events，可以通过 show binlog events 进行查看)
MySQL slave 将 master 的 binary log events 拷贝到它的中继日志(relay log)
MySQL slave 重放 relay log 中事件，将数据变更反映它自己的数据

Canal 工作原理:

canal 模拟 MySQL slave 的交互协议，伪装自己为 MySQL slave ，向 MySQL master 发送dump
协议
MySQL master 收到 dump 请求，开始推送 binary log 给 slave (即 canal )
canal 解析 binary log 对象(原始为 byte 流)
canal.png

5.2 Canal安装

5.2.1 MySQL开启binlog

对于MySQL , 需要先开启 Binlog 写入功能，配置 binlog-format 为 ROW 模式，my.cnf 中配置如下

docker exec -it mysql /bin/bash
cd /etc/mysql/mysql.conf.d
vi mysqld.cnf

在最文件尾部添加如下配置：

log-bin=mysql-bin # 开启 binlog
binlog-format=ROW # 选择 ROW 模式
server_id=1 # 配置 MySQL replaction 需要定义，不要和 canal 的 slaveId 重复

注意：针对阿里云 RDS for MySQL , 默认打开了 binlog , 并且账号默认具有 binlog dump 权限 , 不需要
任何权限或者 binlog 设置,可以直接跳过这一步。

授权 canal 链接 MySQL 账号具有作为 MySQL slave 的权限, 如果已有账户可直接 grant：

CREATE USER canal IDENTIFIED BY 'canal';
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;
FLUSH PRIVILEGES

重启mysql容器

docker restart canal

查看是否开启binlog:

show variables like 'log_bin';

5.2.2 Canal安装

我们采用docker安装方式：

docker run -p 11111:11111 --name canal -d docker.io/canal/canal-server

进入容器,修改核心配置canal.properties 和instance.properties，canal.properties 是canal自身的配
置，instance.properties是需要同步数据的数据库连接配置。
修改配置如下：

# position info
canal.instance.master.address=192.168.100.130:3306

另一处配置：

# table regex
#canal.instance.filter.regex=.*\\..*
#监听配置
canal.instance.filter.regex=shop_goods.ad_items

配置完成后，重启 canal 容器

docker restart canal

5.3 多级缓存架构缓存一致性实战

多级缓存架构一致性.png

5.3.1 Canal微服务搭建

工程坐标：

<groupId>com.javacoo</groupId>
<version>1.0.0-SNAPSHOT</version>
<artifactId>demo-canal-service</artifactId>

pom.xml:

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0
http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <parent>
        <artifactId>demo-service</artifactId>
        <groupId>com.javacool</groupId>
        <version>1.0.0-SNAPSHOT</version>
    </parent>
    <modelVersion>4.0.0</modelVersion>
    <artifactId>demo-canal-service</artifactId>
    <description>
        Canal微服务
    </description>
    <dependencies>
        <!--springboot-canal快速构建依赖包-->
        <dependency>
            <groupId>top.javatool</groupId>
            <artifactId>canal-spring-boot-starter</artifactId>
            <version>1.2.1-RELEASE</version>
        </dependency>
        <!--依赖demo-goods-api-->
        <dependency>
            <groupId>com.javaoo</groupId>
            <artifactId>goods-api</artifactId>
            <version>1.0.0-SNAPSHOT</version>
        </dependency>
    </dependencies>
</project>

bootstrap.yml:

server:
    port: 8083
spring:
    application:
        name: demo-canal
    cloud:
        nacos:
            config:
                file-extension: yaml
                server-addr: 192.168.100.130:8848
            discovery:
                #Nacos的注册地址
                server-addr: 192.168.100.130:8848
#Canal配置
canal:
    server: 192.168.100.130:11111
    destination: example
#日志配置
logging:
    pattern:
        console: "%msg%n"
    level:
        root: error

创建监听类： com.javacoo.service.canal.listener.AdItemsHandler

@CanalTable(value = "ad_items")
@Component
public class AdItemsHandler implements EntryHandler<AdItems> {
    @Autowired
    private SkuFeign skuFeign;
    @Override
    public void insert(AdItems adItems) {
        //加载缓存
        skuFeign.updateTypeItems(adItems.getType());
    }
    /***
    * 修改
    * @param before
    * @param after
    */
    @Override
    public void update(AdItems before, AdItems after) {
        //分类不同，则重新加载之前的缓存
        if(before.getType().intValue()!=after.getType().intValue()){
            //修改缓存
            skuFeign.updateTypeItems(before.getType());
        }
        //加载缓存
        skuFeign.updateTypeItems(after.getType());
    }
    @Override
    public void delete(AdItems adItems) {
        //删除缓存
        skuFeign.deleteTypeItems(adItems.getType());
    }
}

创建启动类：com.javacoo.service.canal.MallCanalApplication

@SpringBootApplication(exclude = DataSourceAutoConfiguration.class)
@EnableFeignClients(basePackages = {"com.javacoo.service.goods.feign"})
public class MallCanalApplication {
    public static void main(String[] args) {
        SpringApplication.run(MallCanalApplication.class,args);
    }
}

一些信息

路漫漫其修远兮,吾将上下而求索
码云：https://gitee.com/javacoo
QQ群：164863067
作者/微信：javacoo
邮箱：xihuady@126.com