美文网首页
从零手写实现 nginx-20-placeholder 占位符

从零手写实现 nginx-20-placeholder 占位符

作者: 老马啸西风2020 | 来源:发表于2024-06-11 18:23 被阅读0次

    前言

    大家好,我是老马。很高兴遇到你。

    我们为 java 开发者实现了 java 版本的 nginx

    https://github.com/houbb/nginx4j

    如果你想知道 servlet 如何处理的,可以参考我的另一个项目:

    手写从零实现简易版 tomcat minicat

    手写 nginx 系列

    如果你对 nginx 原理感兴趣,可以阅读:

    从零手写实现 nginx-01-为什么不能有 java 版本的 nginx?

    从零手写实现 nginx-02-nginx 的核心能力

    从零手写实现 nginx-03-nginx 基于 Netty 实现

    从零手写实现 nginx-04-基于 netty http 出入参优化处理

    从零手写实现 nginx-05-MIME类型(Multipurpose Internet Mail Extensions,多用途互联网邮件扩展类型)

    从零手写实现 nginx-06-文件夹自动索引

    从零手写实现 nginx-07-大文件下载

    从零手写实现 nginx-08-范围查询

    从零手写实现 nginx-09-文件压缩

    从零手写实现 nginx-10-sendfile 零拷贝

    从零手写实现 nginx-11-file+range 合并

    从零手写实现 nginx-12-keep-alive 连接复用

    从零手写实现 nginx-13-nginx.conf 配置文件介绍

    从零手写实现 nginx-14-nginx.conf 和 hocon 格式有关系吗?

    从零手写实现 nginx-15-nginx.conf 如何通过 java 解析处理?

    从零手写实现 nginx-16-nginx 支持配置多个 server

    从零手写实现 nginx-17-nginx 默认配置优化

    从零手写实现 nginx-18-nginx 请求头+响应头操作

    从零手写实现 nginx-19-nginx cors

    从零手写实现 nginx-20-nginx 占位符 placeholder

    从零手写实现 nginx-21-nginx modules 模块信息概览

    从零手写实现 nginx-22-nginx modules 分模块加载优化

    从零手写实现 nginx-23-nginx cookie 的操作处理

    从零手写实现 nginx-24-nginx IF 指令

    nginx 的占位符

    Nginx 是一个高性能的 HTTP 和反向代理服务器。它使用占位符(变量)来动态地生成配置和响应。

    这些占位符可以在 Nginx 配置文件中使用,并在运行时被特定的值替换。

    以下是对 Nginx 占位符的详细介绍,包括一些常见的变量及其用法。

    1. 基本语法

    Nginx 变量的语法格式是 $variable_name。例如:

    server {
        listen 80;
        server_name example.com;
        
        location / {
            return 200 "The request URI is $uri\n";
        }
    }
    

    在这个例子中,$uri 是一个占位符,表示请求的 URI。

    2. 内置变量

    Nginx 提供了许多内置变量,以下是一些常见的内置变量:

    • $args:请求中的参数。
    • $content_length:请求的 Content-Length 头字段。
    • $content_type:请求的 Content-Type 头字段。
    • $document_root:当前请求的根目录或 alias 指定的路径。
    • $host:请求的主机头字段,如果主机头字段不可用,则等于服务器名称。
    • $http_user_agent:客户端的 User-Agent 头字段。
    • $http_cookie:客户端的 Cookie 头字段。
    • $limit_rate:用于限制连接速率。
    • $request_method:请求方法(GET、POST 等)。
    • $remote_addr:客户端 IP 地址。
    • $remote_port:客户端端口。
    • $request_uri:完整的原始请求 URI,包括参数。
    • $scheme:请求使用的协议(http 或 https)。
    • $server_protocol:请求使用的协议版本。
    • $server_addr:服务器的地址。
    • $server_name:服务器名称。
    • $server_port:服务器端口。
    • $uri:不包含请求参数的请求 URI。

    3. 自定义变量

    除了内置变量,Nginx 还允许用户自定义变量。自定义变量可以在 set 指令中定义。以下是一个示例:

    server {
        listen 80;
        server_name example.com;
    
        set $my_variable "Hello, Nginx!";
        
        location / {
            return 200 "$my_variable\n";
        }
    }
    

    在这个例子中,定义了一个自定义变量 $my_variable,其值为 "Hello, Nginx!",并在响应中返回这个值。

    4. 使用变量进行条件控制

    Nginx 的 if 指令可以根据变量的值进行条件控制。例如:

    server {
        listen 80;
        server_name example.com;
        
        location / {
            if ($request_method = POST) {
                return 405 "Method Not Allowed\n";
            }
            
            return 200 "Hello, Nginx!\n";
        }
    }
    

    在这个例子中,如果请求方法是 POST,服务器会返回 405 状态码和 "Method Not Allowed" 信息,否则返回 200 状态码和 "Hello, Nginx!" 信息。

    5. 变量的应用场景

    变量在 Nginx 中有许多实际应用场景:

    • 日志记录:可以在日志格式中使用变量记录详细的请求信息。
    • URL 重写:使用变量来实现复杂的 URL 重写规则。
    • 负载均衡:在负载均衡配置中使用变量进行复杂的请求路由。
    • 限速限流:使用变量动态控制请求的限速限流策略。

    示例:动态生成响应

    下面是一个结合多个变量的示例,用于动态生成响应内容:

    server {
        listen 80;
        server_name example.com;
        
        location / {
            set $custom_message "Your IP is $remote_addr and you are using $http_user_agent";
            return 200 "$custom_message\n";
        }
    }
    

    在这个示例中,服务器会返回一个包含客户端 IP 地址和 User-Agent 的消息。

    Nginx 的占位符功能强大且灵活,通过合理地使用这些变量,可以实现许多复杂的功能和动态配置。

    为什么 nginx 要支持占位符呢?

    Nginx 支持占位符(变量)的主要原因是为了提供灵活性和动态性,使其配置能够适应各种复杂的应用场景。以下是 Nginx 支持占位符的一些关键原因和优势:

    1. 动态配置

    占位符使得 Nginx 配置文件能够根据实际请求动态生成响应或调整行为。例如,可以根据请求的 URI、方法或头信息来动态地路由请求、返回不同的内容或者做其他处理。

    示例:动态内容返回

    server {
        listen 80;
        server_name example.com;
    
        location / {
            return 200 "Requested URI: $uri\n";
        }
    }
    

    这个示例会根据请求的 URI 返回相应的消息,使得响应内容是动态生成的。

    2. 细粒度控制

    通过占位符,Nginx 可以对请求和响应进行细粒度控制。例如,基于客户端 IP 地址、User-Agent 或请求参数进行不同的处理。这种细粒度控制有助于实现精细的访问控制、安全检查、个性化服务等。

    示例:基于 IP 地址的访问控制

    server {
        listen 80;
        server_name example.com;
    
        location / {
            if ($remote_addr = "192.168.1.1") {
                return 403 "Access denied\n";
            }
            
            return 200 "Welcome\n";
        }
    }
    

    这个示例会根据客户端的 IP 地址进行访问控制。

    3. 简化配置管理

    占位符可以减少重复配置,提高配置文件的可读性和可维护性。通过定义变量和复用这些变量,可以使得配置文件更简洁、直观。

    示例:复用变量简化配置

    server {
        listen 80;
        server_name example.com;
    
        set $root_path /var/www/html;
    
        location / {
            root $root_path;
        }
    
        location /images {
            root $root_path;
        }
    }
    

    在这个示例中,通过定义变量 $root_path,避免了重复配置根目录路径。

    4. 支持复杂应用场景

    Nginx 的占位符使其能够支持复杂的应用场景,例如负载均衡、日志记录、限速限流等。通过使用变量,可以实现更灵活的负载均衡策略、详细的日志记录格式、动态的限速策略等。

    示例:自定义日志格式

    log_format custom '$remote_addr - $remote_user [$time_local] "$request" '
                       '$status $body_bytes_sent "$http_referer" '
                       '"$http_user_agent" "$http_x_forwarded_for"';
    
    access_log /var/log/nginx/access.log custom;
    

    这个示例通过占位符定义了自定义的日志格式,以记录详细的请求信息。

    5. 安全与优化

    通过使用占位符,可以实现动态的安全检查和优化策略。例如,根据请求头信息或者参数来启用或禁用某些功能,从而增强安全性和性能。

    示例:根据 User-Agent 进行优化

    server {
        listen 80;
        server_name example.com;
    
        location / {
            if ($http_user_agent ~* "Mobile") {
                set $mobile 1;
            }
    
            if ($mobile) {
                return 200 "Mobile optimization enabled\n";
            }
    
            return 200 "Standard optimization\n";
        }
    }
    

    这个示例展示了如何根据 User-Agent 实现移动设备优化。

    总结

    Nginx 支持占位符的主要目的是提供更高的灵活性和动态性,使其能够适应各种复杂的应用场景和需求。

    通过占位符,Nginx 的配置能够变得更加简洁、可读、可维护,并且能够实现复杂的控制逻辑,从而提供更强大的功能和更高的性能。

    java 如何设计实现?

    系统内置的 placeholder 变量

    我们首先实现内置的 placeholder 占位符操作。

    定义抽象的接口

    /**
     * 占位符处理类
     * @since 0.17.0
     *
     * @author 老马啸西风
     */
    public abstract class AbstractNginxPlaceholder implements INginxPlaceholder {
    
        private static final Log logger = LogFactory.getLog(AbstractNginxPlaceholder.class);
    
        @Override
        public void placeholder(NginxRequestDispatchContext context) {
            // 上下文存储的内容
            Map<String, Object> placeholderMap = context.getPlaceholderMap();
    
            // 请求头
            FullHttpRequest request = context.getRequest();
    
            String key = getKey(request, context);
            Object value = extract(request, context);
    
            placeholderMap.put(key, value);
    
            logger.info("placeholder put key={},value={}", key, value);
        }
    
        /**
         * 提取值
         * @param request 请求头
         * @param context 上下文
         * @return 结果
         */
        protected abstract Object extract(FullHttpRequest request, NginxRequestDispatchContext context);
    
        /**
         * 唯一标识
         * @param request 请求头
         * @param context 上下文
         * @return 结果
         */
        protected abstract String getKey(FullHttpRequest request, NginxRequestDispatchContext context);
    
    }
    

    常见内置的实现

    • $args:请求中的参数。
    • $content_length:请求的 Content-Length 头字段。
    • $content_type:请求的 Content-Type 头字段。
    • $document_root:当前请求的根目录或 alias 指定的路径。
    • $host:请求的主机头字段,如果主机头字段不可用,则等于服务器名称。
    • $http_user_agent:客户端的 User-Agent 头字段。
    • $http_cookie:客户端的 Cookie 头字段。
    • $limit_rate:用于限制连接速率。
    • $request_method:请求方法(GET、POST 等)。
    • $remote_addr:客户端 IP 地址。
    • $remote_port:客户端端口。
    • $request_uri:完整的原始请求 URI,包括参数。
    • $scheme:请求使用的协议(http 或 https)。
    • $server_protocol:请求使用的协议版本。
    • $server_addr:服务器的地址。
    • $server_name:服务器名称。
    • $server_port:服务器端口。
    • $uri:不包含请求参数的请求 URI。

    以 args 为例,其他的实现类似:

    /**
     * 占位符处理类
     * @since 0.17.0
     *
     * @author 老马啸西风
     */
    public class NginxPlaceholderArgs extends AbstractNginxPlaceholder {
    
        private static final Log logger = LogFactory.getLog(NginxPlaceholderArgs.class);
    
    
        @Override
        protected Object extract(FullHttpRequest request, NginxRequestDispatchContext context) {
            QueryStringDecoder decoder = new QueryStringDecoder(request.uri());
            StringBuilder args = new StringBuilder();
            for (Map.Entry<String, List<String>> entry : decoder.parameters().entrySet()) {
                for (String value : entry.getValue()) {
                    if (args.length() > 0) {
                        args.append("&");
                    }
                    args.append(entry.getKey()).append("=").append(value);
                }
            }
            return args.toString();
        }
    
        @Override
        protected String getKey(FullHttpRequest request, NginxRequestDispatchContext context) {
            return "$args";
        }
    
    }
    

    set 的支持

    可以看到 nginx 默认支持了 set 操作符,可以设置一个变量。

    这个属于操作指令,我们在上一期的指令中进行拓展:

    /**
     * SET 符号,设置一个 $ 变量
     *
     * @since 0.17.0
     * @author 老马啸西风
     */
    public class NginxParamHandleSet extends AbstractNginxParamHandle {
    
        private static final Log logger = LogFactory.getLog(NginxParamHandleSet.class);
    
        /**
         * # 设置一个占位符的值
         *
         * set $mobile 1;
         *
         * @param configParam 参数
         * @param context     上下文
         */
        @Override
        public void doBeforeDispatch(NginxUserConfigParam configParam, NginxRequestDispatchContext context) {
            Map<String, Object> placeholderMap = context.getPlaceholderMap();
    
            // 处理
            List<String> values = configParam.getValues();
            String headerName = values.get(0);
            String headerValue = values.get(1);
    
            // 变量名必须以 $ 开始
            if(!headerName.startsWith(NginxConst.PLACEHOLDER_PREFIX)) {
                throw new Nginx4jException("SET 指令对应的变量名必须以 $ 开始");
            }
    
            placeholderMap.put(headerName, headerValue);
        }
    
        //...
    
        @Override
        public boolean doMatch(NginxUserConfigParam configParam, NginxRequestDispatchContext context) {
            return "set".equalsIgnoreCase(configParam.getName());
        }
    
    }
    

    我们把 set 对应的指令值,放入到 placeholderMap 占位符中。

    set指令 + 占位符的处理的时机

    我们放在 request 分发处理前,统一处理:

        /**
         * 请求头的统一处理
         * @param context 上下文
         * @author 老马啸西风
         */
        protected void beforeDispatch(final NginxRequestDispatchContext context) {
            // 参数管理类
            final INginxParamManager paramManager = context.getNginxConfig().getNginxParamManager();
    
            // v0.17.0 占位符管理类
            final INginxPlaceholderManager placeholderManager = context.getNginxConfig().getNginxPlaceholderManager();
            // 提前处理内置的各种参数
            placeholderManager.init(context);
    
    
            //1. 当前的配置
            NginxUserServerLocationConfig locationConfig = context.getCurrentUserServerLocationConfig();
            if(locationConfig == null) {
                return;
            }
    
            List<NginxUserConfigParam> directives = locationConfig.getDirectives();
            if(CollectionUtil.isEmpty(directives)) {
                return;
            }
    
            // 处理
            for(NginxUserConfigParam configParam : directives) {
                // 占位符处理
                placeholderHandle(configParam, placeholderManager, context);
    
                List<INginxParamHandle> handleList = paramManager.paramHandleList(configParam, context);
                if(CollectionUtil.isNotEmpty(handleList)) {
                    for(INginxParamHandle paramHandle : handleList) {
                        paramHandle.beforeDispatch(configParam, context);
                    }
                }
            }
        }
    
        /**
         * 占位符处理
         *
         * SET 问题,这个是按顺序处理的,所以暂时不用特别考虑
         *
         * @param configParam 配置指令
         * @param placeholderManager 占位符管理类
         * @param context 上下文
         * @since 0.17.0
         */
        protected void placeholderHandle(NginxUserConfigParam configParam,
                                         final INginxPlaceholderManager placeholderManager,
                                         final NginxRequestDispatchContext context) {
            String name = configParam.getName();
            if(name.equals("set")) {
                logger.warn("暂时不处理 set 指令对应的操作符替换,后续可考虑改进。");
                return;
            }
    
            // name 暂时不添加 $ 处理
    
            // value
            String value = configParam.getValue();
            String actualValue = getPlaceholderStr(value, placeholderManager, context);
            configParam.setValue(actualValue);
    
            // list
            List<String> valueList = configParam.getValues();
            List<String> newValueList = new ArrayList<>();
            if(CollectionUtil.isNotEmpty(valueList)) {
                for(String valueItem : valueList) {
                    String actualValueItem = getPlaceholderStr(valueItem, placeholderManager, context);
                    newValueList.add(actualValueItem);
                }
    
                configParam.setValues(newValueList);
            }
    
            // 结束
        }
    
        /**
         * 获取占位符对应的值
         * @param value 原始值
         * @param placeholderManager 管理类
         * @param context 上下文
         * @return 结果
         */
        protected String getPlaceholderStr(String value,
                                           final INginxPlaceholderManager placeholderManager,
                                           final NginxRequestDispatchContext context) {
            // value
            if(value.startsWith(NginxConst.PLACEHOLDER_PREFIX)) {
                Object actualValue = placeholderManager.getValue(context, value);
                if(actualValue == null) {
                    logger.error("占位符未初始化 value={}", value);
                    throw new Nginx4jException("占位符未初始化" + value);
                }
    
                // 设置值
                String actualValueStr = actualValue.toString();
                logger.info("占位符替换 value={}, actualValueStr={}", value, actualValueStr);
                return actualValueStr;
            }
    
            // 原始值
            return value;
        }
    

    首先初始化所有的占位符策略;

    然后依次执行以前的 param 用户指令,这里 set 会按照顺序执行。

    我们在占位符策略处理时特意跳过了 set,其实可以细化一点,比如支持 value 值使用 $ 占位符。

    测试

    完成了上面的实现,本地启动验证一下:

    基本访问:http://192.168.1.12:8080/

    信息: [Nginx] channelRead writeAndFlush start request=HttpObjectAggregator$AggregatedFullHttpRequest(decodeResult: success, version: HTTP/1.1, content: CompositeByteBuf(ridx: 0, widx: 0, cap: 0, components=0))
    GET /favicon.ico HTTP/1.1
    Host: 192.168.1.12:8080
    Connection: keep-alive
    User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36
    Accept: image/avif,image/webp,image/apng,image/svg+xml,image/*,*/*;q=0.8
    Referer: http://192.168.1.12:8080/
    Accept-Encoding: gzip, deflate
    Accept-Language: zh-CN,zh;q=0.9
    content-length: 0, id=40a5effffe257be0-00002a80-00000004-f834a6fd4eed4fe9-527bc66f
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: 命中普通前缀配置 requestUri=/favicon.ico, value=/
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$args,value=
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$content_length,value=0
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$content_type,value=null
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$document_root,value=/D:/github/nginx4j/target/classes/
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$host,value=192.168.1.12:8080
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$http_cookie,value=
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$remote_addr,value=192.168.1.12
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$remote_port,value=54511
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$request_method,value=GET
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$request_uri,value=/favicon.ico
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$schema,value=http
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$server_addr,value=192.168.1.12
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$server_name,value=192.168.1.12:8080
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$server_port,value=192.168.1.12:8080
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$server_protocol,value=HTTP/1.1
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$uri,value=/favicon.ico
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl info
    信息: placeholder put key=$user_agent,value=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36
    六月 09, 2024 8:51:12 下午 com.github.houbb.log.integration.adaptors.commons.JakartaCommonsLoggingImpl warn
    警告: 暂时不处理 set 指令对应的操作符替换,后续可考虑改进。
    ...
    

    这里的日志量还是比较多的,我们把级别还是从 INFO 调整为 debug 比较合理。

    小结

    占位符为 nginx 的配置提供了非常强大灵活的能力。

    我们目前实现的指令比较少,后续考虑花一段时间,将 nginx 的常见指令都支持一下。

    这样的 nginx 才是强大易用的。

    我是老马,期待与你的下次重逢。

    开源地址

    为了便于大家学习,已经将 nginx 开源

    https://github.com/houbb/nginx4j

    相关文章

      网友评论

          本文标题:从零手写实现 nginx-20-placeholder 占位符

          本文链接:https://www.haomeiwen.com/subject/tecgqjtx.html