美文网首页
2021-01-07 PostgreSQL:UrlEncode函

2021-01-07 PostgreSQL:UrlEncode函

作者: 有种境界叫loser | 来源:发表于2021-01-07 12:44 被阅读0次

    最近因工作需要,需要在数据库中对某些字段进行Url编码,但个人未找到官方函数,瞄了下Url编码的原理,索性自己用凑合着用的正则知识写了个凑合着用的自定义函数,话不多说,代码先行:

    PostgreSQL函数:
    CREATE OR REPLACE FUNCTION "public"."fun_urlencode"("s_value" text )
      RETURNS "pg_catalog"."varchar" AS $BODY$
    DECLARE 
        s_hex varchar(64);
        s_Result varchar(2048); 
            i_valuelen int;
            i_len int;
    BEGIN
        s_Result :=''; 
        i_valuelen :=LENGTH(s_value);
        i_len :=1;
        while i_len <= i_valuelen  
        LOOP 
            s_hex := substr(s_value, i_len, 1);
            s_Result :=s_Result || 
                                case when s_hex ~ '^(?![;|/|?|:|@|&|=|+|$|,|<|>|#|%|"|{ }|||\|^|[|]|`|:])([\x00-\xff])'
                                then s_hex  when s_hex ~ '[\s]' then '+'
                                else regexp_replace(encode(s_hex::bytea,'hex'),'(?=(?:[\x00-\xff]{2})+$)','%','g') 
                                end; 
            i_len :=i_len+1;
        END LOOP;
    
      return s_Result;
    end;
    $BODY$
      LANGUAGE plpgsql VOLATILE
      COST 100;
    
    

    通过查询发现urlencode的规则大致是将需要转换的内容(ASCII码形式之外的内容),用十六进制表示法转换出来,并在每个字符前加上%开头,其中需要注意的是先排除特殊字符、以及空格特殊处理;
    所以我这里先用正则匹配字符串符合ASCII码的字符且排除须转义特殊字符,然后判断“+”,最后转为16进制的字符每隔两位加上%进行拼接,至此编码后的字符就出来了。

    下面是我通过C#进行验证的结果:

    C#代码
       static void Main(string[] args)
            {
                var strDecode = "2020年01月07日,+-, ():@祝大家在新的一年里 工作顺利、家庭幸福!";
                var strEncode = "2020%e5%b9%b401%e6%9c%8807%e6%97%a5%ef%bc%8c%2b-%2c+()%3a%40%e7%a5%9d%e5%a4%a7%e5%ae%b6%e5%9c%a8%e6%96%b0%e7%9a%84%e4%b8%80%e5%b9%b4%e9%87%8c+%e5%b7%a5%e4%bd%9c%e9%a1%ba%e5%88%a9%e3%80%81%e5%ae%b6%e5%ba%ad%e5%b9%b8%e7%a6%8f%ef%bc%81";
                Console.WriteLine("原字符串:");
                Console.WriteLine(strDecode);
                Console.WriteLine("数据库编码:");
                Console.WriteLine(strEncode);
                Console.WriteLine("C#编码:");
                Console.WriteLine(HttpUtility.UrlEncode(strDecode, Encoding.UTF8));
                Console.WriteLine("C#解码:"); 
                Console.WriteLine(HttpUtility.UrlDecode(strEncode, Encoding.UTF8));
    
                Console.ReadKey();
            }
    
    测试结果:
    image.png image.png

    因为只是满足了我目前的需求,有无隐藏的问题以及效率方面没有去深究,如果有更好的做法或者写法求指点一二。

    相关借鉴链接:
    1、url原理:https://www.jianshu.com/p/8435fac043d6
    2、url中允许哪些符号:https://www.zhihu.com/question/24474922/answer/33358420

    相关文章

      网友评论

          本文标题:2021-01-07 PostgreSQL:UrlEncode函

          本文链接:https://www.haomeiwen.com/subject/grhzoktx.html