美文网首页
使用正则表达式匹配时间格式字符串的小心得

使用正则表达式匹配时间格式字符串的小心得

作者: 愿你如夏日清凉的风 | 来源:发表于2019-04-10 12:21 被阅读0次

    在写接口的时候遇到一个这样的问题,我调用的 MAPI 接口返回给我一个这样的时间格式:

    "/Date(1546012800000+0800)/",而我需要把它转化成这种格式:2019-05-23 12:34:22(北京时间),并作为入参传给另一个 MAPI 接口。

    第一时间想到的解决办法就是看看框架中是否带有这种时间戳处理的功能,发 现大多是直接处理时间戳的,像这种:1554362965,所以需要把得到的时间格 式进行处理一下:
    首先括号及括号两边的字符是不需要的,另外,+0800 是时区差,表示北京时 间,所以+0800 也可以不需要。要取出 1546012800000 至少有两种方式,第一 种就是正则表达式,第二种就是字符串截取函数 slice()、substring()、substr()。

    首先说正则表达式,因为格式是不变的,我们就只要抓住它的不变点和变点,这个时间格式中,只有 1546012800000 是变的,所以第一个可用的正则表达式 可以这样写:

    结果验证01.png

    解释一下这个正则表达式:
    第一个字符“/”是正则表达式的开始,第二个字符“\”是转义符,因为字符串中带 有“/”,属于元字符,所以我们需要用转义符转义一下,/Date 是字符串中的内 容,因为格式不变,这个地方可以直接匹配。然后又出现了“\”,因为后面的
    “ (”也是属于元字符,因此我们还是需要“\”转义符,之后的( ) 就是分组,\d 表 示数字,*表示数字在文本中出现零次或连续多次,+号表示以+号结尾,最后 以“/”结束整个正则表达式。

    match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹 配,返回指定的值,存放匹配结果的数组。

    这个方法很大程度上有赖于你所写 的正则表达式是否包含 g,如果没有 g,那么 match() 方法就只能在 str 中执行 一次匹配。如果没有找到任何匹配的文本,match() 将返回 null。否则,它将 返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个 元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配 的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。 index 属性声明的是匹配文本的起始字符在 str 中的位置,input 属性存放的是 你要匹配的文本。如果有 g,则 match() 方法会全局检索,找到 str 中所有匹配 的子字符串,全局匹配到子串时返回的数组中没有 index 属性或 input 属性。 上面的正则表达式还可以这样写,结果也是一样的。

    结果验证02.png

    直接从 Date 开始匹配,正则表达式就更简短了。

    上面提到写正则表达式就是要抓住文本中的不变点和变点,所以它抓住的不变 点在: /Date( 和 +,而如果不变点在这里: ( 和 +,那么我们的正则表达 式就应该这么写了:

    结果验证03.png

    对于上面这个正则,其他的不用多解释,\w 和+号可以说一说。
    \w 用来匹配字母、数字和下划线,而后面的+号表示在文本中连续出现一次或 多次。这个正则中的第三个+号是文本中的+号,由于+号是元字符,所以我们 需要用“\”进行转义一下。 另外再说一个分组的问题,如果上面的字符串我们要把+0800 也匹配进来,可 以在正则表达式中多加一对括号,像下面这样:

    结果验证04.png

    第一个正则表达式我们只匹配到了 1546012800000,因为它只能识别 /Date(xxx,上面这个正则表达式还可以识别/Dyzc(,例如:

    结果验证05.png

    简单说一下元字符:

    元字符:有特殊含义,以至于不能表示原本意义的字符。 除了正则表达式,HTML、XML、URL,到处都有元字符,并且他们的元字符 还不一定一样。
    HTML:
    空格( )不表示空格, 只能用   来表示空格。
    大于号(>)不能表示大于号,只能用 < 来表示大于号
    URL 中,例如:https://www.baidu.com/?search=x%20y
    这个 URL 中的%20 其实是个空格。 因为 URL 规定里面只能包含很少的几十种 字符,其中空格就是被禁用的,不能包含空格,那不能包含空格而用户的确需 要表示空格,怎么办呢?
    用另外的东西代表空格,在 URL 中,就是%20
    因此
    https://www.baidu.com/?search=x%20y
    等于
    https://www.baidu.com/?search=x y
    但是下面这个 url 是不合法,所以要被「转义」为上面这个。
    url 或者 cookie 中一般一大堆%数字 1、%数字 2 的,全是%开头的,这都是套 路。
    正则表达式中可以用/来把元字符转义成他本来的意思,
    / => / ( => ( + => +
    HTML 中是以为&开头,;结尾的。
    URL 中是以%开头。
    正则表达式是以/开头,/结尾的。

    不同的语言有不同的规定,因为设计他们时,可用字符是不一样的。

    终于说完了正则表达式,下面来说说第二种获取"/Date(1546012800000+0800)/" 中 1546012800000 的方法,个人觉得用字符串截取函数来获取也同样是要抓住
    不变点和变点,只有抓住这两个,就很好解决这个问题了。因为返回的时间格 式是固定的,所以我们可以从/开始数,第 6 个(index=6)开始,然后以+号结 束,拿到的刚好是 1546012800000,下面我借助一下 indexOf 来获取到+号的位置:

    结果验证06.png

    indexOf() 方法可返回某个指定的字符串值在字符串中首次出现的位置。第一个 参数是必须的,就是要检索的字符串值,它还可以传入第二个参数,必须是个 整数,从 0 开始,表示从字符串中开始检索的位置,比如说你想从第 6 个字符 开始检索,就可以传 5,最大的取值就是 str.length-1。如果省略就是从首字符开 始检索。

    再说一下 substr()函数: substr()方法返回从指定位置开始的字符串中指定字符数的字符,第一个参数是 指定开始的位置,第二个参数是截取的长度。 这里的第二个参数长度就是用+号的位置减去前面不需要的 6 个字符,得到的就 是我们真正要的时间戳。

    结果验证07.png 结果验证08.png

    而 slice()、substring()就更更简单了了。

    结果验证09.png

    slice()和 substring()方法都是返回一个索引和另一个索引之间的字符串。所以这 里只需要传+号的位置就行,而且这两个文法第二个参数都不包含该索引位置的
    字符。具体可以参考下面这篇文章。
    https://juejin.im/post/59e2af3151882578cf573319
    拿到时间戳之后就可以直接用框架中的工具,把 1558281600000 转换成 2019-5- 20 0:0:0。

    相关文章

      网友评论

          本文标题:使用正则表达式匹配时间格式字符串的小心得

          本文链接:https://www.haomeiwen.com/subject/lmlniqtx.html