爬虫从文章中正则匹配时间日期

爬虫从文章中正则匹配时间日期

作者: sexy_cyber | 来源:发表于2019-07-11 17:54 被阅读0次

爬虫从文章中正则匹配时间日期
2019-05-04派森学习第166天
js正则表达式之爬虫
python BeautifualSoup使用
python爬虫之正则表达
python爬虫系列-2
JS匹配日期和时间的正则表达式示例
php正则匹配日期
三阶段day27-爬虫2
python面试题（三）

        content = 'xxxxxx'
        pattern = re.compile(r'(20\d{2}[_,/,\-,年]\d{1,2}[/,_,\-,月]\d{0,2})(\s{1}\d{2}:\d{2}(:\d{2}){0,1}){0,1}')
        # 拿到文章中提取的时间[('2017-05-08', '', ''), ('2009年10月', '', ''), ('2012年2月', '', ''), ('2012年7月', '', ''), ('2012年10月23', '', '')]
        date_match = re.findall(pattern,content)
        # 将元组转化为字符串
        date_list = []
        for date_tuple in date_match:
            date_list.append(''.join(date_tuple))
        if len(date_list) == 0:
            return None
        elif len(date_list) == 1:
            return date_list[0]
        else:
            # 当列表中时间长度不同时：列表从前往后迭代，两两对比不同的时间的长度，返回最大的
            lastdate = None
            date_str = None
            for i in date_list:
                if lastdate:
                    if i != lastdate:
                        date_str = max([i,lastdate])
                        break
                lastdate = i
            # 如果列表内所有字符串长度相同那么返回index 0
            if not date_str:
                date_str = date_list[0]
            return date_str

相关文章

爬虫从文章中正则匹配时间日期
2019-05-04派森学习第166天
51、正则匹配，匹配日期2018-03-20 仍有同学问正则，其实匹配并不难，提取一段特征语句，用（.*?）匹配即...
js正则表达式之爬虫
前言通过爬虫爬去网页的dom之后就需要用正则来获取相关的信息，下面来说下正则表达式在爬虫中的应用匹配对于Ht...
python BeautifualSoup使用
爬虫过程中解析html 获取关注信息，常用的方法有正则匹配re、xpath、BeautifualSoup，re 正...
python爬虫之正则表达
python爬虫之正则表达概述这部分主要讲的是python中的re模块。最简单的正则表达就是普通字符串的匹配...
python爬虫系列-2
1.系列文章列表 python爬虫系列-1 源码这个爬虫是在第一篇的爬虫的基础上增加了文档正则匹配来获取所有的u...
JS匹配日期和时间的正则表达式示例
本文实例讲述了JS匹配日期和时间的正则表达式。分享给大家供大家参考，具体如下： //日期的正则表达式 varreg...
php正则匹配日期
三阶段day27-爬虫2
爬虫解析库的使用之前爬虫的信息抓取是采用正则表达式匹配抓取，而更常用的匹配方式是使用解析库匹配。目前有两种解析库...
python面试题（三）
1、正则匹配，匹配日期2018-03-20url="https://sycm.taobao.com/bda/tra...

网友评论

本文标题：爬虫从文章中正则匹配时间日期

本文链接：https://www.haomeiwen.com/subject/tdtjkctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|爬虫从文章中正则匹配时间日期|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！