美文网首页学习提升Python
《零基础上手Python爬虫系列》 - 10 正则表达式与JSO

《零基础上手Python爬虫系列》 - 10 正则表达式与JSO

作者: 聂云⻜ | 来源:发表于2020-02-18 16:44 被阅读0次

    本篇目前为视频学习的笔记备注,待更新,本周内会整理完毕

    常规使用

    正则表达式处理01

    数字

    正则表达式是一门专门的语言,规则是通用的

    https://baike.baidu.com/item/%E6%AD%A3%E5%88%99%E8%A1%A8%E8%BE%BE%E5%BC%8F/1700215?fr=aladdin

    概括字符集

    【abc】 a或b或c [a-c] a到c ,[0-9] 0到9

    ^取反

    \d 数字 \D非数字

    \w匹配数字和字母,相当于[A-Za-z0-9_] \W 非单词字符,包括空格

    \s 匹配空白字符,空格 ,换行符\n、制表符\t

    匹配3-6次


    如果3个已经匹配上,就不会再继续匹配,默认是贪婪模式,加?是非贪婪模式


    findall是寻找,4-8位数字

    从字符串的开始到字符串到

    边界匹配


    【】是或关系,()是且关系

    i 忽略大小写

    re.sub 是re.replace的强化

    把函数做为参数传递

    将字符串中的数字> 6的修改成9,<的修改成0


    group获取分组匹配

    group(0) 永远是显示完整的


    常用的正则表达式收集

    https://blog.csdn.net/ZYC88888/article/details/98479629


    轻量:相对xml

    数据交换格式:

    json : json 是一种交换格式

    json字符串 : 符合json格式的字符串就是json字符串

    json对象

    json和javascript

    将json的字符类型,转换为Python的字符类型(反序列化)


    json.dumps

    豆瓣API

    https://www.jianshu.com/p/dffcd060c6d8

    相关文章

      网友评论

        本文标题:《零基础上手Python爬虫系列》 - 10 正则表达式与JSO

        本文链接:https://www.haomeiwen.com/subject/vnogfhtx.html