美文网首页
正则式学习小结

正则式学习小结

作者: vansnowpea | 来源:发表于2016-09-11 19:10 被阅读19次

title: 正则式学习小结
date: 2016-09-11 10:59:28
tags:


说明:以下内容学习自:http://www.imooc.com/

由于这个视频教程已经说的比较详细,请参考原视频教程,这里为总结

1、简介:为何需要正则表达式,为了减少根据不同需求不断编制函数的麻烦,通过制定正则式规则,可以巧妙且有效的进行归纳总结。

2、Python的RE模块,RE是正则表达式的英文首字母缩写。最常用的就是re.match()函数了,其次是ma.group(),用来查阅匹配结果。

3、【重点】RE的语法:

4、 RE其他模块:

  • search(pattern, string, flags=0) 用来查找满足pattern的第一个返回值。
  • findall(pattern, string, flags=0)用来查找满足pattern的所有返回值。
  • sub(pattern, repl, string, count=0, flags=0)将字符串中匹配正则表达式的部分替代为其他值,并允许引入函数模式来进行替代。
  • split(pattern, string, maxsplit=0, flags=0)根据匹配分割字符串,返回分割字符串组成的列表。

5、练习,抓取慕课网的http://www.imooc.com/course/list的图片。主要流程为:

  1. 抓取网页,
  2. 获取图片地址,
  3. 抓去图片内容并保存到本地,

结果如下:


6、源代码:

import re
import urllib2

test_url = 'http://www.imooc.com/course/list'
req = urllib2.urlopen(test_url)
buf = req.read()
print buf

listurl = re.findall(r'http:.+\.jpg', buf)
print listurl

i = 0
for url in listurl:
    f = open(str(i)+'.jpg', 'w')
    req = urllib2.urlopen(url)
    buf = req.read()
    f.write(buf)
    i += 1

7、PS,再一次的,发现在Win下的结果出现乱码,而且抓的图片也是,而在Linux下是正常的。得找下原因。

相关文章

  • 正则式学习小结

    title: 正则式学习小结date: 2016-09-11 10:59:28tags: 说明:以下内容学习自:h...

  • 2018-06-02

    深度学习分布式训练在KubernetesDocker实践小结

  • 2018-04-13

    Java学习随笔 ——正则表示式 正则表达式初级版 在使用正则表达式之前,需要import java.util.r...

  • 正则表达式在程序编码中的应用

    正则表达式在程序编码中的应用 正则表达式(括号)、[中括号]、{大括号}的区别小结 正则表达式的() [] {}有...

  • 前端正则表达式基本语法

    正则表示式在线测试工具网站,并以图例的方式呈现正则表达式:regexper.com本文章内容通过学习Samarit...

  • 正则表达式写法分享

    正则写法小结 最近经常遇到用到正则表达式的情况,总结了一些写正则的经验: 以此场景为例: 需要字符串以部分非特殊...

  • 《Oracle Java SE编程指南》28-01:秒懂正则表达

    内容导航: 前言 1、词式1.1、AABB式1.2、ABAC式 2、正则表达式 前言 正则表达式,其实我们早就在小...

  • NSRegularExpression使用

    使用正则式匹配NSRegularExpression 其他

  • 正则几点小结

    要想理解正则就必须要认识几个好朋友,他们是元字符。有了元字符正则才可以按照自己想要的格式,类型去匹配,去查找出来!...

  • Linux学习--No.13正则表达式

    上一节提到根据文本模式进行sed编辑匹配行文本时,往往搭配正则匹配式进行高效检索、编辑。这一次来专门学习下正则表达...

网友评论

      本文标题:正则式学习小结

      本文链接:https://www.haomeiwen.com/subject/yiwuettx.html