正则表达式基本使用介绍

作者: zhaolion | 来源:发表于2016-06-02 20:29 被阅读264次

Python爬取招聘网站数据，并可视化展示招聘需求、薪资、招聘人
正则表达式基本使用介绍
字符串
「r<-workshop」第四期：Tidyverse 实战批量建
JAVA进阶篇（13）— 正则表达式的性能优化（正则表达式导致C
Python正则表达式指南
Python入门教程：re模块
正则表达式使用汇总---python篇
R-stringr 处理字符串
正则表达式

正则表达式有两种风格：posix和perl风格，最常用是posix风格的。下面记录的均是posix风格

字符集和类

通配符，可以匹配除换行符（\\n）之外的任意一个字符

.at，可以匹配"cat","sat","mat"等，一般这种通配符用于匹配操作系统中的文件名

限定范围

如果要限定匹配的范围，可以使用[a-z]at形式，任何包括在方括号中的内容都是一个字符类－匹配字符所属的字符集合

可以列出一个集合，[aeiou]，来匹配所有元音字母

也可以描述一个范围，正如前面的连字符，也是一个范围集:[a-zA-Z]，这个集合代表任何的大小字母

也可以指明不属于某个集合，[^a-z]，用来匹配不在小写字母中的字符

重复

如果希望某个字符串或者字符类不止一次出现，可以使用2个特殊字符代替:*和+，这两个符号放在表示式后面

*表示这个模式可以重复0次或多次
+表示这个模式可以重复1次或更多次

c+at，表示可以匹配"cat","ccat","cccat"，但是无法匹配"at"
c*at，表示可以匹配"cat","ccat","cccat"，也可以匹配"at"

子表达式

通常，将一个表达式分为几个子表达式非常有用，使用圆括号来实现。

(very )*large，可以匹配："large","very large","very very large"

子表达式计数

可以在花括号{}中的数字表达式来指定内容允许重复出现的次数。可以指定一个确切的数字，也可以是一个重复次数范围，或是一个开区间的重复范围

(very){1, 2}，可以匹配"very","veryvery"
(very){3}，可以匹配"veryveryvery"
(very)(1,)，可以匹配"very","veryvery","veryveryvery"...

定位到字符串的开始或末尾

脱字符号^用于正则表达式的开始，表示子字符串必须出现被搜索字符串的开始处
字符$，用于正则表达式的末尾，表示子字符串必须出现在字符串的末尾

^bob，用于在字符串开始处匹配bob
com$,用于在字符串末尾处匹配com
^[a-z]$，这个将只能匹配a-z之间的字符组成的字符串

分支

可以使用正则表达式中一条竖线，来表示一个选择
com|edu|net，来匹配"com","net","edu"中任意一个

匹配特殊字符

如果要匹配那些特殊字符，需要使用转义形式，在要匹配的字符前面加一个反斜杠\\

特殊字符主要有：

\: 转义字符
^: 在字符串开始匹配
$: 在字符串末尾匹配
.: 匹配除换行符之外的字符（字符串末尾仅代表.）
|: 选择分支的开始
(: 子模式开始
): 子模式结束
*: 重复0次或多次
+: 重复1次或多次
{: 最小／最大量记号开始
}: 最小／最大量记号结束
?: 标记一个子模式为可选

\\，表示匹配反斜杠\
\\$，表示匹配$

Python爬取招聘网站数据，并可视化展示招聘需求、薪资、招聘人
课程亮点爬虫的基本流程 re正则表达式模块的简单使用 requests模块的使用保存csv 环境介绍 pyth...
正则表达式基本使用介绍
正则表达式有两种风格：posix和perl风格，最常用是posix风格的。下面记录的均是posix风格字符集和类...
字符串
介绍本节内容将介绍在 Python 里处理字符串的基本概念，以及正则表达式的使用，以及介绍几种常见的字符串处理算...
「r<-workshop」第四期：Tidyverse 实战批量建
本次主要介绍了一些基本的正则表达式用法，然后介绍使用 tidyverse 组合拳进行批量建模和可视化。本文代码和...
JAVA进阶篇（13）— 正则表达式的性能优化（正则表达式导致C
1、正则表达式基本使用正则表达式 — 基本语法[https://www.runoob.com/java/java...
Python正则表达式指南
本文介绍了Python对于正则表达式的支持，包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例...
Python入门教程：re模块
上文介绍的是正则表达式本身的语法知识，并未涉及实际使用的方法。本文将介绍在Python语言中如何使用正则表达式。 ...
正则表达式使用汇总---python篇
python 正则表达式上篇文章中介绍了正则表达式使用汇总---javascript篇，本篇文章介绍python...
R-stringr 处理字符串
基本用法正则表达式使用正则表达式的stringr函数 1. 基本用法字符串长度str_length() 字符...
正则表达式
了解正则表达式基本语法能够使用JavaScript的正则对象正则表达式简介什么是正则表达式正则表达式：用于...