美文网首页
第一章 正则表达式

第一章 正则表达式

作者: 乐大爷L | 来源:发表于2019-05-12 23:41 被阅读0次

正则表达式的核心在于规则。
在编写规则时,正则表达式提供了很多元字符,需要分析业务规则去考虑需要用到的元字符(太多了,不要去背啦)。
参考菜鸟教程:https://www.runoob.com/regexp/regexp-metachar.html

第1题

1- 1 识别后续的字符串:“ bat”、“ bit”、“ but”、“ hat”、“ hit” 或者“ hut”。

分析:以b或h开头,中间为a或i或u,以t结尾,长度为3.
随机生成100个单词,匹配输出符合规则的单词。

import re, random

def word_list(letter_list, length, num):
    '''
    生成指定字母生成的单词集。从letter_list中取length次生成一个单词。
    :param letter_list: 指定的字母集
    :param length: 单词长度
    :param num: 单词数量
    :return: 单词集
    '''
    words = []
    while num > 0:
        num -= 1
        word = random.sample(letter_list, length)
        words.append(''.join(word))
    return words

a = word_list(['h', 'u', 'i', 'a', 'm', 'b', 't'], 3, 100)
r = re.findall('[bh][aiu]t', ','.join(a))
print(r)
>['hit', 'bat', 'hat', 'hat']

第2题

1- 2 匹配由单个空格分隔的任意单词对, 也就是姓和名。

分析:姓和名都应该以大写字母开头,且名字中只能包含字母。

import re, random
def name_list(surname_list, given_name_list, num):
    '''
    每次从surname和given_name中随机选取一个字符串,生成一组姓名组合,以空格分隔姓和名
    random.choice(列表)可以实现随机选取
    :param surname_list: 姓的列表
    :param given_name_list: 名的列表
    :param num: name_list的长度
    :return: 姓名列表
    '''
    names = []
    while num > 0:
        num -= 1
        name = random.choice(surname_list) + ' ' + random.choice(given_name_list)
        names.append(name)
    return names

a = name_list(['Hark', 'Ivens', 'Johnson', '889Jak'], ['Ross', 'Julie', 'Gloria', 'Carol'], 5)
print(a)
for i in a:
    patt = re.findall(r'^[A-Z][a-z]+\s[A-Z][a-z]+$', i)
    if len(patt) != 0:
        print(patt)
>结果:
['889Jak Gloria', 'Hark Gloria', 'Ivens Gloria', '889Jak Carol', 'Johnson Julie']
['Hark Gloria']
['Ivens Gloria']
['Johnson Julie']

第3题

1- 3 匹配由单个逗号和单个空白符分隔的任何单词和单个字母,如姓氏的
首字母。

分析:如:“Tom, a, Yaml, dance, B, 11, c”.根据我对题目的理解,应该输出Tom, a 和 dance, B。

import re

a = 'Tom, a, 11, r, dance, B, sing, cc'
r = re.findall('[a-z]{2,},\s[a-z]', a, re.I)
print(r)
结果:事实上这个结果并不满足我理解的题意,但是目前搞不定
['Tom, a', 'dance, B', 'sing, c']

第4题

1- 4 匹配所有有效 Python 标识符的集合。

分析:标识符不能与关键字同名,由下划线、字母、数字组成,必须以下划线或字母开头。
如:__init、a_b、test1等为有效标识符
11_a为无效标识符
知识点说明:\w在不加re.A时可以匹配出中文,是因为python3支持的是Unicode字符集。加re.A可以仅支持中文。

import re
import keyword

a = ['11_a', 'in', 'as', 'import','__flag__', '__fl#ag__', 'd', '123', '1_b', '__a字母a', '_1_a', '_1_a_#']
# 判断字符串是否与关键字同名
b = [flag for flag in a if flag not in keyword.kwlist]
r = [re.findall('^[a-z_]\w*$', flag, re.I | re.A) for flag in b]
print(r)
g = filter(lambda x: len(x) != 0, r)
print(list(g))
结果:
[[], ['__flag__'], [], ['d'], [], [], [], ['_1_a'], []]
[['__flag__'], ['d'], ['_1_a']]

第5题

1- 5 根据读者当地的格式,匹配街道地址(使你的正则表达式足够通用,来匹配任意数量的街道单词,包括类型名称)。例如,美国街道地址使用如下格式:1180 Bordeaux Drive。使你的正则表达式足够灵活,以支持多单词的街道名称,如3120 De la Cruz Boulevard。

分析:匹配每个地址是否是街道地址,街道地址以4位数字开头,多个单词组成,每组单词之间由空格隔开。

相关文章

  • JavaScript正则表达式

    JavaScript 正则表达式 @(笔记)[正则表达式] 第一章 课程简介 1-1 JS正则表达式简介及应用 课...

  • 正则表达式(1)

    本博客来自精通正则表达式第三版 第一章:正则表达式入门(Introduction to regex) 正则表达式概...

  • 一个程序员的自我学习第一天

    《正则表达式必知必会》笔记 第一章:正则表达式入门 1:正则表达式是一些用来匹配和处理文本的字符串。正则...

  • 正则基本知识

    正则表达式 第一章:基本概念 概念: 正则表达式(regular expression)是一个描述字符模式的对象,...

  • js正则表达式教程(一)

    目录 第一章 正则表达式字符匹配攻略 第二章 正则表达式位置匹配攻略 第三章 正则表达式括号的作用 第四章 正则表...

  • 第一章 正则表达式字符匹配攻略

    第一章 正则表达式字符匹配攻略 正则表达式是匹配模式,要么匹配字符,要么匹配位置。请记住这句话。 然而关于正则如何...

  • 读《精通正则表达式》

    todo:提取要点,梳理结构图 第一章 1. ^脱字符 2. 正则表达式结构体(字符组)即=> [ ],只有在字符...

  • Linux命令行与Shell脚本编程大全-shell正则表达式

    本章内容: 定义正则表达式 了解基本正则表达式 扩展正则表达式 创建正则表达式 定义正则表达式 正则表达式是你定义...

  • 正则相关

    正则表达式基本语法 正则表达式常见字符 正则表达式特殊字符 正则表达式数量词 正则表达式边界匹配 正则表达式逻辑或...

  • 正则表达式系列-1

    正则表达式系列-1正则表达式系列-2正则表达式系列-3正则表达式系列-4 什么是正则表达式 正则表达式就是用事先定...

网友评论

      本文标题:第一章 正则表达式

      本文链接:https://www.haomeiwen.com/subject/oyxcaqtx.html