[Level 3]
![](https://img.haomeiwen.com/i4521795/23cc50fdec982e33.jpg)
Title: re
- One small letter, surrounded by EXACTLY three big bodyguards on each of its sides.
信息不足,同样查看源码,看到一堆字符串,且全是字母。根据提示,想到应该是两组三个大写字母夹着一个小写字母,使用正则表达式匹配求解。找出第一个字母时修改url转到的网页显示yes. but there are more.,需要找出所有符合条件的字母:
import re
pattern = re.compile('[a-z][A-Z]{3}[a-z][A-Z]{3}[a-z]')
target = ''
with open('re.txt',encoding='utf-8') as f:
s = f.read()#.replace('\n','')
match = pattern.search(s)
while(match):
temp = s[match.start():match.end()]
target += temp[4]
s = s[match.end()-1:]
match = pattern.search(s)
print(target)
或直接在源码中读取目标字符串:
import urllib.request
s = urllib.request.urlopen('http://www.pythonchallenge.com/pc/def/equality.html').read().decode('utf-8').replace('\n','')
s = re.findall('<!--(\w*)-->',s)[0]
运行得到linkedlist,修改url网页提示linkedlist.php,即[Level 4]
小结
寻找到匹配的第一个字符后,再从该字符后三个字符(大写字母)继续开始匹配寻找。
-
re.compile(pattern, flags=0)
将正则表达式模式编译成可被match()
和search()
方法调用的对象。 -
regex.search(string[, pos[, endpos]])
扫描string 寻找正则表达式产生匹配后的第一个位置 , 返回对应的 match object。 -
match.start([group])
和match.end([group])
返回由group匹配的子字符串的开头和结尾的索引。 - search() and match()
Python Challenge Wiki
不用re的解法
import string
def level_3(t1):
pad = "xx"
t1 = pad + t1 + pad
markers = "".join([ '1' if c in string.ascii_uppercase else '0' for c in t1])
pattern = "011101110"
def f(res, t2, markers):
n = len(markers.partition(pattern)[0])
return f(res+t2[n+4], t2[n+4:], markers[n+4:]) if n != len(markers) else res
return f('', t1, markers)
这个也挺有趣的:
> ```python
>>> import string
>>> code = data.replace("\n", "")
>>> word =''
>>> for i in range(len(code) - 8):
... if [c for c in code[i:i+9] if c in string.ascii_lowercase] == [code[i], code[i+4], code[i+8]]:
... word += code[i+4]
...
>>> word
'linkedlist'
将大小写字母全部转为1和0达到使用正则表达式的效果。
-
str.partition(sep)
在分隔符首次出现位置拆分成三个子字符串,并返以元组形式返回。未找到返回分隔符本身和两个空字符串组成的元组。
更优雅的使用re
>> import re >> ''.join(re.findall('(?:^|[^A-Z])[A-Z]{3}([a-z])[A-Z]{3}(?:[^A-Z]|$)',text))
1. `(?:...)`在正则中表示匹配的子字符串不能在匹配后提取或在模式中引用。更多语法查看[Regular Expression Syntax](https://docs.python.org/3/library/re.html#regular-expression-syntax)
2. [`re.findall(pattern, string, flags=0)`](https://docs.python.org/3/library/re.html?highlight=findall#re.findall)返回所有非重叠匹配的模式。如果模式中存在一个或多个组,则返回组列表;如果模式中组有嵌套(不知这样理解对不),返回元组的列表。
####[More](http://wiki.pythonchallenge.com/index.php?title=Level3:Main_Page)
网友评论