格式转换问题是处理文件的难点之一,下面我们来介绍一个最优解决方案
关键代码
- 无论什么格式都先读取进来
f=open(filename,"rb")
- 解码gbk
d=c.decode('gbk',errors="ignore")
完成demo源码
filename="1116.html"
#读取文件
f=open(filename,"rb")
c=f.read()
# 格式转码
d=c.decode('gbk',errors="ignore")
#解析
import re
def getSearch(mstr,d):
v=''
m=re.search(mstr,d,re.I)
if m:v=m.group(1)
return v
#d="<li >拼 音:bìng</li>"
mstr=r"拼 音:(.*?)<"
pinyin=getSearch(mstr,d).strip()
更多精彩代码请关注我的专栏
关键词
程序员 方向 云计算 前途 微信 毕设 学霸 能量
网友评论