Python作为人工智能的开发语言,也是很多人学习的方向,小猿圈Python讲师每天分享一个Python知识点,希望帮助那些正在学习Python的学员们,今天分享的是如何判断jpeg图片完整性示例。
用扩展名判断文件格式非常简单,但是有可能是错误的。jpeg文件有固定的文件头,其文件头的格式如下:
Start Marker | JFIF Marker | Header Length | Identifier
0xff, 0xd8 | 0xff, 0xe0 | 2-bytes | "JFIF\0"
所以可以通过文件头的方式快速判断文件格式:
def is_jpg(filename):
data = open(filename,'rb').read(11)
if data[:4] != '\xff\xd8\xff\xe0' and data[:4]!='\xff\xd8\xff\xe1':
return False
if data[6:] != 'JFIF\0' and data[6:] != 'Exif\0':
return False
return True
也可以通过PIL类库来做判断:
from PIL import Image
def is_jpg(filename):
try:
i=Image.open(filename)
return i.format =='JPEG'
except IOError:
return Fals
应用场景:判断image文件夹中的jpeg文件是否完整,代码如下:
#coding=utf-8
#summary: 判断图片的有效性
import io
import os
from PIL import Image
#判断文件是否为有效(完整)的图片
#输入参数为文件路径
#会出现漏检的情况
def IsValidImage(pathfile):
bValid = True
try:
Image.open(pathfile).verify()
except:
bValid = False
return bValid
def is_valid_jpg(jpg_file):
"""判断JPG文件下载是否完整
"""
if jpg_file.split('.')[-1].lower() == 'jpg':
with open(jpg_file, 'rb') as f:
f.seek(-2, 2)
return f.read() == '\xff\xd9' #判定jpg是否包含结束字段
else:
return True
#利用PIL库进行jpeg格式判定,但有些没有结束字段的文件检测不出来
def is_jpg(filename):
try:
i=Image.open(filename)
return i.format =='JPEG'
except IOError:
return False
allfiles=os.listdir('image')
log_file=open('img_lossinfo.txt','w')
log = open('img_r.txt','w')
log_w=open('img_w.txt','w')
log1=open('img_jpeg.txt','w')
log2=open('img_notjpg.txt','w')
for i in allfiles:
#if 1:
if i[-4:]=='.jpg':
f=os.path.join('image',i)
value=IsValidImage(f)
if not value:
log_file.write(i+'\n')
if is_valid_jpg(f):
print f
log.write(i+'\n')
else:
log_w.write(i+'\n')
if is_jpg(f):
log1.write(i+'\n')
else:
log2.write(i+'\n')
以上就是关于小猿圈Python开发如何判断jpeg图片完整性示例的全部内容,希望能给大家一个参考小猿圈python学习交流群:242719133,最后想要了解更多关于Python和人工智能方面内容的小伙伴,可以关注小猿圈每天的动态,会不定期的为大家更新知识。
网友评论