在实际爬虫运行过程中,我们不可能时刻都盯着计算机,当爬虫运行过程中遇到异常或者服务器出了问题,我们就需要通过Email即使向自己报告。
发送邮件的协议时SMTP, Python内置对SMTP的支持,可以发送纯文本邮件、HTML邮件以及带附件的邮件。Python对SMTP支持有smtplib和email两个模块,email负责构造邮件,smtplib负责发送邮件。
在发送Email之前,首先申请一个邮箱,开启SMTP功能,我们这里采用的是腾讯的QQ电子邮箱服务,smtp服务器smtp.qq.com
将SMTP开启之后,我们来构造一个纯文本邮件:
from email.mime.text import MIMEText
msg = MIMEText('Python爬虫运行异常,error:HTTP 403', 'plain', 'utf-8')
构造MIMEText对象时需要三个参数:
◈ _text: 邮件正文
◈ _subtype: MIMEText的subtype,缺省值为“plain”表示纯文本,最终的MIME就是“text/plain”
◈ _charset: 设置编码格式,UTF-8编码保证多语言的兼容性。
接着设置邮件的发件人、收件人和邮件主题等信息,并通过SMTP发送出去:
from email.mime.text import MIMEText
from email.header import Header
from email.utils import parseaddr, formataddr
import smtplib
def _format_addr(s):
name, addr = parseaddr(s)
return formataddr((Header(name, 'utf-8').encode(), addr))
# 邮箱
form_addr = 'xxxxx@qq.com'
# 不是邮箱密码,而是开启SMTP服务时的授权码
password = 'pass'
# 收件人的邮箱
to_addr = 'xxxxxxxx@163.com'
# qq邮箱的服务器地址
smpt_server = 'smtp.qq.com'
# 设置邮件信息
msg = MIMEText('Python爬虫运行异常,error:HTTP 403', 'plain', 'utf-8')
msg['From'] = _format_addr('一号爬虫 <%s>' %form_addr)
msg['To'] = _format_addr('管理员 <%s>' %to_addr)
msg['Subject'] = Header('一号爬虫运行状态', charset='utf-8').encode()
# 发送邮件
server = smtplib.SMTP(smpt_server, port=25)
server.set_debuglevel(1)
server.login(form_addr, password)
server.sendmail(form_addr, [to_addr], msg.as_string())
server.quit()
有时候我们发送的可能不是纯文本,需要发送HTML邮件,将异常网页信息发送回去。在构造MIMEText对象的时候,把HTML字符串传进去,再把第二个参数变为“html”就可以了。
msg = MIMEText('<html><head></head><body><h1>Hello</h1></body></html>', 'html', 'utf-8')
网友评论