with open(output_filename, "wb") as f:
f.write(html_request.content)
我用这个方法读写文件时,却报错:IOError: [Errno 2] No such file or directory: './output/http%3A//cup.baidu.com/spider'
我一开始很懵逼,明明这个方法,如果文件不存在的话,会自动创建文件的呀。。。而且,我的一级目录是存在的啊!
后来报着试一试的心态,我把output_filename改成了『http%3Acup.comspide』试了试,然后运行就通过了!
所以,最后定位到,肯定是文件名里的 / 未编码造成的!python会把它当成目录去寻找,那output下一层的目录那必然是不存在了。
于是,我就去看了看 output_filename 的生成,如下
output_filename = os.path.join(output_directory, urllib.quote(html))
这一看,我又开始懵逼了,我明明做编码处理了啊?为啥/没处理的
于是又开始百度,结果发现:urllib.quote(string,safe)这个函数是接收两个字段的,一个是需要编码的url地址,另一个safe是指定某个字符不被编码!然后,重点来了,safe默认赋值是『/』
最后,水落石出,更改如下:
output_filename = os.path.join(output_directory, urllib.quote(html, safe='+/'))
就可以了!
输出就变成了:http%3A%2F%2Fcup.com%2Fspider
网友评论