urllib.request.urlretrieve进度提示

作者: 梦归游子意 | 来源:发表于2016-12-28 10:50 被阅读0次

urllib.request.urlretrieve进度提示
Python实战计划学习笔记1.4：爬取http://wehea
LayUI上传附件进度条+TinyMCE富文本上传视频进度条的实
任务进度提示如何触发学习动机
Python实战计划学习笔记（6）爬取图片
笔记更新进度提示
MBProgressHUD——iOS进度提示控件
05存储数据
Day_2
tqdm

维基百科词条提取WikiExtractor.py

python WikiExtractor.py anwiki-20161220-pages-articles-multistream.xml -o extracted
后台运行，并默认记录日志

nohup python WikiExtractor.py anwiki-20161220-pages-articles-multistream.xml -o extracted &  
# nohup   ---no hang up

后台运行，并记录日志到指定文件file（标准输出）

nohup python WikiExtractor.py anwiki-20161220-pages-articles-multistream.xml -o extracted >file &

chmod -R a+w AA/
# -R 循环

重定向和输入输出

http://www.jianshu.com/p/79579843e579

urllib.request.urlretrieve进度提示

from xinyilangs import xinyi_langs
from urllib.request import urlretrieve
import os

url = 'https://dumps.wikimedia.org/backup-index.html'
langs = xinyi_langs
file_list = ['https://dumps.wikimedia.org/{}/20161220/{}-20161220-pages-articles-multistream.xml.bz2'.format(lang, lang) for lang in langs]
def cbk(a, b, c):    
  '''回调函数        
    @a: 已经下载的数据块        
    @b: 数据块的大小        
    @c: 远程文件的大小    
  '''    
  per = 100.0 * a * b / c    
  if per > 100:        
    per = 100    
  print('%.1f%% of %.2fM' % (per,c/(1024*1024)))

dir = os.path.join(os.getcwd(), 'xml_bz2')
os.mkdir(dir)
for lang,file in zip(langs,file_list):    
  file_name = os.path.join(dir, '{}.xml.bz2'.format(lang))