美文网首页
下载词典列表地址

下载词典列表地址

作者: 风清莎莎声 | 来源:发表于2015-08-01 02:07 被阅读0次

简化不必要的细节,现实版的实践?自觉的优化代码o()o

# -*- coding: utf-8 -*-
#导入re模块
import re
import urllib.request
from bs4 import BeautifulSoup

#部首列表正则表达式
bspattern = re.compile(r"(?:%[^%']{2}){3}")
cipattern = re.compile(r"/c/[^']*?htm")
#1获取部首列表页面
req1 = urllib.request.Request('http://www.zdic.net/c/cibs/')
response1 = urllib.request.urlopen(req1)
index_page1 = response1.read()
#分析得到部首列表
#先试试直接正则表达式提取部首列表
index_page1 = index_page1.decode('utf8')
bslist = re.findall(bspattern, index_page1)

#1获取词列表      部首列表页面
for bu in bslist:
    print(bu)
    bu = "http://www.zdic.net/c/cibs/bs/?bs=" + b
    reqb = urllib.request.Request(bu)
    reqb.add_header('Referer', 'http://www.zdic.net/c/cibs/')
    responseb = urllib.request.urlopen(reqb)
    index_z = responseb.read()
#分析得到字列表
    index_z = index_z.decode('utf8')
    zlist = re.findall(bspattern, index_z)
#部首列表地址
    for z in zlist:
        if len(z) != 0:           
            z = "http://www.zdic.net/c/cibs/ci/?z=" + z
            print(z)
            reqz = urllib.request.Request(z)
            reqz.add_header('Referer', 'http://www.zdic.net/c/cibs/')
            responseb = urllib.request.urlopen(reqz)
            index_c = responseb.read()
        #分析得到字列表
            index_c = index_c.decode('utf8')        
            clist = re.findall(r"/z/[^']*?\.htm", index_c)
            #转化为字地址列表
            for uc in clist:
                line = "http://www.zdic.net/" + uc
                outfile.write(line+'\n')#参数不能为叠加器
outfile.close()


相关文章

  • 下载词典列表地址

    简化不必要的细节,现实版的实践?自觉的优化代码o(▽)o

  • Mac 词典的扩充

    Mac 词典 扩充使用 先下载词典文件 词典下载链接 打开词典.app 打开词典文件夹,该目录为存放词典的目录 进...

  • centos7.6搭建LNMP

    软件列表 centos7.6最小化安装,php7.3.2 php 官网下载地址centos 官网下载地址nginx...

  • xmind总结

    一、安装 1.1 下载地址 百度搜索:xmind 点击下载链接: 无序列表1sdfsdfsdf 无序列表2 1.2...

  • 视频+代码+课件:基于MEAN全栈架构的多用户博客系统(Angu

    一、源课件列表: 二、源代码列表: 三、视频教程列表: 上述资源下载地址: 视频+课件+代码:基于MEAN全栈架构...

  • python爬取王者荣耀全皮肤,漫客的福利!

    先明确思路: 寻找皮肤图片地址 1 找到英雄列表 2 找到英雄皮肤地址 下载图片 1 英雄有几个皮肤 2 下载文件...

  • 我的欧路词典

    下述词典文件下载链接 视频教程 词典导入方法: 第一步:下载欧路词典app 第二步:将下载好的词典文件(夹)放在手...

  • 英阅浏览器APP_Android_畅读英文文章

    v1.0.1 更新日志 2019/11/05 新增导出词汇列表为Excel、欧路词典格式 新增词典查询,词汇列表长...

  • 常用python组件包

    基于python3.6安装的组件包列表 Python Windows Binaries 库下载地址 Unoffic...

  • BSMenu

    BSMenu 根据控件位置弹出的选择列表 使用方法 预览 下载地址 传送门

网友评论

      本文标题:下载词典列表地址

      本文链接:https://www.haomeiwen.com/subject/cecvqttx.html