美文网首页
1.爬虫入门_爬取html网页

1.爬虫入门_爬取html网页

作者: 零_WYF | 来源:发表于2018-01-09 10:39 被阅读29次

    1.开发环境python2.7

    2.爬取贴吧页面代码实现

    # -*- coding:utf-8 -*-
    """
        爬取python贴吧网页
    """
    
    # 引入需要的模块
    import urllib2
    
    # python吧第一页的url地址
    url = "http://tieba.baidu.com/f?kw=download_file&ie=utf-8&pn=0 "
    
    # 获取
    response = urllib2.urlopen(url)
    
    # 将获取到的内容赋值给content变量
    content = response.read()
    print content
    
    with open("python_1.html", "w") as f:
        f.write(content)
    
    

    相关文章

      网友评论

          本文标题:1.爬虫入门_爬取html网页

          本文链接:https://www.haomeiwen.com/subject/dqdwnxtx.html