Python 练习册 0007、0008题（网页分析）

作者: 海上牧云l | 来源:发表于2017-04-24 21:04 被阅读24次

Python 练习册 0007、0008题（网页分析）
Python 练习册 0007题（统计代码）
1000个日思录（第3天）
PEP 8 -- Style Guide for Python
Python代码风格
Python 调用 R
第1.3题：将 200 个激活码保存到 MySQL
第1.2题：使用 Python 如何生成 200 个激活码
C语言编程 C Language Programming - 0
Python编码规范

第 0008 题：一个HTML文件，找出里面的正文。

第 0009 题：一个HTML文件，找出里面的链接。

import requests
from bs4 import BeautifulSoup


def get_content(page_url):
    web_data = requests.get(page_url)
    soup = BeautifulSoup(web_data.content, 'lxml')
    contents = soup.select('div.show-content')

    result = ''
    for content in contents:
        result += content.get_text()
    print(result)
    return result


def get_href(page_url):
    web_data = requests.get(page_url)
    soup = BeautifulSoup(web_data.content, 'lxml')
    a_tags = soup.find_all('a')

    href_list = []
    for a_tag in a_tags:
        href = a_tag.get('href')
        if href:
            print(a_tag.get('href'))
            href_list.append(href)
    print(href_list)
    return href_list


page_url = 'http://www.jianshu.com/p/40fc848414ea'
get_href(page_url=page_url)

网友评论

本文标题：Python 练习册 0007、0008题（网页分析）

本文链接：https://www.haomeiwen.com/subject/ckujzttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python 练习册 0007、0008题（网页分析）

相关文章

Python 练习册 0007、0008题（网页分析）

Python 练习册 0007题（统计代码）

1000个日思录（第3天）

PEP 8 -- Style Guide for Python

Python代码风格

Python 调用 R

第1.3题：将 200 个激活码保存到 MySQL

第1.2题：使用 Python 如何生成 200 个激活码

C语言编程 C Language Programming - 0

Python编码规范

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Python 练习册 0007、0008题 （网页分析）

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

Python 练习册 0007、0008题（网页分析）