美文网首页
W1-2作业

W1-2作业

作者: 四六级圣斗士 | 来源:发表于2016-06-26 20:00 被阅读0次
from bs4 import BeautifulSoup

dic = {}
info = []

with open('./1_2_homework_required/index.html', 'r') as wb_data:
    soup = BeautifulSoup(wb_data, 'lxml')

    '''
    body > div:nth-child(2) > div > div.col-md-9 > div:nth-child(2) > div:nth-child(1) > div > img
    body > div:nth-child(2) > div > div.col-md-9 > div:nth-child(2) > div:nth-child(1) > div > div.caption > h4:nth-child(2) > a
    body > div:nth-child(2) > div > div.col-md-9 > div:nth-child(2) > div:nth-child(1) > div > div.caption > h4.pull-right
    body > div:nth-child(2) > div > div.col-md-9 > div:nth-child(2) > div:nth-child(1) > div > div.caption > p
    body > div:nth-child(2) > div > div.col-md-9 > div:nth-child(2) > div:nth-child(1) > div > div.ratings > p:nth-child(2) > span:nth-child(1)
    body > div:nth-child(2) > div > div.col-md-9 > div:nth-child(2) > div:nth-child(1) > div > div.ratings > p.pull-right
    '''

    images = soup.select('body > div > div > div.col-md-9 > div > div > div > img')
    #print images
    #images1 = soup.select('body > div.container > div.row > div.col-md-9 > div.row > div.col-sm-4.col-lg-4.col-md-4 > div.thumbnail > img')
    #print images1
    titles = soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4 > a')
    prices = soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > h4.pull-right')
    #details = soup.select('body > div > div > div.col-md-9 > div > div > div > div.caption > p')
    score_counts = soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p.pull-right')
    stars = soup.select('body > div > div > div.col-md-9 > div > div > div > div.ratings > p:nth-of-type(2)')

    #for image, title, price, detail, star, score_count in zip(images, titles, prices, details, stars, score_counts):
    for image, title, price, star, score_count in zip(images, titles, prices, stars, score_counts):
        dic = {
            'image':image.get('src'),
            'title':title.get_text(),
            'price':price.get_text(),
            #'detail':detail.get_text(),
            'star':len(star.find_all(class_='glyphicon glyphicon-star')),
            'score_count':score_count.get_text()
        }
        info.append(dic)

wb_data.close()

print info

总结

  • 相对于css path,用html结构层级更适合我
  • soup.select( )出来的是bs4.element.Tag类型,可使用soup对象的方法

相关文章

  • W1-2作业

    总结 相对于css path,用html结构层级更适合我 soup.select( )出来的是bs4.elemen...

  • 任星作业W1-2

  • W1-2

    因为自己太水了无耻地把前两周合并了,而且还在第三周周一的晚上补,简直不能更羞耻。 虽然每天都还是记了一些东西,想了...

  • W1-2月13日-便签作业2

    目标:在一个月内,杜绝在吃饭时间刷今日头条视频,把更多的时间花在工作、读书或其它事情。 行动计划和步骤: 1、确定...

  • 第四期培训班W1-2

    【本周作业2】 [主题]:如何描绘出故事的细节(如何写好A1) [片段来源]:拆解片段来自《故事思维》 P.128...

  • 今天先不更

    补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业补作业...

  • 作业作业作业

    出外听课两天,小必的学习没过问。 早晨,小必的数学作业没完成,很多没完成:优化设计,数学书,小灵通,都没完成。 中...

  • 作业作业作业

    头疼的厉害,太阳穴绷得紧紧的。躺了一个多小时了,也不见好转。每当这个时候,一场大觉就能让我彻底放松。可是心不静,怎...

  • 作业作业作业

    1,我的作业 写好了文章,倒也没发的欲望,这是我的作业,作业。 只是想着把一切都准备好,明天再发。听说发文很多O推...

  • 作业作业作业

    @所有人 各位家长:学生对待作业的态度就是对待学习的态度。态度决定一切!老师们在检查作业过程中发现有不写的、有偷工...

网友评论

      本文标题:W1-2作业

      本文链接:https://www.haomeiwen.com/subject/nsqzdttx.html