作业1

作者: xilixjd | 来源:发表于2016-05-21 22:07 被阅读0次

frombs4importBeautifulSoup

importrequests

importtime

url='http://bj.58.com/pingbandiannao/25936435448255x.shtml?psid=110197818191709710732024550&entinfo=25936435448255_0&iuType=p_0'

defget_58_goods_page(url):

wb_data=requests.get(url)

soup=BeautifulSoup(wb_data.text,'lxml')

cates=soup.find_all('a',href='http://bj.58.com/pbdn/')

#print(cates[0].get_text())

titles=soup.select('div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.mainTitle > h1')

#print(titles[0].get_text())

times=soup.select('ul.mtit_con_left.fl > li.time')

# print(times[0].get_text())

prices=soup.select('div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.sumary > ul > li > div.su_con > span')

# print(prices[0].get_text()+'元')

locations=soup.select(' div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.sumary > ul > li > div.su_con > span > a')

# print(locations[0].get_text(),'-',locations[1].get_text())

iflen(locations)==2:

location1=locations[0].get_text() +'-'+ locations[1].get_text()

eliflen(locations)==1:

location1=locations[0].get_text()

forcate,title,time,price,locationinzip(cates,titles,times,prices,locations):

data={

'cate':cate.get_text(),

'title':title.get_text(),

'time':time.get_text(),

'price':price.get_text()+'元',

'location':location1,

'url':url

}

print(data)

# get_58_goods_page(url)

url2='http://bj.58.com/pbdn/0/pn'

defget_58_index_page(url):

page2=[]

wb_data=requests.get(url)

soup=BeautifulSoup(wb_data.text,'lxml')

# page=soup.find_all(class_='t')

pages=soup.select('a.t')

forpageinpages:

page1=page.get('href')

if'entinfo'inpage1and'zhineng'not inpage1and'jing'not inpage1:

page2.append(page1)

returnpage2

defnumber_of_url(start,end,url):

fornuminrange(start,end+1):

page=url+str(num)

page2=get_58_index_page(page)

forpage3inpage2:

time.sleep(2)

get_58_goods_page(page3)

number_of_url(1,2,url2)

相关文章

  • 作业1

  • 作业1

  • 作业1

    首先感谢各位老师的辛勤付出,谢谢你们,辛苦了!3天的康复理疗课程收获满满,让我对精油的化学成份,科学层面有了更深入...

  • 作业1

    问题1 请设计一个算法,要求该算法把二叉树的叶子结点按从左到右的顺序连成一个单链表,表头指针为head。二叉树按二...

  • 作业1

    假如你有一个15岁的孩子,有一天晚上吃饭时,他对你说:“我感觉学习一点意思都没有,老师教的东西一点用处都没有。我将...

  • 作业1

  • 作业1

    一、1.什么是HTML5万维网的核心语言、标准通用标记语言下的一个应用超文本标记语言(HTML)的第五次重大修改。...

  • 作业1

    1. 登录界面的效果图 2. 登录界面实现的功能描述 不同身份人员登陆,显示不同功能和信息 3. 登录界面各控件的...

  • 作业1

  • 作业1

    #代码 using System; using System.Collections.Generic; using...

网友评论

      本文标题:作业1

      本文链接:https://www.haomeiwen.com/subject/ngdorttx.html