1.3

作者: tomgulu高 | 来源:发表于2016-05-22 07:39 被阅读10次

*#coder:samko date:5.20 10:05#一个详情页爬取

c = ['female','male']url = 'http://bj.xiaozhu.com/fangzi/1779571235.html'page = requests.get(url)
soup = BeautifulSoup(page.text,'lxml')title = soup.select('h4 > em')
address = soup.select('span.pr5')
img = soup.select('img[id="curBigImage"]')
dailyrent = soup.select('div.day_l > span')
landlordimg = soup.select('div.member_pic > a > img')
landlordname = soup.select('h6 > a[class="lorder_name"]')
landlordgender = soup.select('div.w_240 > h6 > span')print(img)
for i,j,k,l,m,n,o in zip(title,address,img,dailyrent,landlordgender,landlordimg,landlordname):    def gender():        if  'member_girl_ico' in m:            return c[0]        else:            return c[1]    data = {        'title':i.get_text(),        'address':j.get_text(),        'img':k.get('src'),        'rent':l.get_text()+'元',        'lordimg':n.get('src'),        'lordname':o.get_text(),        'gender':gender()    }    print(data)#多个详情页爬取:如何批量获取链接from bs4 import BeautifulSoupimport requests,re,urllib.requestlinks = []#url = 'http://bj.xiaozhu.com'def get_page(PageNumbers):    for page in  range(2,PageNumbers):# 每页24个链接,这里输入的是页码        full_url = 'http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(str(page))        wb_data = requests.get(full_url)#不用在一个大页面下将每一个小的页面都打开分析        soup = BeautifulSoup(wb_data.text,'lxml')        for link in soup.select('a.resule_img_a'): # 找到这个 class 样为resule_img_a 的 a 标签即可            links.append(link['href'])#具体分析详情页,从这里面找就行!if __name__ == '__main__':    get_page(3)    print(links)#还有一种方法,是爬取所有的具体网页:'''def get_pages():    r = r'^http://bj.xiaozhu.com/fangzi/\d{9,10}\.html$'    lalala = re.compile(r)    lalala.findall(page)#page用urllib.request来写,就不具体分析了··,剩下的步骤与分析某一详情页是一样的!    ````'''```
简书的markdown真的不好用,不如jupyter

相关文章

  • C艹之路 V1.3 谭书代码誊抄列表目录

    根据谭浩强的书籍,手敲的全部代码1.3a--1.3b--1.3c--1.3de--1.3fg--

  • 1.3

    7月28日下午, “江小白酒业集中产业园”、“江小白高粱产业园”项目启动仪式在重庆江津区举行。江小白酒业与重庆市江...

  • 1.3

    不知从什么时候开始,江小白的名字就以迅雷不及掩耳之势覆盖开来,音乐动漫涂鸦,微博微信抖音,连看个剧都能随时抓拍到它...

  • 1.3

    语法: ここは デパートです 食堂(しょくどう)は デパートの 7階です あそこも ジエーシー企画(きかく)の ビ...

  • 1.3

    python_score =50 c_score =50 # 要求只要有一门成绩 > 60 分就算合格 if py...

  • 1.3

    今日

  • 1.3

    和海雯打着伞逛了一个晚上,给大爹(她爸爸)买了一双鞋,给她也买了一双。 想给他们买些东西的念头已经很久了,一直没约...

  • 1.3

    the stage of life should not be in the eyes of others it ...

  • 1.3

    昨晚做了一个很大的噩梦 他们离婚了 他不再是一副仁慈的样子 我不知道我自己是多虑还是怎样 只是 最近几天的梦总是在...

  • 1.3

    昨夜失眠 被人遗弃是个什么滋味,想来心酸。 总在想,如果有可能,我走到哪就把他带到哪,让我一个人守护他好了。 可是...

网友评论

      本文标题:1.3

      本文链接:https://www.haomeiwen.com/subject/uzuorttx.html