2014-12-21

2014-12-21

作者: Akker | 来源:发表于2014-12-21 04:05 被阅读0次

2014-12-21
2014-12-21会议讨论
整理博客
仁者不忧，智者不惑，勇者不惧

诀窍，大局观

找“打印该页面链接”，找“移动端显示”，会让格式更容易
找在js里的信息
信息可能在url里
换个网站找同样信息
get_text()
去掉所有tag部分，只留下text部分。留到最后再用这个功能。
pythonnameList = bsObj.findAll("span", {"class":"green"})for name in nameList: print(name.get_text())findAll()pythonfindAll(tag, attributes, recursive, text, limit, keywords).findAll({"h1","h2","h3","h4","h5","h6"}) # 找tag属于的.findAll("span", {"class":"green", "class":"red"}) # 找tag=span，class属于的nameList = bsObj.findAll(text="the prince") # 找tag的text是“the price”的个数allText = bsObj.findAll(id="text") # keywords寻找对应关键词的allText = bsObj.findAll("", {"id":"text"}) # 与上式同义bsObj.findAll(class_="green") # class关键词时用class_，避免关键词soup.findAll(lambda tag: len(tag.attrs) == 2) # 加lambda表达式children(), descendants()pythonbsObj.find("tr",{"id":"gift1"}).children() # 满足条件tag的直属一级tagbsObj.find("tr",{"id":"gift1"}).descendants() # 满足条件tag的包含的所有tagnext_siblings, previous_siblingspythonbsObj.find("table",{"id":"giftList"}).tr.next_siblings # 当前tr tag之后的并列tagbsObj.find("table",{"id":"giftList"}).previous_siblings # 当前tag之前的并列tagparentpythonbsObj.find("img",{"src":"../img/gifts/img1.jpg"}).parent.previous_sibling.get_text() # 定位到当前tag的parentregular expressionspythonimages = bsObj.findAll("img", {"src":re.compile("\.\.\/img\/gifts/img.*\.jpg")}) # findAll加re获取tag属性attributespythonmyImgTag.attrs # 得到字典，包括这个tag的所有属性myImgTag.attrs['src'] # src属性值其他选择，不用bs41. lxml：处理HTML，XML，很快。2. HTML Parser：buit-in

相关文章

2014-12-21
诀窍，大局观找“打印该页面链接”，找“移动端显示”，会让格式更容易找在js里的信息信息可能在url里换个网...
2014-12-21会议讨论
by 小Q 过去一个月工作总结推文阅读情况有些阅读率高，有些不高；我觉得文章选择以及编辑都是很不错的；题目特...
整理博客
一缕清风查看网页版> 古镇的记忆 2014-12-21 08:51 小桥流水人家，粉墙黛瓦，廊篷飞檐，江南的小镇大...
仁者不忧，智者不惑，勇者不惧
写于2014-12-21 前段时间听曾国藩家训后一发不可收拾，之后听了于丹论语感悟、庄子感悟、以及张德芬关于遇见未...

网友评论

本文标题：2014-12-21

本文链接：https://www.haomeiwen.com/subject/qotatttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|2014-12-21|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！