今天在工作中遇到一个问题,table下有很多tr, tr下有很多td, td下有的有div,有的没有,但是每个tr下的文本得拿出来放在一块,然后我使用
l = doc.xpath('/html/body/div[3]/div[1]/div[1]/table')[0]
我的想法是将table下所有的标签拿出来,既将所有的tr单独拿出来放到一个列表当中再在每个tr中取值
我之前一直不理解为什么这里要加【0】,后来我查看Xpath语法,再将获取的值打印出来,发现这里取的level值其实就是一个列表,只不过当中只有一个值,这个值就是所有tr标签组成的一个列表,使用[0]只不过是拿到这个列表而已,然后再遍历整个列表就拿到每个标签的html,然后对每个标签的html取值,这样每个tr下的值就拿出来了
网友评论