美文网首页
WebDriver定位网页元素

WebDriver定位网页元素

作者: invalid_name | 来源:发表于2016-08-21 18:15 被阅读347次

    webDriver是Python 的一个用于实现web自动化的第三方库,以百度首页为例,学习元素定位。

    首先使用前端工具找到百度首页部分前端代码:

    <html>
      <head>
      <body link="#0000cc">
        <script>
        <div id="wrapper" style="display: block;">
            <script>
            <div id="head">
                <div class="head_wrapper">
                    <div class="s_form">
                        <div class="s_form_wrapper soutu-env-nomac soutu-env-index">
                              <div id="lg">
                              <a id="result_logo" onmousedown="return c({'fm':'tab','tab':'logo'})" href="/">
    
                              <form id="form" class="fm" action="/s" name="f">
                                  <input type="hidden" value="utf-8" name="ie">
                                  <input type="hidden" value="8" name="f">
                                  <input type="hidden" value="0" name="rsv_bp">
                                  <input type="hidden" value="1" name="rsv_idx">
                                  <input type="hidden" value="" name="ch">
                                  <input type="hidden" value="monline_3_dg" name="tn">
                                  <input type="hidden" value="" name="bar">
                                  <span class="bg s_ipt_wr quickdelete-wrap">
                                       <input id="kw" class="s_ipt" autocomplete="off" maxlength="255" value="" name="wd">
                                  </span>
    
                                  <span class="bg s_btn_wr">
                                       <input id="su" class="bg s_btn" type="submit" value="百度一下">
                                  </span>
                                  ......
    

    webDriver 中元素定位方法:

    find_element_by_id()                    find_element_by_name()
    find_element_by_class_name()      find_element_by_tag_name()
    find_element_by_link_test()          find_element_by_partial_link_text()
    find_element_by_xpath()              find_element_by_css_selector()
    
    1.id/name/class/tag定位

    例如百度输入框:

    Paste_Image.png

    我们可以使用它的各种属性进行定位:

    find_element_by_id("kw")  
    find_element_by_name("wd")
    find_element_by_class_name("s_ipt") 
    find_element_by_tag_name("input")  -- 但是下查看前端会发现大量<div>、<input>、<a>等标签,所以很难通过by_tag_name找到准确的定位,适用于批量定位。
    
    2.link/partial link 定位:

    link定位是专门用来定位文本连接 的。比如:

    <a class="mnav" name="tj_trvideo" href="http://v.baidu.com">视频</a>
    <a class="mnav" name="tj_trtieba" href="http://tieba.baidu.com">贴吧</a>
    <a class="bri" style="display: block;" name="tj_briicon" href="http://www.baidu.com/more/">更多产品</a>
    ------------------------------------------
    find_element_by_link_test("视频")   
    #当文本比较长的时候,我们可以取文本的一部分,只要这部分信息可以唯一标识这个连接就行:
    find_element_by_partial_link_text("更多")
    
    3.XPath定位

    例:(百度输入框和搜索框定位)
    ●绝对路径定位
    find_element_by_xpath("/html/body/div/div/div/div/div/form/span/input")
    find_element_by_xpath("/html/body/div/div/div/div/div/form/span[2]/input")
    如果一个层级下有多个相同标签名,按上下顺序确定是第几个,如:span[2] 第二个表示搜索框
    ●元素属性定位

    find_element_by_xpath("//input[@id='kw']")
    find_element_by_xpath("//input[@id='su']")
    find_element_by_xpath("//*[@id='su']")
    

    //表示当前页面某个目录下,input是元素标签名,[@id='kw']表示元素的id属性,这里可以使用元素的任意属性名,只要能唯一识别该元素,如果不想指定标签名可以用*号代替
    ●层级属性结合
    如果一个元素没有任何可以唯一标识的属性,可以找到他的上一级元素(上级没有找上上级...)

    find_element_by_xpath("//span[@class='bg s_ipt_wr']/input")
    find_element_by_xpath("//span[@class='bg s_btn']/input")
    

    ●使用逻辑运算符
    如果一个属性不能唯一区分一个元素,可以用逻辑运算符 ‘and’ 连接多个属性定位元素

    find_element_by_xpath("//input[@id='kw' and @class='s_ipt']")
    
    4.CSS定位

    1.通过(.)号进行class属性定位,(#)号进行id属性定位:
    find_element_by_css_selector(".s_ipt")
    find_element_by_css_selector("#kw")
    2.通过标签名定位
    find_element_by_css_selector("input") #标签名重复概率大,适用定位一组元素
    3.通过父子关系定位
    find_element_by_css_selector("span>input")
    4.通过属性定位
    find_element_by_css_selector("autocomplete=off")
    5.组合定位

    find_element_by_css_selector("form.fm>span>input.s_ipt")
    #class属性为fm的form标签->span标签->标签名为input、class属性为s_ipt 的元素。
    

    WebDriver的8种定位方法还提供了统一的调用方法:find_element() 方法。通过By声明定位方法,再 传入响应的定位参数:
    使用By之前导入By类:
    form selenium.webdriver.common.by import By
    find_element(By.ID, "kw")
    find_element(By.NAME, "wd")
    ...

    相关文章

      网友评论

          本文标题:WebDriver定位网页元素

          本文链接:https://www.haomeiwen.com/subject/tqcwsttx.html