学习python有一段时间了,一直没有一个完整的项目。这次总算完成了一个小的项目-自动打开网页答题,虽然还不是很完美,也足够用了。
分享下过程。
首先理清思路:解析网页-->提取题目-->判断是否存在题库中-->答题
1、解析网页,我想到了爬虫中使用的request模块,但是考虑到后边的需要点击进行答题,最后在网上找到了更好用的selenium模块。然后进行selenium的相关配置(配置过程有许多坑,最为关键的就是浏览器对应的版本和webdriver存放位置),学习selenium的相关用法,为了更好的定位网页中的对象安装了selenium IDE插件。经过半天努力,终于能通过Firefox打开网页了。
2、通过selenium IDE插件确定要提取对象的位置,这个可以直接在浏览器的扩展程序中直接查找添加,添加好了记得重启浏览器。在定位对象过程中使用了id,class,css和xpath方法。搜索到以后使用get_attribute得到要操作页面的地址。
3、使用文本处理split方法对地址进行解析,提出题目中的题号,然后在已经知道答案的题库中搜索,如果有,返回答案,如果没有全部选择a。(由于不限制挑战次数,但是每天最多挑战成功3次。所以只答最高分值的题,其他都打错)
4、根据答案选择按钮,然后点击下一个,最后提交。然后再进行下一题,直到挑战成功三次。
在答题过程中还出现了限时答题的情况,需要判断是否存在和跳过,又进行进一步完善。
通过这次完整的小项目,有点小总结,就是网上有许多前人走过的路,总结好的经验,学习就是了,不过要懂得区分好与坏。先找到最核心的问题,简化为一个小的问题,然后在网上查找最简单精准的答案。先解决了,然后再确定一个问题进行解决,就这样逐步进行完善。
脚本如下:
'''
作者:Yeahlv
时间:2019-4-13
版本:v1.0
开发环境:Pycharm
'''
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
import numpy as np
import time
题目的序号
timu_id_ar = [7,12,13,14,16,39,40]
题目的答案
timu_daan_ar=np.array([[3,4,4,4,4,3,4,4,4,1],[4,1,2,2,3,2,4,3,2,3],[2,1,2,3,4,4,4,3,2,2],[4,1,2,3,2,4,4,3,4,2],[1,2,2,3,4,3,2,1,2,3],[1,4,3,2,2,2,2,4,2,2],[4,1,2,2,2,2,3,4,2,2],[1,1,1,1,1,1,1,1,1,1]])
def wait_response_time(chrome,waittime,func):
# 返回 func执行结果
return WebDriverWait(chrome,waittime).until(func)
def automatic_login(name,pwd,url):
#chrome = webdriver.Firefox()
chrome.get(url)
time.sleep(2)
name_label = chrome.find_element_by_name("LoginForm[loginName]")
name_label.send_keys(name)
pwd_label = chrome.find_element_by_name("LoginForm[password]")
pwd_label.send_keys(pwd)
time.sleep(1)
login_label = chrome.find_element_by_class_name('login-submit')
login_label.click()
time.sleep(2)
chrome.get('https://www.qqyuedu.com/student-home/challenge/index')
获取题目地址
def huoqu_timu(url):
chrome.get(url)
is_ks = isElementExist_lt("开始挑战")
if is_ks:
challenge_label = chrome.find_element_by_link_text("开始挑战")
dizhi=challenge_label.get_attribute("href")
print('挑战题目的地址是:',dizhi)
return dizhi
else:
return False
def isElementExist_lt(link_text):
try:
chrome.find_element_by_link_text(link_text)
return True
except:
return False
def isElementExist_class(class_name):
try:
chrome.find_element_by_class_name(class_name)
return True
except:
return False
def isElementExist_path(path_name):
try:
chrome.find_element_by_xpath(path_name)
return True
except:
return False
def daan_trsf(num):
if num==1:
return "A"
if num==2:
return "B"
if num==3:
return "C"
if num==4:
return "D"
if num==5:
return "E"
else:
return "答案是不是输入错误?"
答题
def tiaozhan(url):
chrome.get(url)
# 取得题目索引
def timu_index(url):
num1 = int(url.split("=")[1].split("&")[0])
if num1 in timu_id_ar:
timu_index = timu_id_ar.index(num1)
else:
timu_index = 7
print("这道题不在题库内,答案全部选择A。")
return timu_index
#开始挑战
is_ks = isElementExist_lt("开始")
if is_ks:
challenge_label = chrome.find_element_by_link_text("开始")
challenge_label.click()
time.sleep(1)
#开始挑战
is_ks = isElementExist_lt("开始挑战")
if is_ks:
challenge_label = chrome.find_element_by_link_text("开始挑战")
challenge_label.click()
time.sleep(1)
x = timu_index(url)
print("题目序号是"+str(x), "题目答案是",timu_daan_ar[x])
for i in range(10):
is_ks = isElementExist_lt("开始")
if is_ks:
challenge_label = chrome.find_element_by_link_text("开始")
challenge_label.click()
time.sleep(1)
# 点跳过
is_tg = isElementExist_lt("跳过")
if is_tg:
challenge_label = chrome.find_element_by_link_text("跳过")
challenge_label.click()
time.sleep(1)
# 点击答案,模式css=.question-option-list-item:nth-child(1) input
#x=timu_index(url)
timu_daan_txt = ".question-option-list-item:nth-child("+str(timu_daan_ar[x][i])+") input"
print("第"+str(i+1)+"题选择:",daan_trsf(timu_daan_ar[x][i]))
challenge_label = chrome.find_element_by_css_selector(timu_daan_txt)
challenge_label.click()
time.sleep(1)
# 点击提交答案 xpath=//button[contains(.,'提交答案')]
is_tjda = isElementExist_path("//button[contains(.,'提交答案')]")
if is_tjda:
challenge_label = chrome.find_element_by_xpath("//button[contains(.,'提交答案')]")
challenge_label.click()
time.sleep(1)
break
is_xyt = isElementExist_class("ion-chevron-right")
if is_xyt:
challenge_label = chrome.find_element_by_class_name("ion-chevron-right")
challenge_label.click()
time.sleep(1)
is_tjda = isElementExist_class("btn btn-primary btn-lg")
if name == "main":
chrome = webdriver.Firefox()
name = "lvjianyi20090601"
pwd = "123456"
url = "https://www.qqyuedu.com/"
automatic_login(name,pwd,url)
#https://www.qqyuedu.com/challenge/default/quiz?challengeId=9&quizId=68&layoutMode=iframe
lyt = 0
while 1>0:
url_1=huoqu_timu('https://www.qqyuedu.com/student-home/challenge/index')
if url==False:
break
else:
tiaozhan(url_1)
lyt += 1
print("第"+str(lyt)+"次挑战")
网友评论