百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分类 > 正文

五分钟轻松掌握 Python 自动化测试 Selenium

ztj100 2025-05-22 14:59 77 浏览 0 评论

一、Selenium

selenium 是一个老牌的测试工具和自动化工具,它的用途非常多,掌握这么技能绝对是值得,并且如果有需要切换其他的技术,大致应该是相似的,也就是说从它迁移到别的工具是轻松的。

二、为什么 Selenium 需要驱动器呢?

有些网站渲染的内容是在页面渲染之后,通过 js 加载数据然后更新内容。在此之前我们拿不到页面的内容。我们可以通过浏览器驱动器来操作浏览器获取到页面的内容。再来看看 Selenium 的架构:

三、浏览器驱动器

Selenium 在运行之前需要驱动器,下面是不同浏览器的驱动器:

  • chrome 驱动器下载地址
  • firefox 驱动器下载地址
  • edge 驱动器下载地址
  • safari 官方文档

下载的需要注意版本:不同的浏览器对应不同的, 考虑大概率会用 chrome 但是对于高于 Chrome 115 版本的, chrome 会给你一个 json 端点,自己找需要的版本下载。

下载后,记录文件位置 例如 windows 下: "D:\web-driver\chrome-win64\chrome.exe", chrome 的驱动器在 11.7M 左右,复制一份放在自己的目录下也不大。

四、在 Chrome 中使用 WebDriver 进行测试

selenium 核心就是要得到驱动器 driver,所有的操作都是在驱动器上使用的:

from selenium import webdriver

# 指定驱动程序的位置
driver_path = 'C:\Users\Administrator\Desktop\chromedriver'  # 修改为你的驱动程序路径

driver = webdriver.Chrome(executable_path=driver_path)

driver.get("http://example.com") # 打开网页

print(driver.title) # 打印页面标题

driver.quit() # 关闭浏览器

这段代码也很好解释,webdriver 使用 Chrome 驱动。驱动使用 get 方法获取页面内容,然后打印驱动对象上页面的 title, 然后驱动关闭六浏览器。

Chrome 驱动的参数 Opiton

前面我们使用 Chrome 驱动,其实 Chrome 驱动还可以传递众多参数,驱动时 chrome opiton 的一些配置配置参数:

chrome_options.add_argument("--headless") # 无头模式
chrome_options.add_argument("--disable-gpu") # 禁用 gpu 加速
chrome_options.add_argument("--window-size=1920,1080") # 指定窗口大小
chrome_options.add_argument("--disable-extensions") # 禁用扩展
chrome_options.add_argument("--no-sandbox") # 禁用沙盒
chrome_options.add_argument("--ignore-certificate-errors") # 忽略证书错误
chrome_options.add_argument("--proxy-server=http://proxyserver:port") # 设置代理
chrome_options.add_argument("--disable-popup-blocking") #禁用弹出窗口阻止
chrome_options.add_argument("--start-maximized") # 启动时最大化窗口
chrome_options.add_argument("--disable-notifications") # 禁用通知
chrome_options.add_argument("--disable-infobars") #禁用信息栏
chrome_options.add_argument("--user-data-dir=/path/to/profile") # 指定用户数据目录
chrome_options.add_argument("--disable-restore-session-state") # 禁用崩溃恢复提示
chrome_options.add_argument("--mute-audio") # 静音音频

五、页面动态内容的加载

Selenium 处理动态内容是常见的需求,等待 JavaScript 动态加载。如果没有等待内容加载完毕,那么查找元素可能会导致错误。原因也很简单,就是没有加载完成。

等待也可以分为不同的层级,web deriver API 级别的。Python 等待以及页面级的等待。

WebDriverWait 等待

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 初始化 WebDriver
driver = webdriver.Chrome()

# 打开网页
driver.get('http://example.com')

# 显式等待,等待某个元素可见
element = WebDriverWait(driver, 10).until(
    EC.visibility_of_element_located((By.ID, 'dynamicElementId'))
)

# 对元素执行操作
element.click()

driver.find_element 显示等待

driver = webdriver.Chrome()
driver.implicitly_wait(10)  # 全局等待 10 秒

driver.get('http://example.com')

# 如果元素还没准备好,WebDriver 将等待,直到找到元素或超时
element = driver.find_element(By.ID, 'dynamicElementId')
element.click()

time.sleep() Python 等待(不推荐)

import time

driver = webdriver.Chrome()
driver.get('http://example.com')

time.sleep(5)  # 强制等待 5 秒
element = driver.find_element(By.ID, 'dynamicElementId')
element.click()

页面级等待

from selenium.webdriver.support.ui import WebDriverWait

# 等待页面完全加载,通过检查 JavaScript 变量
WebDriverWait(driver, 10).until(
    lambda driver: driver.execute_script('return document.readyState') == 'complete'
)

有了对 selenium 的基础使用和认识,我们就需要较为全面的了解 selenium 的 api 了,当我们对其 api 有较为全面的了解,我们很快就能入手了。

六、selenium 浏览器操作

  • driver.get(url) 打开指定的 URL。
  • driver.quit() 关闭浏览器并结束 WebDriver 会话。
  • driver.close() 关闭当前窗口。
  • driver.maximize_window() 最大化浏览器窗口。
  • driver.execute_script(script) 执行 JavaScript 脚本。

七、元素定位

  • driver.find_element(By.ID, id) 通过 ID 定位元素。
  • driver.find_element(By.NAME, name) 通过 NAME 定位元素。
  • driver.find_element(By.XPATH, xpath) 通过 XPath 定位元素。
  • driver.find_element(By.CSS_SELECTOR, selector) 通过 CSS 选择器定位元素。
  • driver.find_elements(By.CLASS_NAME, class_name) 定位所有符合类名的元素,返回列表。

八、元素操作

  • element.click() 点击元素。
  • element.send_keys(keys) 向元素输入文本。
  • element.clear() 清空输入框的内容。
  • element.get_attribute(attribute) 获取元素的属性值。
  • element.get_text() 获取元素的文本内容。
  • element.is_displayed() 检查元素是否显示。

九、等待操作

  • driver.implicitly_wait(time) 设置全局隐式等待时间。
  • WebDriverWait(driver, time).until(condition) 显式等待指定的条件。

十、窗口与导航

  • driver.back() 导航到前一个页面。
  • driver.forward() 导航到下一个页面。
  • driver.refresh() 刷新当前页面。
  • driver.switch_to.frame(frame) 切换到指定的 iframe。
  • driver.switch_to.alert() 切换到 alert 对话框。
  • driver.switch_to.window(window_name) 切换到指定的窗口。

十一、常用功能

处理 Cookie

cookies = driver.get_cookies()
driver.add_cookie({'name': 'cookie_name', 'value': 'cookie_value'})
driver.delete_all_cookies()

截图

driver.save_screenshot('screenshot.png')

上传图片

file_input = driver.find_element(By.NAME, 'file_upload') file_input.send_keys('/path/to/file.txt')

执行 JS

# 执行 js 脚本
driver.execute_script("alert('Hello, World!');")

# 从 localstorage 中获取 token
token = driver.execute_script("return localStorage.getItem('auth_token');") print(f"Token: {token}")

# 获取元素 css 属性
element = driver.find_element(By.ID, 'element_id')
background_color = driver.execute_script("return window.getComputedStyle(arguments[0]).backgroundColor;", element)

十二、Selenium 与 XPATH

虽然页面里面使用 css 选择器更加靠近 web 端,但是 xpath 在查找元素和定位时更加直接,简单高效。前面已经介绍 api 了,下面是一个实例:

from selenium import webdriver
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()
driver.get("https://example.com")

# 使用 XPath 查找元素
element = driver.find_element(By.XPATH, "//div[@id='main-content']//h1")
print(element.text)

find_element 第一个参数指定 By.XPATH,后面传入 xpath 字符串即可,也是特别方便。

十三、selenium 与爬虫

得益于 selenium 能够直接访问实际页面,动态加载数据爬虫也有的重要作用。它可以弥补传统爬虫工具的不足,抓取由 JavaScript 渲染的内容。但要注意的是,它的性能相对较低,不适合大规模数据抓取。

十四、小结

本文主要介绍了 Selenium 相关内容,主要涉及 Selenium 知识面,从开始的 Python 小案例,到后面的 API 全面了解,以及 Selenium 的常用功能,到最后的 XPATH 以及爬虫的认知。这些内容已经能够全面,且具有实践性。

作者:编程杂货铺
链接:
https://juejin.cn/post/7402328037390123071

相关推荐

其实TensorFlow真的很水无非就这30篇熬夜练

好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...

交叉验证和超参数调整:如何优化你的机器学习模型

准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...

机器学习交叉验证全指南:原理、类型与实战技巧

机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...

深度学习中的类别激活热图可视化

作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...

超强,必会的机器学习评估指标

大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...

机器学习入门教程-第六课:监督学习与非监督学习

1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...

Python教程(三十八):机器学习基础

...

Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置

你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...

超全面讲透一个算法模型,高斯核!!

...

神经网络与传统统计方法的简单对比

传统的统计方法如...

AI 基础知识从0.1到0.2——用“房价预测”入门机器学习全流程

...

自回归滞后模型进行多变量时间序列预测

下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...

苹果AI策略:慢哲学——科技行业的“长期主义”试金石

苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...

时间序列预测全攻略,6大模型代码实操

如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...

AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN

...

取消回复欢迎 发表评论: