Selenium自动化测试入门：从环境搭建到框架集成的完整指南-尧图建网站

1. 项目概述为什么我们需要Selenium自动化测试如果你是一名测试工程师、开发人员或者任何需要和网页打交道的从业者那么“重复”这个词一定是你工作里的噩梦。想象一下每次产品迭代你都需要手动打开浏览器点击几十个按钮填写无数表单然后核对上百条数据——日复一日这种机械劳动不仅枯燥而且极易出错更别提那些需要深夜执行的回归测试了。这正是Selenium这类自动化测试工具诞生的土壤。它不是一个高深莫测的黑科技而是一个朴实无华的生产力工具核心目标就是把我们从重复、繁琐的网页操作中解放出来让计算机去模拟人的点击、输入和验证。简单来说Selenium就是一个能让你用代码控制浏览器的“遥控器”。你写一段脚本告诉它“打开Chrome访问这个网址在搜索框里输入‘自动化测试’点击搜索按钮然后检查结果里有没有‘Selenium’这个词。” 它就能一丝不苟地执行并且可以7x24小时不间断运行。这不仅仅是“偷懒”更是提升软件交付质量和速度的关键。在敏捷开发和DevOps实践中自动化测试是持续集成/持续交付CI/CD流水线中不可或缺的一环确保每次代码提交都不会破坏现有功能。这个项目标题“简单学习-- Selenium自动化测试”非常贴切它点明了两个核心一是“简单学习”意味着入门门槛并不高二是“自动化测试”这是它的核心应用场景。无论你是想为个人项目写个自动签到脚本还是为公司的Web产品搭建一套完整的UI自动化测试框架Selenium都是一个绕不开的经典选择。它支持几乎所有主流浏览器Chrome, Firefox, Edge, Safari和主流编程语言Python, Java, C#, JavaScript, Ruby等生态成熟社区活跃有海量的资料和解决方案可供参考。接下来我会从一个实践者的角度带你拆解如何从零开始构建一个扎实可用的Selenium自动化测试能力。2. 核心组件与生态全景不只是WebDriver很多人一提到Selenium就只想到WebDriver。这没错WebDriver是它的心脏但完整的Selenium项目是一个工具家族理解每个成员的职责能让你在构建自动化方案时更加得心应手。2.1 WebDriver与浏览器对话的桥梁WebDriver是Selenium的核心它基于W3C标准提供了一套统一的API称为WebDriver协议。你可以把它理解为一个“翻译官”。你的测试代码用Python、Java等写成发出指令比如find_element(By.ID, “username”)。WebDriver接收到这个指令后会通过浏览器特定的驱动程序如ChromeDriver、geckodriver将其翻译成浏览器能理解的原生操作。正是这个标准化协议使得同一份测试脚本只需更换驱动程序就能在不同的浏览器上运行实现了真正的跨浏览器测试。它的工作模式是“客户端-服务器”架构客户端你的测试脚本使用Selenium提供的语言绑定库如seleniumfor Python。服务器浏览器驱动程序Driver它是一个独立的可执行文件负责控制真实的浏览器进程。通信客户端通过HTTP请求使用JSON Wire Protocol或W3C协议向驱动程序发送命令驱动程序执行后返回结果。注意从Selenium 4开始官方全面转向W3C WebDriver协议这比旧版的JSON Wire Protocol更稳定、更标准。如果你遇到一些陈旧的教程或代码报出协议错误很可能是因为版本兼容性问题。2.2 Selenium IDE记录与回放的快速入门工具对于完全的新手或者需要快速生成一些简单测试用例的场景Selenium IDE是一个浏览器插件支持Chrome和Firefox。你可以像操作录屏软件一样手动在浏览器上操作一遍IDE会记录下你的每一步动作点击、输入、选择并生成可回放的测试脚本。它生成的脚本可以导出为多种语言如Python、Java为后续的代码化改造提供了基础。实操心得虽然IDE上手极快但它生成的脚本往往非常“脆弱”——定位元素的方式通常是冗长且易变的XPath或CSS Selector。一旦页面结构稍有变动脚本就可能失效。因此我通常只把IDE作为探索和学习工具用于理解页面操作如何转化为Selenium命令或者快速获取一个复杂操作的初始代码片段。真正的生产级自动化必须转向代码编写。2.3 Selenium Grid分布式测试的枢纽当你的测试用例成百上千或者需要在多种浏览器、多种操作系统组合下运行时在一台机器上串行执行会变得极其缓慢。Selenium Grid就是为了解决这个问题而生的分布式测试执行环境。它采用Hub-Node架构Hub中心调度器。你的测试脚本连接Hub告诉它“我需要一个Windows 10上的Chrome 120浏览器来运行测试”。Node执行节点。在多台机器可以是物理机、虚拟机或容器上注册Node并配置它们所能提供的浏览器类型和版本。Hub会将测试任务分发给符合条件的Node执行。这样你就可以并行运行大量测试显著缩短反馈时间。在云原生和容器化流行的今天结合Docker可以轻松搭建弹性的Selenium Grid集群。2.4 Selenium Manager告别手动管理驱动程序的烦恼这是一个在Selenium 4.6版本引入的“神器”。以前做Selenium自动化第一件头疼的事就是下载对应浏览器版本的驱动程序ChromeDriver等放到系统PATH里版本还必须严格匹配。Selenium Manager用Rust编写内置于Selenium库中。当你创建WebDriver实例时如webdriver.Chrome()如果系统没有找到合适的驱动程序它会自动检测你本地安装的浏览器版本并自动下载、配置匹配的驱动程序。这大大降低了环境配置的复杂度对新手极其友好。提示虽然Selenium Manager很方便但在企业内网或CI/CD流水线等无法直接访问外网的环境下它可能失效。此时仍需采用传统方式将驱动程序预先放置到指定位置或使用内部镜像源。3. 环境搭建与第一个脚本从“Hello World”开始理论说再多不如动手跑一遍。我们以最流行的Python语言为例搭建环境并编写第一个脚本。选择Python是因为其语法简洁生态丰富非常适合自动化测试的快速开发和原型验证。3.1 基础环境准备安装Python确保你的系统安装了Python 3.7或更高版本。可以在命令行输入python --version或python3 --version检查。安装Selenium库使用pip包管理器安装。建议在虚拟环境中进行以避免包冲突。pip install selenium这条命令会安装最新的Selenium 4.x版本以及内置的Selenium Manager。安装浏览器确保你安装了Chrome或Firefox浏览器。Selenium Manager会自动处理驱动所以通常不需要手动下载ChromeDriver或geckodriver。3.2 编写并运行第一个自动化脚本创建一个名为first_test.py的文件输入以下代码from selenium import webdriver from selenium.webdriver.common.by import By import time # 1. 创建WebDriver实例启动Chrome浏览器 # Selenium Manager会在背后自动处理驱动程序 driver webdriver.Chrome() try: # 2. 导航到目标网址 driver.get(https://www.baidu.com) # 等待一下让页面充分加载实际项目中会用更智能的等待这里仅为演示 time.sleep(2) # 3. 定位页面元素并与之交互 # 找到百度首页的搜索输入框通过它的ID属性‘kw’ search_box driver.find_element(By.ID, kw) # 在输入框中键入搜索词 search_box.send_keys(Selenium自动化测试) # 找到搜索按钮通过它的ID属性‘su’并点击 search_button driver.find_element(By.ID, su) search_button.click() # 4. 等待搜索结果加载 time.sleep(3) # 5. 进行简单的断言验证 # 检查页面标题是否包含我们搜索的关键词 assert Selenium in driver.title print(测试通过页面标题包含‘Selenium’。) # 也可以打印当前页面的URL或部分文本进行验证 print(f当前页面URL: {driver.current_url}) except Exception as e: print(f测试过程中出现异常: {e}) # 这里可以截图方便排查问题 driver.save_screenshot(error_screenshot.png) finally: # 6. 关闭浏览器释放资源 # 使用quit()而不是close()quit会关闭整个浏览器进程和驱动程序 driver.quit()逐行解析与注意事项webdriver.Chrome()这行代码会启动一个全新的、干净的Chrome浏览器实例通常是无头模式但默认是有界面的便于调试。如果你需要Firefox则使用webdriver.Firefox()。driver.get(url)这是导航命令。它会等待页面load事件触发即整个HTML文档加载完成但对于动态加载Ajax的内容这还不够。time.sleep(seconds)这是强制等待是一种不推荐的等待方式。它会让脚本无条件暂停指定秒数无论页面是否已就绪。这会造成时间浪费如果页面加载快或等待不足如果页面加载慢。在生产脚本中务必用“显式等待”替代它下文会详细讲。find_element(By.ID, “kw”)这是最常用的元素定位方式。By.ID表示通过HTML元素的id属性来定位。id通常是页面内唯一的因此定位速度快且稳定。如果元素没有id我们还可以用By.NAME,By.CLASS_NAME,By.XPATH,By.CSS_SELECTOR等。send_keys(“text”)和click()模拟键盘输入和鼠标点击是最基本的交互操作。assert ...使用Python的内置assert进行断言。断言失败会抛出AssertionError标志着测试用例失败。在实际测试框架如pytest中会有更强大的断言机制。driver.quit()至关重要必须在脚本最后调用quit()来关闭浏览器并终止WebDriver进程。如果只调用close()只会关闭当前标签页后台进程可能仍会残留积累多了会耗尽系统资源。运行这个脚本你会看到一个Chrome浏览器自动打开访问百度输入搜索词点击搜索然后关闭。控制台会打印出断言结果。恭喜你已经完成了Selenium自动化的“Hello World”4. 元素定位自动化脚本的基石与艺术如果说Selenium脚本是乐谱那么元素定位就是音符。找不到正确的元素所有后续操作点击、输入、获取文本都无从谈起。定位的稳定性是UI自动化最大的挑战因为前端页面总是在变化。4.1 八大定位策略详解Selenium提供了8种主要的定位策略通过By类调用定位器示例 (Python)描述优先级建议IDBy.ID, “userName”通过元素的id属性。最优先选择通常唯一且稳定。★★★★★NAMEBy.NAME, “password”通过元素的name属性。常用于表单输入框。★★★★☆CLASS_NAMEBy.CLASS_NAME, “btn-primary”通过元素的class属性。注意一个元素可能有多个class此处需完全匹配其中一个。★★★☆☆TAG_NAMEBy.TAG_NAME, “input”通过HTML标签名如div,a。通常不唯一需结合其他条件。★★☆☆☆LINK_TEXTBy.LINK_TEXT, “忘记密码”精确匹配超链接的完整可见文本。★★★☆☆PARTIAL_LINK_TEXTBy.PARTIAL_LINK_TEXT, “忘记”匹配超链接可见文本的部分内容。★★★☆☆CSS_SELECTORBy.CSS_SELECTOR, “#loginForm .submit”使用CSS选择器语法。功能强大性能好是XPath的强有力替代。★★★★★XPATHBy.XPATH, “//input[name‘q’]”使用XPath路径表达式。功能最强大但可能复杂且性能稍差。★★★★☆实操心得与选择策略ID为王如果元素有唯一且不变的id毫不犹豫地用By.ID。这是最快、最稳定的方式。慎用CLASS_NAME前端样式经常变动class名可能随之改变。如果要用确保它是具有业务语义的class如js-submit-btn而非纯样式class如mt-4。拥抱CSS_SELECTOR对于没有ID的复杂元素CSS选择器是我的首选。它语法简洁浏览器原生支持解析速度快。例如input[type‘email’]定位类型为email的输入框。.nav-list li:first-child定位导航列表的第一个子项。#content div.alert:not(.hidden)定位id为content下未隐藏的警告div。谨慎使用XPATHXPath非常灵活可以基于层级、属性、文本进行复杂定位。但绝对要避免使用浏览器开发者工具直接复制的绝对路径如/html/body/div[3]/div[2]/form/div[1]/input这种路径极其脆弱页面结构微调就会失效。应使用相对路径和属性结合例如//button[text()‘登录’]或//div[id‘list’]//li[contains(class, ‘active’)]。4.2 高级定位技巧与动态元素处理现代网页大量使用JavaScript动态加载内容元素可能不会立即出现在DOM中或者其属性会动态变化。技巧一处理动态ID/Class。有些框架如React、Vue会生成随机的ID或Class后缀。此时应避免依赖完整的动态值转而使用部分匹配或其他稳定属性。CSS选择器部分匹配driver.find_element(By.CSS_SELECTOR, “div[class^‘dynamicPrefix-’]”)(匹配class以‘dynamicPrefix-’开头的div)XPath函数driver.find_element(By.XPATH, “//div[contains(id, ‘stablePart’)]”)技巧二组合定位与相对定位。当一个定位器无法唯一确定元素时可以组合使用或者先定位其父元素再在父元素范围内查找子元素。# 先定位一个稳定的父容器 form driver.find_element(By.ID, “loginForm”) # 在form内部查找用户名输入框 username_input form.find_element(By.NAME, “username”) # 这比在整个页面中搜索更精确速度也更快技巧三处理iframe内联框架。如果目标元素位于iframe标签内你必须先切换到该iframe上下文才能定位其中的元素。# 通过ID、Name或索引切换到iframe driver.switch_to.frame(“iframe_id”) # 现在可以操作iframe内的元素了 iframe_element driver.find_element(By.TAG_NAME, “button”) # 操作完成后切回主页面 driver.switch_to.default_content()忘记切换iframe是新手最常见的错误之一会导致NoSuchElementException。5. 等待机制让脚本“聪明”地等待而非“傻等”在第一个脚本中我们用了time.sleep(3)这是“强制等待”硬等待是自动化脚本的“毒药”。它让脚本变得缓慢且不可靠。正确的做法是使用“智能等待”。5.1 显式等待Explicit Wait推荐的主力等待方式显式等待会告诉WebDriver在抛出“找不到元素”异常之前先等待一段时间并在此期间以一定的频率默认0.5秒重试查找元素直到元素满足某个条件如可见、可点击、存在等。from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # 创建一个WebDriverWait对象设置最大等待时间为10秒 wait WebDriverWait(driver, 10) # 等待直到ID为‘result’的元素在页面上可见 result_element wait.until(EC.visibility_of_element_located((By.ID, “result”))) # 等待直到ID为‘submitBtn’的元素可以被点击 submit_button wait.until(EC.element_to_be_clickable((By.ID, “submitBtn”))) submit_button.click() # 等待直到页面标题包含特定文字 wait.until(EC.title_contains(“订单提交成功”))expected_conditionsEC模块提供了丰富的等待条件presence_of_element_located: 元素存在于DOM中不一定可见。visibility_of_element_located: 元素存在且可见宽高大于0。element_to_be_clickable: 元素可见且可点击最常用。text_to_be_present_in_element: 元素文本包含特定文字。alert_is_present: 等待警告框弹出。实操心得对于任何动态加载的元素首选显式等待。将等待时间设置为一个合理的业务超时值如10-30秒。它使脚本更健壮能适应网络或服务器响应速度的变化。5.2 隐式等待Implicit Wait全局性的兜底策略隐式等待是设置一个全局的等待时间在查找任何一个元素时如果元素没有立即找到WebDriver会轮询DOM一段时间你设置的时长直到找到或超时。driver.implicitly_wait(10) # 单位秒重要提示隐式等待和显式等待不要混用因为它们的机制会相互影响导致总的等待时间超出预期。在Selenium 4的官方文档中更推荐使用显式等待并明确说明应避免隐式等待。我的建议是在项目中明确禁用隐式等待或设为0统一使用显式等待这样等待行为更清晰、更可控。5.3 流畅等待Fluent Wait更精细的控制流畅等待是显式等待的一种更灵活的变体允许你自定义轮询频率和忽略的异常类型。from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.common.by import By from selenium.common.exceptions import NoSuchElementException wait WebDriverWait( driver, timeout30, # 最大等待时间 poll_frequency1, # 每1秒检查一次条件默认0.5秒 ignored_exceptions[NoSuchElementException] # 在轮询期间忽略此异常 ) element wait.until(lambda d: d.find_element(By.ID, “dynamicElement”))这在处理某些特定场景如需要更长轮询间隔时有用但多数情况下标准的显式等待已足够。6. 高级交互与复杂操作模拟除了简单的点击和输入Selenium还能模拟更复杂的用户行为如拖放、鼠标悬停、键盘快捷键、文件上传等。这些通过ActionChains类和Keys枚举来实现。6.1 鼠标操作悬停、拖放、右键from selenium.webdriver.common.action_chains import ActionChains from selenium.webdriver.common.by import By driver.get(“https://example.com”) menu driver.find_element(By.ID, “dropdownMenu”) submenu_item driver.find_element(By.ID, “subItem”) # 创建ActionChains对象 actions ActionChains(driver) # 鼠标悬停 actions.move_to_element(menu).perform() # 注意ActionChains的操作需要调用.perform()才会真正执行 # 点击并按住拖拽到目标位置然后释放 source driver.find_element(By.ID, “draggable”) target driver.find_element(By.ID, “droppable”) actions.drag_and_drop(source, target).perform() # 右键点击上下文菜单 actions.context_click(menu).perform() # 组合操作悬停后点击子菜单 actions.move_to_element(menu).click(submenu_item).perform()6.2 键盘操作快捷键与组合键from selenium.webdriver.common.keys import Keys from selenium.webdriver.common.by import By search_box driver.find_element(By.NAME, “q”) search_box.send_keys(“Selenium”) # 模拟按下回车键进行搜索 search_box.send_keys(Keys.ENTER) # 模拟全选CtrlA、复制CtrlC等组合键 # 注意在Mac上是Command键但Selenium的Keys类通常发送的是Control actions.key_down(Keys.CONTROL).send_keys(“a”).key_up(Keys.CONTROL).perform() actions.key_down(Keys.CONTROL).send_keys(“c”).key_up(Keys.CONTROL).perform()6.3 文件上传文件上传有两种常见场景Input标签类型为file这是最简单的情况直接使用send_keys传入文件本地路径即可。upload_element driver.find_element(By.XPATH, “//input[type‘file’]”) # 传入文件的绝对路径 upload_element.send_keys(“/Users/yourname/Desktop/test_image.png”)非Input标签的复杂上传例如通过点击按钮触发系统文件选择对话框。Selenium无法直接与操作系统级别的对话框交互。此时有几种解决方案方案A推荐如果开发配合可以让前端在测试环境提供一个隐藏的input type‘file’元素供自动化脚本直接使用。方案B使用第三方工具如pyautoguiPython或AutoITWindows来模拟键盘操作选择文件。但这会引入外部依赖且脚本跨平台性差。方案C对于现代Web应用有时上传组件在点击后会监听一个drop事件。你可以尝试用ActionChains模拟拖放操作将文件路径“拖”到上传区域但这需要前端支持且实现复杂。避坑指南处理文件上传时务必使用文件的绝对路径。相对路径可能导致找不到文件。在CI/CD环境中要确保该路径在构建服务器上同样有效。7. 测试框架集成与最佳实践孤立的Selenium脚本价值有限。我们需要将其集成到测试框架中以便管理用例、生成报告、处理前置后置条件等。Python生态中pytest是事实上的标准。7.1 使用pytest组织测试用例pytest比Python自带的unittest更简洁、功能更强大。# test_login.py import pytest from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 1. 使用fixture管理WebDriver生命周期 pytest.fixture(scope“function”) # 每个测试函数执行一次 def driver(): # 初始化浏览器可以在这里配置选项如无头模式 options webdriver.ChromeOptions() options.add_argument(“--headless”) # 无头模式不显示UI适合CI环境 options.add_argument(“--disable-gpu”) options.add_argument(“--window-size1920,1080”) driver webdriver.Chrome(optionsoptions) yield driver # 将driver对象提供给测试用例 # 测试结束后无论成功失败都关闭浏览器 driver.quit() # 2. 编写测试用例 def test_valid_login(driver): 测试有效用户名密码登录 driver.get(“https://example.com/login”) driver.find_element(By.ID, “username”).send_keys(“testuser”) driver.find_element(By.ID, “password”).send_keys(“securepass”) driver.find_element(By.ID, “loginBtn”).click() # 使用显式等待等待登录成功后的页面元素 welcome_msg WebDriverWait(driver, 10).until( EC.presence_of_element_located((By.ID, “welcome”)) ) assert “testuser” in welcome_msg.text def test_invalid_login(driver): 测试无效密码登录 driver.get(“https://example.com/login”) driver.find_element(By.ID, “username”).send_keys(“testuser”) driver.find_element(By.ID, “password”).send_keys(“wrongpass”) driver.find_element(By.ID, “loginBtn”).click() error_msg WebDriverWait(driver, 5).until( EC.visibility_of_element_located((By.CLASS_NAME, “error”)) ) assert “密码错误” in error_msg.text运行测试在命令行进入项目目录执行pytest test_login.py -v。pytest会自动发现以test_开头的函数并执行。7.2 Page Object Model (POM)页面对象设计模式这是UI自动化测试中最重要的设计模式没有之一。它的核心思想是将页面定位和操作与测试逻辑分离。Page类封装一个页面的所有元素定位器和在这个页面上的操作如输入、点击。TestCase测试用例类调用Page对象提供的方法来完成业务流并进行断言。好处高复用性元素定位逻辑只写一次所有测试用例共用。易维护性当页面UI变化时只需修改对应的Page类无需修改大量测试用例。可读性强测试用例读起来像自然语言清晰表达业务意图。POM示例# pages/login_page.py from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC class LoginPage: def __init__(self, driver): self.driver driver self.wait WebDriverWait(driver, 10) # 定位器 (Locators) USERNAME_INPUT (By.ID, “username”) PASSWORD_INPUT (By.ID, “password”) LOGIN_BUTTON (By.ID, “loginBtn”) ERROR_MESSAGE (By.CLASS_NAME, “error”) WELCOME_MESSAGE (By.ID, “welcome”) # 页面操作 (Actions) def enter_username(self, username): element self.wait.until(EC.element_to_be_clickable(self.USERNAME_INPUT)) element.clear() element.send_keys(username) return self # 支持链式调用 def enter_password(self, password): self.driver.find_element(*self.PASSWORD_INPUT).send_keys(password) return self def click_login(self): self.driver.find_element(*self.LOGIN_BUTTON).click() def get_error_text(self): element self.wait.until(EC.visibility_of_element_located(self.ERROR_MESSAGE)) return element.text def get_welcome_text(self): element self.wait.until(EC.visibility_of_element_located(self.WELCOME_MESSAGE)) return element.text # tests/test_login_pom.py import pytest from pages.login_page import LoginPage def test_login_with_pom(driver): login_page LoginPage(driver) driver.get(“https://example.com/login”) # 测试用例逻辑非常清晰 login_page.enter_username(“testuser”).enter_password(“securepass”).click_login() welcome_text login_page.get_welcome_text() assert “testuser” in welcome_text7.3 配置管理、日志与报告配置管理使用config.ini、YAML或JSON文件来管理环境URL、浏览器类型、超时时间、用户凭证等。使用pytest的addoption钩子或conftest.py来读取配置。日志使用Python的logging模块记录脚本执行的关键步骤和错误信息便于排查问题。报告pytest可以生成多种格式的报告如pytest-html插件可以生成美观的HTML报告。pip install pytest-html pytest test_login.py --htmlreport.html --self-contained-html8. 常见问题排查与性能优化实战即使遵循了最佳实践在实际运行中仍会遇到各种问题。这里记录一些高频问题的排查思路和解决技巧。8.1 元素定位失败NoSuchElementException这是最常见的问题。排查步骤确认页面已加载在定位前增加显式等待确保元素所在区域已出现。检查定位器在浏览器开发者工具F12的Console中用JavaScript验证你的定位器是否正确。例如对于CSS选择器#kw可以输入document.querySelector(‘#kw’)看是否能找到元素。是否存在iframe检查目标元素是否在iframe内如果是需要先switch_to.frame。是否为动态内容元素可能是通过Ajax异步加载的。使用等待条件presence_of_element_located或visibility_of_element_located并适当增加等待时间。页面结构是否已变更前端发布后元素的ID或Class可能改变。需要更新Page Object中的定位器。8.2 脚本运行速度慢优化等待用显式等待替代time.sleep。将超时时间设置为业务可接受的最小值。减少不必要的页面刷新如果多个操作在同一页面不要频繁使用driver.get()或driver.refresh()。使用无头模式Headless在不需要观察UI的CI/CD环境中使用无头模式可以节省大量渲染资源速度更快。options webdriver.ChromeOptions() options.add_argument(“--headlessnew”) # Chrome较新版本推荐使用new options.add_argument(“--disable-gpu”) driver webdriver.Chrome(optionsoptions)复用浏览器会话对于需要登录的测试可以登录一次后使用driver.get_cookies()保存cookies在后续测试中通过driver.add_cookie()复用避免每次重复登录。8.3 处理弹窗、Alert和新窗口JavaScript Alert/Confirm/Promptfrom selenium.webdriver.common.alert import Alert alert Alert(driver) print(alert.text) # 获取弹窗文本 alert.accept() # 点击“确定” # alert.dismiss() # 点击“取消” # alert.send_keys(“input text”) # 在Prompt中输入文本新窗口/标签页# 点击一个会打开新窗口的链接 driver.find_element(By.LINK_TEXT, “新窗口”).click() # 获取所有窗口句柄 all_handles driver.window_handles # 切换到新窗口最后一个通常是新打开的 driver.switch_to.window(all_handles[-1]) # 在新窗口操作... # 操作完后可以切回原窗口 driver.switch_to.window(all_handles[0])8.4 应对反爬机制与验证码Selenium脚本有时会被网站识别为自动化工具而拒绝服务。一些应对策略修改浏览器特征通过ChromeOptions添加参数移除自动化特征但请注意这可能违反某些网站的服务条款。options webdriver.ChromeOptions() options.add_experimental_option(“excludeSwitches”, [“enable-automation”]) options.add_experimental_option(‘useAutomationExtension’, False) options.add_argument(‘--disable-blink-featuresAutomationControlled’)添加用户代理User-Agent模拟真实浏览器。options.add_argument(‘user-agentMozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ...’)关于验证码这是一个硬骨头。全自动破解验证码尤其是复杂图形验证码在技术上困难且可能不合法。在测试环境中常见的做法是让开发提供万能验证码或关闭验证码。使用测试环境的专用接口绕过验证码。对于简单的数字验证码可以尝试OCR库如pytesseract但识别率不稳定。对于滑动验证码可以通过分析缺口位置用ActionChains模拟滑动但同样容易被升级的反爬策略击败。核心原则自动化测试的目的是验证自家产品的功能而不是攻击或爬取他人网站。对于验证码最务实的方法是在测试环境将其禁用或提供后门。8.5 在CI/CD中集成与并行执行将Selenium测试集成到Jenkins、GitLab CI、GitHub Actions等CI/CD工具中可以实现代码提交后自动触发测试。关键步骤在构建代理Agent上安装浏览器和对应的驱动程序或依赖Selenium Manager。使用无头模式运行测试。配置pytest命令生成JUnit XML格式的报告和HTML报告。CI工具解析XML报告判断构建成功与否并将HTML报告归档供查看。并行执行使用pytest-xdist插件可以在一台机器的多个CPU核心上并行运行测试。pip install pytest-xdist pytest test_suite/ -n auto # ‘auto’表示使用所有可用核心对于大规模测试则需要结合前面提到的Selenium Grid在多台机器上分布式并行执行。从编写第一个简单的搜索脚本到搭建基于POM设计模式、集成到CI/CD流水线的自动化测试框架Selenium的学习路径清晰而实用。它不是一个一蹴而就的工具而是一个需要不断实践、踩坑、总结才能熟练掌握的利器。记住稳定的元素定位、智能的等待机制和良好的代码结构POM是写出健壮、可维护的UI自动化测试脚本的三大支柱。在实际项目中从小处着手先自动化一两个核心业务流程验证价值再逐步扩展覆盖范围是成功率最高的实施策略。

相关新闻

ICM-42688-P与PIC18F2680在运动控制与传感融合中的应用

FOC无刷电机控制方案：高精度与高效率的实现

构建泰拉瑞亚模组生态：tModLoader深度开发指南

最新新闻

搞定异构物联与视频微服务：基于 Docker + GB28181/RTSP 双协议聚合的边缘计算 AI 视频管理平台架构实战与源码交付

HTML 的 ＜col＞ 元素

TranslucentTB深度解析：专业级Windows任务栏透明化方案全攻略

软考机考全流程压力测试实录（模拟断网/断电/进程崩溃）：20年命题组技术顾问独家复盘，仅开放给考前最后一次模考人群

基于LARA-R6001与PIC18F86J16的VoLTE通信平台开发指南

家用高压豆浆机推荐哪种好用？优先看材质还是功能

日新闻

Selenium元素定位全解析：从八大方法到实战策略

BurpSuite Cluster Bomb模式深度避坑指南：从原理到实战的完整爆破策略

UnblockNeteaseMusic终极教程：3分钟解锁网易云音乐灰色歌曲的完整方案

周新闻

管理者的六个层次

华为OD机试2025C卷-座位调整[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

CrabCode v1.0.7与v1.0.8 更新速览！

月新闻

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

HTML 的＜col＞元素