Python Selenium常用语法汇总(包含XPath语法)

Python 的 Selenium 库是一个强大的工具,用于自动化浏览器操作,常用于网页测试、爬虫等场景。下面是一些常用的 Selenium 语法和操作方法总结:

1. 安装 Selenium 和 WebDriver

首先,你需要安装 Selenium 库以及对应的 WebDriver。WebDriver 是一个浏览器的驱动程序,它允许 Selenium 控制浏览器。

pip install selenium

对于不同的浏览器,需要下载相应的 WebDriver:

  • Chrome: ChromeDriver
  • Firefox: GeckoDriver
  • Edge: EdgeDriver

2. 启动一个浏览器会话

from selenium import webdriver

driver = webdriver.Chrome('/path/to/chromedriver')  # 指定 WebDriver 的路径
driver.get('http://www.example.com')  # 打开网页

3. 元素定位

Selenium 提供多种方法来定位页面元素:

# 通过 ID 定位
element = driver.find_element_by_id('id')

# 通过名称定位
element = driver.find_element_by_name('name')

# 通过类名定位
elements = driver.find_elements_by_class_name('class_name')

# 通过标签名定位
elements = driver.find_elements_by_tag_name('tag_name')

# 通过链接文本完全匹配定位
element = driver.find_element_by_link_text('link_text')

# 通过链接文本部分匹配定位
element = driver.find_element_by_partial_link_text('partial_link_text')

# 通过 XPath 定位
element = driver.find_element_by_xpath('//div[@class="myclass"]')

# 通过 CSS 选择器定位
element = driver.find_element_by_css_selector('div.myclass')

4. 元素交互

# 输入文本
element.send_keys('some text')

# 点击元素
element.click()

# 清除文本输入框的内容
element.clear()

5. 等待 (Implicit Wait 和 Explicit Wait)

# 隐式等待
driver.implicitly_wait(10)  # 等待 10 秒,直到元素可用

# 显式等待
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

element = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.ID, 'id'))
)

6. 执行 JavaScript

driver.execute_script('window.scrollTo(0, document.body.scrollHeight);')  # 滚动到页面底部

7. 管理窗口和标签页

# 获取当前窗口句柄
current_window = driver.current_window_handle

# 切换到新窗口
for handle in driver.window_handles:
    if handle != current_window:
        driver.switch_to.window(handle)

# 关闭当前窗口
driver.close()

# 关闭浏览器
driver.quit()

8. 截屏

driver.save_screenshot('screenshot.png')

XPath语法详解

XPath(XML Path Language)是一种在 XML 和 HTML 文档中查找信息的语言。Selenium 支持使用 XPath 来定位页面元素,这使得元素定位更加灵活和强大。以下是 XPath 的常用语法和一些示例,这些可以帮助你更有效地在使用 Selenium 时定位元素。

基本语法

  1. 选择节点

    • / 从根节点选取。
    • // 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
    • . 选取当前节点。
    • .. 选取当前节点的父节点。
  2. 谓词(Predicates)

    • [] 用来查找特定的节点或者包含某个特定值的节点。
    • 例如://input[@type='text'] 选取所有 type 属性为 textinput 元素。
  3. 通配符

    • * 匹配任何元素节点。
    • 例如://* 选取文档中的所有元素。
  4. 选择多个路径

    • | 用于合并两个或多个 XPath 查询。
    • 例如://div | //p 选取所有 divp 元素。

常用函数

  • text() 获取节点的文本内容。
    • 例如://a[text()='点击这里'] 选取文本内容为“点击这里”的 a 元素。
  • contains() 判断某个属性或文本是否包含某个字符串。
    • 例如://div[contains(@class, 'important')] 选取类属性包含 importantdiv 元素。
  • starts-with() 判断某个属性或文本是否以某个字符串开始。
    • 例如://input[starts-with(@id, 'login')] 选取其 id 属性以 login 开头的 input 元素。
  • last() 选择最后一个元素。
    • 例如://(//a)[last()] 选取最后一个 a 元素。
  • position() 返回节点在其父节点中的位置。
    • 例如://li[position()=3] 选取第三个 li 元素。

高级用法

  • 轴(Axes)

    • ancestor 选取当前节点的所有祖先元素(父、祖父等)。
    • descendant 选取当前节点的所有后代元素(子、孙等)。
    • following 选取文档中当前节点的结束标签之后的所有节点。
    • preceding 选取文档中当前节点的开始标签之前的所有节点。

    例如:

    • //div/ancestor::form 选取所有包含 divform 祖先元素。
    • //div/following::input 选取所有在文档中出现在 div 元素之后的 input 元素。

通过理解和运用这些 XPath 表达式,你可以更加精确地定位 HTML 文档中的元素,这对于使用 Selenium 进行web自动化测试和数据抓取是非常有用的。


其他

CentOS安装Selenium教程

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/886114.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

.scl文件导入

.SCL的文件怎么导入博图-SIMATICS7-1200系列-找答案-西门子中国 从源生成块

MongoDB微服务部署

一、安装MongoDB 1.在linux中拉去MongoDB镜像文件 docker pull mongo:4.4.18 2. 2.创建数据挂载目录 linux命令创建 命令创建目录: mkdir -p /usr/local/docker/mongodb/data 可以在sshclient工具查看是否创建成功。 进入moogodb目录,给data赋予权限777 cd …

IT新秀系列:Erlang语言的兴起原因分析和前景观望

Erlang语言的兴起原因 Erlang 是一种通用并发编程语言和运行环境,最早由瑞典电信公司爱立信(Ericsson)在1986年开发,旨在处理高度并发、分布式和容错系统。Erlang 的主要设计目标是创建一个能够在电信系统中实现高可用性和实时性能…

Linux:LCD驱动开发

目录 1.不同接口的LCD硬件操作原理 应用工程师眼中看到的LCD 1.1像素的颜色怎么表示 ​编辑 1.2怎么把颜色发给LCD 驱动工程师眼中看到的LCD 统一的LCD硬件模型 8080接口 TFTRGB接口 什么是MIPI Framebuffer驱动程序框架 怎么编写Framebuffer驱动框架 硬件LCD时序分析…

【经典机器学习算法】谱聚类算法及其实现(python)

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀深度学习_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光 目录 1. 前言 2. 前…

图文深入理解Oracle Network配置管理(一)

List item 本篇图文深入介绍Oracle Network配置管理。 Oracle Network概述 Oracle Net 服务 Oracle Net 监听程序 <oracle_home>/network/admin/listener.ora <oracle_home>/network/admin/sqlnet.ora建立网络连接 要建立客户机或中间层连接&#xff0c;Oracle…

【C++】C++基础

目录 一. C关键字(C98) 二、C的第一个程序 三、命名空间 3.1.namespace的价值 3.2.namespace的定义 3.2.命名空间使用 总结&#xff1a;在项目当中第一、第二种方法搭配使用&#xff0c;第三种冲突风险非常大&#xff0c;仅适合练习使用。 四、C输入&输出 五、缺省…

DRF笔记

参考资料 http://www.yuan316.com/post/DRF/ 全站最牛逼的DRF&#xff08;Django-restframework&#xff09;&#xff0c;没有之一&#xff01; 零、创建django项目 项目每次处相当于执行命令&#xff1a;django-admin startproject xxx 应用名称处&#xff1a;python manage.…

调用智谱AI,面试小助手Flask简单示例

文章目录 1.接入AI获取API密钥Python代码 2.小助手的实现流程3.Flask应用示例Python文件.pyindex.html运行Flask应用地址栏输入 http://localhost:5000/ 1.接入AI 获取API密钥 在智谱AI的官方网站上注册&#xff0c;右上角点击API密钥&#xff0c;新建并复制一个 API Key&…

奔驰EQS450suv升级增强AR抬头显示HUD案例分享

以下是奔驰 EQS450 SUV 升级增强版 AR 抬头显示的一般改装案例步骤及相关信息&#xff1a; 配件&#xff1a;通常包括显示屏、仪表模块、饰板等。 安装步骤&#xff1a; 1. 拆下中控的仪表。 2. 在仪表上预留位置切割出合适的孔位&#xff0c;用于安装显示器。 3. 将显示器…

【leetcode】 45.跳跃游戏 ||

如果我们「贪心」地进行正向查找&#xff0c;每次找到可到达的最远位置&#xff0c;就可以在线性时间内得到最少的跳跃次数。 例如&#xff0c;对于数组 [2,3,1,2,4,2,3]&#xff0c;初始位置是下标 0&#xff0c;从下标 0 出发&#xff0c;最远可到达下标 2。下标 0 可到达的…

Unity XR 环境检测

需求&#xff1a; 检测环境是XR还是手机 代码&#xff1a; using UnityEngine.XR;public class EnvmentUtility {/// <summary>/// 是否是XR环境/// </summary>/// <returns>如果是XR&#xff0c;返回true&#xff0c;否则false</returns>public sta…

聊聊晶圆厂中的常见口语(1)

知识星球里的学员问&#xff1a;半导体公司的工程师总爱用一些英语代替中文&#xff0c;比如care,show&#xff0c;用这种简单的单词代替中文&#xff0c;能不能给我们总结工程师常用的英语单词&#xff0c;比较口语化的&#xff01; 为什么晶圆厂会用很多英文口语&#xff1f…

CompletableFuture常用方法

一、获得结果和触发计算 1.获取结果 &#xff08;1&#xff09;public T get() public class CompletableFutureAPIDemo{public static void main(String[] args) throws ExecutionException, InterruptedException{CompletableFuture<String> completableFuture Com…

c++进阶之多态讲解

这篇文章和大家一起学习一下c中的多态 多态的概念 多态的概念&#xff1a;通俗来讲&#xff0c;就是多种形态。多态分为编译时多态(静态多态)和运⾏时多态(动态多态)。 什么是静态多态 前⾯讲的函数重载和函数模板&#xff0c;它们传不同类型的参数就可以调用不同的函数&…

vue3学习记录-computed

vue3学习记录-computed 1.为什么要用computed2.使用方法2.1 基本实例2.2 可写计算属性 1.为什么要用computed 写个购物车的案例 <script setup> import { ref, reactive,computed } from "vue" const tableData reactive([{ name: 商品1, price: 10, num: 1…

Labview helper

IMAQ Advanced Setup Learn Geometric Pattern 2 VI 参数说明Curve Extraction Mode (0)指定VI如何识别图像中的曲线。如果您希望VI不对图像中对象的均匀性或图像背景做出任何假设&#xff0c;请将此选项设置为正常。如果您希望VI假定图像中的对象或图像背景由均匀的像素值组成…

《蓝桥杯算法入门》(C/C++、Java、Python三个版本)24年10月出版

推荐&#xff1a;《算法竞赛》&#xff0c;算法竞赛大全书&#xff0c;网购&#xff1a;京东 天猫  当当 文章目录 《蓝桥杯算法入门》内容简介本书读者对象作者简介联系与交流《蓝桥杯算法入门 C/C》版目录 《蓝桥杯算法入门 Java》版目录 《蓝桥杯算法入门 Python》版目录 …

【Python】Uvicorn:Python 异步 ASGI 服务器详解

Uvicorn 是一个为 Python 设计的 ASGI&#xff08;异步服务器网关接口&#xff09;Web 服务器。它填补了 Python 在异步框架中缺乏一个最小化低层次服务器/应用接口的空白。Uvicorn 支持 HTTP/1.1 和 WebSockets&#xff0c;是构建现代异步Web应用的强大工具。 ⭕️宇宙起点 &a…

找到字符串中第一个匹配项的下标(c语言)

1./给你两个字符串 haystack 和 needle &#xff0c;请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标&#xff08;下标从 0 开始&#xff09;。如果 needle 不是 haystack 的一部分&#xff0c;则返回 -1 。 //示例 1&#xff1a; //输入&#xff1a;haystac…