技术雷达

AI 驱动的 UI 测试

更新于 : Nov 05, 2025

Nov 2025

评估

在上一期技术雷达中，AI 驱动的 UI 测试 主要集中于探索性测试，我们当时指出 LLM 的非确定性可能会引入不稳定性。随着 MCP 的兴起，我们看到主流的 UI 测试框架如 Playwright 和 Selenium 正在引入各自的 MCP 服务器（playwright-mcp、mcp-selenium）。这些服务器通过其原生技术提供可靠的浏览器自动化，使编码助手能够在 Playwright 或 Selenium 中生成更可靠的 UI 测试。尽管 AI 驱动的 UI 测试仍是一个快速演进的领域——例如最新版本的 Playwright 已引入 Playwright Agents——但我们对这些进展感到振奋，并期待看到更多实践经验与落地指南的出现。

Apr 2025

评估

AI 在软件团队中的应用正逐步超越单纯的代码生成，新的技术正在涌现。其中， AI 驱动的 UI 测试 正受到越来越多的关注，它利用 LLM 的能力来理解图形用户界面（GUI）。目前，该领域主要有几种不同的实现方式。一种方法是使用针对 UI 快照处理进行微调的多模态 LLM，这类工具允许测试脚本以自然语言编写，并能自主导航应用程序。例如，QA.tech 和 LambdaTest 的 KaneAI 就属于这一类别。另一种方法，则是像 Browser Use 这样，结合多模态基础模型与 Playwright，通过对网页结构的深入理解进行测试，而不是依赖于特定微调的模型。

在测试策略中引入 AI 驱动的 UI 测试时，需要考虑其价值所在。这些方法可以补充人工探索性测试。尽管 LLM 的非确定性特性可能会导致测试结果的不稳定性，但它的模糊匹配能力也可能成为优势，尤其适用于缺少选择器的遗留应用程序或经常变更标签和点击路径的应用。

发布于 : Apr 02, 2025