Enable javascript in your browser for better experience. Need to know to enable it? Go here.
第33期 |十一月2025

工具

订阅
  • 工具

    采纳 试验 评估 暂缓 采纳 试验 评估 暂缓
  • 新的
  • 移进/移出
  • 没有变化

工具

采纳 ?

  • 57. ClickHouse

    ClickHouse 是一个开源、分布式的列式在线分析处理(OLAP)数据库,适用于实时分析。它已经发展成为高性能、可扩展的数据分析引擎,能够处理大规模数据分析任务。其增量物化视图、高效查询引擎和强大的数据压缩功能,使其非常适合交互式查询。内置的近似聚合函数支持在精度与性能之间折衷,特别适用于高基数分析。S3 存储引擎和 MergeTree 的加入,实现了存储与计算的分离,可通过 S3 兼容存储托管 ClickHouse 表。我们还发现 ClickHouse 是 OpenTelemetry 数据以及如 Sentry 这类崩溃分析工具的优秀后端选择。对于希望获得快速、开源分析引擎的团队来说,ClickHouse 是极佳选择。

  • 58. NeMo Guardrails

    NeMo Guardrails 是 NVIDIA 的开源工具包,可以轻松为基于 LLM 的对话应用添加可编程的安全和控制机制。它通过定义和执行行为规则来确保输出保持安全、切题和合规。开发者使用 Colang(一种专用语言)来创建灵活的对话流程和管理对话,执行预定义的路径和操作程序。NeMo Guardrails 还提供了异步优先的 API 以获得更好的性能,并支持内容安全、安全性和输入输出审核的保障措施。我们看到,从简单的聊天机器人到复杂的代理工作流,各个团队都在稳步采用 NeMo Guardrails 构建各种类型的应用程序。随着其功能集的扩展和对常见 LLM 漏洞的成熟覆盖,我们决定将 NeMo Guardrails 移至采用评级。

  • 59. pnpm

    自上次技术雷达发布以来,我们持续收到团队对 pnpm 的积极反馈。pnpm 是一个 Node.js 的包管理器,相比其他替代方案,它在速度和磁盘空间效率方面都有显著提升。它通过将多个项目的 node_modules 文件夹中重复的包以硬链接(hard link)的方式指向磁盘上的单一位置,从而节省空间;同时还支持基于文件级的增量优化,进一步提升性能。由于 pnpm 能够在几乎没有兼容性问题的情况下提供更快的反馈循环,它已成为我们在 Node.js 包管理中的默认选择。

  • 60. Pydantic

    Pydantic 是一个 Python 库,使用标准类型提示来定义数据模型并在运行时强制执行数据模式。最初,Python 添加类型注解是为了静态分析,但其日益多样化的用途已扩展到运行时验证。基于高性能的 Rust 核心,Pydantic 提供高效的数据验证、解析和序列化。 虽然 Pydantic 在 Web API 开发中最为人知,但它在 LLM 应用中也变得不可或缺。我们通常使用 从LLMs获取结构化输出 技术来管理 LLM 的不确定性。通过定义严格的数据模式,它为模型输出的不确定性提供了安全网——将自由格式的文本响应转换为确定性、类型安全的 Python 对象(例如 JSON)。这种方法通常通过 Pydantic AILangChain 实现,将潜在脆弱的 LLM 交互转化为可靠的、机器可读的数据契约。我们的团队已成功在生产环境中使用 Pydantic 从非结构化文档中提取结构化表示,确保输出符合有效结构。鉴于其成熟度、性能和可靠性,Pydantic 现在是我们生产级 Python AI 应用的默认选择。

试验 ?

  • 61. AI Design Reviewer

    AI Design Reviewer 是一个 Figma 插件,用于进行设计审计或启发式评估,并收集对现有或新设计的可操作反馈。其审计涵盖 UX 批评、UI 不一致性、可访问性差距、内容质量和边缘案例场景。除了识别问题外,它还提供领域感知的建议,帮助团队建立共享的设计词汇和设计选择背后的理由。我们的团队使用 AI Design Reviewer 来分析遗留设计——识别要保留的积极体验和要解决的负面体验——这为重新设计的 UX 目标提供了信息。它还可以作为同行评审的替代品,在开发交接之前为新设计提供早期反馈。

  • 62. Barman

    Barman(Backup and Recovery Manager)是一个用于管理 PostgreSQL 服务器备份和灾难恢复的开源工具。它支持完整的灾难恢复流程,通过多种方法简化物理备份的创建,将备份组织到一个全面的目录中,并支持将备份恢复到运行中的服务器,同时具备时间点恢复功能。我们发现 Barman 功能强大且易于使用,并对迁移活动中时间点恢复操作的速度印象深刻。它也适用于定期备份,能够处理复杂的混合调度和保留配置。

  • 63. Claude Code

    Anthropic 的 Claude Code 是一款具备智能体特性的 AI 编码工具,它为规划和执行复杂的多步骤工作流提供了自然语言接口和智能体执行模型。自发布不到一年以来,它已经在 Thoughtworks 内部和外部的开发者中被广泛采用,因此我们将其纳入 Trial 阶段。基于命令行的编码智能体,如 OpenAI 的 Codex CLI、Google 的 Gemini CLI 以及开源项目 OpenCode 相继推出,而基于 IDE 的助手,如 CursorWindsurfGitHub Copilot 也纷纷加入了智能体模式。即便如此,Claude Code 仍然深受欢迎。我们观察到,团队不仅使用它来编写和修改代码,还将其作为通用型 AI 智能体,用于管理规格说明、用户故事、配置、基础设施以及文档。 智能体式编码将开发者的关注点从“编写代码”转移到“表达意图并委派实现”。这虽然能够加快开发周期,但也可能导致对 AI 生成代码的自满,从而产生人类和 AI 智能体都更难维护和演化的代码。因此,团队必须严格管理 Claude Code 的使用方式,可采用诸如上下文工程精选共享指令以及可能的编码智能体团队等技术手段来实现。

  • 64. Cleanlab

    在以数据为中心的 AI 范式中,改善数据集质量通常比调整模型本身带来更大的性能提升。Cleanlab 是一个开源 Python 库,旨在通过自动识别常见的数据问题来解决这一挑战——如存在于文本、图像、表格和音频数据集之中错误标签、异常值和重复项。基于置信学习原理构建,Cleanlab 利用模型预测的概率来估计标签噪声并量化数据质量。 这种与模型无关的方法使开发者能够诊断和纠正数据集错误,然后重新训练模型以提高健壮性和准确性。我们的团队在生产环境中成功使用了 Cleanlab,确认了它在实际环境中的有效性。在 AI 工程项目中,我们推荐它作为促进数据标准化和改善数据集质量的有价值的工具。

  • 65. Context7

    Context7 是一个 MCP 服务器,旨在解决 AI 生成代码中的不准确性问题。鉴于 LLM 依赖于过时的训练数据,Context7 通过直接从框架的源代码库中提取最新的文档和可运行的代码示例,并在提示时将其注入到 LLM 的上下文窗口中,从而确保 AI 生成的代码对于项目所使用的库和框架而言是准确、最新且版本特定的。根据我们的经验,Context7 极大地减少了代码幻觉和对过时训练数据的依赖。您可以将其配置到 Claude Code、Cursor 或 VS Code 等 AI 代码编辑器中,用于生成、重构或调试依赖于特定框架的代码。

  • 66. 数据契约 CLI

    数据契约 CLI 是一个专为使用 数据契约 规范而设计开源命令行工具。它帮助你创建和编辑数据契约,更重要的是,它让你能够根据契约验证数据,这对于确保数据产品的完整性和质量至关重要。 该 CLI 为多种模式定义(Avro、SQL DDL、开放数据契约标准 等)提供广泛支持,并且可以比较不同的契约版本,从而立即检测到重大变更。我们发现它在数据网格领域特别有用,可以通过 CI/CD 集成在数据产品之间实现契约治理。这种方法减少了人为错误,并确保跨服务数据交换中的数据质量、完整性和兼容性。

  • 67. Databricks Assistant

    Databricks Assistant 是一款直接集成于 Databricks 平台的 AI 驱动对话式工具,为数据专业人员充当上下文相关的结对编程助手。与通用代码助手不同,Databricks Assistant 能原生理解 Databricks 环境和数据上下文,包括来自 Unity Catalog 的元数据。其能力不仅限于生成代码片段,还能编写复杂的多步 SQL 和 Python 查询,诊断错误,并提供详尽且针对工作空间的解释说明。对于已选用 Databricks 生态的组织,该助手有助于提升生产效率,降低复杂数据任务的入门门槛。

  • 68. Hoppscotch

    Hoppscotch 是一个轻量级开源工具,用于 API 开发、调试、测试和共享。它支持多种协议,包括 HTTP、GraphQL 和 WebSocket,并提供适用于 Web、桌面和 CLI 环境的跨平台客户端。 虽然 API 工具领域竞争激烈,有 PostmanInsomniaBruno 等替代方案,Hoppscotch 以其轻量体积和注重隐私的设计脱颖而出。它不收集分析数据,采用本地优先存储,并支持自托管。对于希望以直观方式共享 API 脚本,同时保持数据隐私的组织来说,这是一个很好的选择。

  • 69. NVIDIA DCGM Exporter

    NVIDIA DCGM Exporter 是一个开源工具,帮助团队在大规模分布式 GPU 训练中进行监控。它将 NVIDIA 数据中心 GPU 管理器(DCGM) 的专有遥测数据转换为兼容标准监控系统的开放格式。Exporter 暴露关键的实时指标——包括 GPU 利用率、温度、功耗和 ECC 错误计数——涵盖 GPU 和主机服务器。这种可见性对于微调自定义 LLM 或运行长时间、高强度 GPU 训练作业的组织至关重要。滞后效应——即单个缓慢工作节点限制整个流程——可能降低吞吐量超过 10%,并浪费多达 45% 的分配 GPU 小时。DCGM Exporter 为云原生大规模环境设计,可与 PrometheusGrafana 无缝集成,帮助确保每个 GPU 在最佳性能范围内运行。

  • 70. RelationalAI

    当大量多样化的数据被引入 Snowflake 时,其中固有的关系和隐含规则可能会被掩盖。作为一款 Snowflake 原生应用,RelationalAI 使团队能够构建复杂模型,以捕捉有意义的概念、定义核心业务实体,并将复杂逻辑直接嵌入到 Snowflake 表之上。其强大的图推理器允许用户基于这些模型创建、分析和可视化关系知识图谱。内置的算法有助于探索图结构并揭示隐藏模式。对于管理海量、快速变化数据集的组织而言,构建知识图谱对于主动监控以及生成更丰富、更可操作的洞见至关重要。

  • 71. UX Pilot

    UX Pilot 是一款支持多阶段UX 设计流程的 AI 工具——从线框图,到高保真视觉设计,以及设计评审。它可接受文本或图像输入,并能够自动生成界面、流程和布局。其 Autoflow 功能可创建用户流程过渡,而 Deep Design 则生成更丰富、更细致的输出。UX Pilot 还提供 Figma 插件,可将生成的设计导出以在标准设计工具中进行精细化处理。 我们的团队曾使用 UX Pilot 进行创意和灵感探索,在 Crazy 8’s 练习 中生成多种方案,并将项目故事列表转化为产品愿景板和Epic级别的设计概念。像 UX Pilot 这样的工具还使非设计人员(如产品经理)能够 快速创建原型 并收集早期利益相关者反馈,这在 AI 辅助设计工作流中正成为一种日益增长的趋势。

  • 72. v0

    v0 自上次在 Radar 中亮相以来已有所发展。它现在包含设计模式,进一步降低了产品经理创建和调整 自助式 UI 原型 的门槛。最新版本引入了内部模型,具有大上下文窗口和多模态能力,使 v0 能够从文本和视觉输入生成并改进 UI。另一个值得注意的新增功能是其代理模式,允许系统将更复杂的工作拆解,并为每个任务选择合适的模型。然而,这项功能仍处于早期阶段,目前收到的反馈褒贬不一。

评估 ?

  • 73. Augment Code

    Augment Code 是一款 AI 编码助手,可在大型代码库中提供深度、具备上下文感知能力的开发支持。它的亮点在于先进的上下文工程,即使在代码频繁变更时,也能实现快速的代码索引更新与高效检索。Augment 支持包括 Claude Sonnet 4 和 4.5GPT-5 在内的大型模型,可集成 GitHub、Jira、Confluence,并支持用于外部工具互操作性的 模型上下文协议(MCP)。它为复杂的代码库变更(如重构、依赖升级、架构更新等)提供逐步指导,并具备能反映项目特定依赖关系的个性化内联补全功能。Augment 还支持团队直接在 Slack 内查询和共享代码洞察,促进协作。

  • 74. Azure AI 文档智能

    Azure AI 文档智能(前称 Form Recognizer)可以从非结构化文档中提取文本、表格和键值对,并将其转换为结构化数据。它使用预训练的深度学习模型来理解布局和语义,并且可以通过无代码界面训练自定义模型以处理特定格式。不过,在某些情况下,高级用户可能需要自定义的微调界面。 我们的一个团队报告称,ADI 显著减少了人工数据录入,提高了数据准确性并加快了报告速度,从而推动了更快速的数据驱动决策。与 Amazon TextractGoogle Document AI 类似,它提供企业级文档处理能力,并具有强大的布局理解能力。一种新兴的开源替代方案是 IBM 的 Docling,它提供更灵活、以代码为中心的结构化数据提取方法。与传统 OCR 工具相比,ADI 不仅捕获文本,还捕获结构和关系,使其易于集成到下游数据管道中。不过,我们也观察到在同步用户工作流中嵌入时偶尔会有延迟,因此建议主要用于异步处理。

  • 75. Docling

    Docling 是一个开源的 Python 和 TypeScript 库,用于对非结构化数据进行高级文档处理。它解决了常被忽视的“最后一公里”问题,即将真实世界的文档——如 PDF 和 PowerPoint——转换为干净、可机器读取的格式。与传统提取器不同,Docling 使用基于计算机视觉的方法来解析文档的布局和语义结构,使其输出对于 增强检索生成(RAG) 流水线特别有价值。它可将复杂文档转换为结构化格式,如 JSON 或 Markdown,并支持 LLM 的结构化输出 等技术。这与 ColPali 不同,后者直接将页面图像输入视觉-语言模型以进行检索。 Docling 的开源特性和基于 Python 的核心(建立在自定义的 Pydantic 数据模型上)为团队提供了灵活的自托管替代方案,相比于 Azure 文档智能Amazon TextractGoogle Document AI 等专有云工具更具自主性。该项目由 IBM Research 支持,开发快速,并提供可即插即用的架构,可与 LangGraph 等其他框架集成,非常值得构建生产级 AI 数据管道的团队进行评估。

  • 76. E2B

    E2B 是一个开源工具,可在云端的安全隔离沙箱环境中运行 AI 自动生成的代码。这些沙箱基于 Firecracker 微虚拟机构建,支持智能体安全地执行代码、分析数据、开展研究或操作虚拟机。这样,你可以构建与部署企业级 AI 智能体,并完全控制和保障其运行环境的安全性。

  • 77. Helix 编辑器

    近年来,简单文本编辑器有所回潮,试图取代命令行中的热门选择 Vim。Helix 就是其中之一,在拥挤的市场中与 Neovim 以及最近的 Kakoune 竞争。Helix 自称为“后现代文本编辑器”,略带玩笑意味,具备多光标、Tree-sitter 支持以及集成的语言服务器协议(LSP)支持,这也是最初吸引我们注意的地方。Helix 正在积极开发中,并计划引入插件系统。总体而言,它是一款轻量级的模态编辑器,对 Vim 用户来说感觉熟悉,同时增加了一些现代化便利功能。

  • 78. Kueue

    Kueue 是一个 Kubernetes 原生的作业队列控制器,用于管理配额和资源消耗。它提供了处理不同优先级和资源需求的 Kubernetes 工作负载的 API,充当作业级管理器,决定何时允许或驱逐作业。Kueue 旨在实现高效的资源管理、作业优先级排序和高级调度,帮助优化 Kubernetes 环境中的工作负载执行,尤其适用于使用 Kubeflow 等工具的机器学习工作负载。它与 cluster-autoscaler 和 kube-scheduler 协同工作,而非替代它们,重点根据作业顺序、配额、优先级和拓扑感知进行作业准入。作为 Kubernetes 特别兴趣组(SIG)生态系统的一部分,Kueue 遵循其开发标准。

  • 79. mcp-scan

    MCP-Scan 是一种为 Model Context Protocol (MCP) 服务器设计的安全扫描器,拥有扫描和代理两种运行模式。在扫描模式下,它分析配置和工具描述以检测已知漏洞,例如提示词注入、工具投毒有害流分析。在代理模式下,MCP-Scan 作为智能体系统与 MCP 服务器之间的桥梁,持续监控运行时流量,并可强制执行自定义安全规则和防护措施,包括工具调用校验、敏感信息检测和数据流约束。该工具为智能体系统提供了主动型安全防线,即使恶意提示被接受,也能确保智能体无法执行有害操作。MCP-Scan 是为新兴的智能体系统安全领域量身打造的解决方案。

  • 80. oRPC

    oRPC (OpenAPI Remote Procedure Call) 在 TypeScript 中提供端到端的类型安全 API,同时完全遵循 OpenAPI 规范。它可以自动生成完整的 OpenAPI 规范,简化集成和文档。我们发现 oRPC 特别适用于集成。虽然 tRPCElysiaJS 等替代方案通常需要采用新的框架来获得类型安全性,但 oRPC 可以无缝集成现有的 Node.js 框架,包括 Express, Fastify, HonoNext.js。这种灵活性使其成为希望采用端到端类型安全性到现有 API 的团队的一个很好的选择,而无需破坏性的重构。

  • 81. Power user for dbt

    Power user for dbt 是一个 Visual Studio Code 扩展,能够直接集成 dbtdbt Cloud 环境。dbt 一直是我们最喜欢的工具之一,因此任何能够提升其易用性的工具都值得我们欢迎。此前,开发者需要依赖多种工具来验证 SQL 代码或在 IDE 外检查模型血缘关系。而使用该扩展后,这些功能已内置于 VS Code 中,提供代码自动补全、实时查询结果以及可视化的模型和列血缘关系。最后一项功能使在模型之间导航变得轻松。我们的团队报告称,该插件减少了流水线错误,并提升了整体开发体验。如果你使用 dbt,我们强烈建议试用这个工具。

  • 82. Serena

    Serena 是一个强大的编程工具包,为像 Claude Code 这样的编程智能体提供类 IDE 功能,用于语义化代码检索和编辑。通过在符号层面操作并理解代码的关系结构,Serena 大幅提升了 token 的使用效率。编程智能体无需读取整个文件或依赖粗糙的字符串替换,而可以使用精准的 Serena 工具,例如 find_symbol、find_referencing_symbols 和 insert_after_symbol 来定位和编辑代码。虽然在小型项目中效果有限,但随着代码库增长,这种效率提升极具价值。

  • 83. SweetPad

    SweetPad 扩展让开发者能够在 Apple 平台使用 VS Code 或 Cursor 完成整个 Swift 应用的开发生命周期。它通过集成 xcodebuild、xcode-build-server 和 swift-format 等核心工具,免去了频繁切换到 Xcode 的需求。开发者现在可以直接在 IDE 内构建、运行、调试 iOS、macOS 和 watchOS 的 Swift 应用,同时还可管理模拟器并在无需打开 Xcode 的情况下部署到设备。

  • 84. Tape/Z(用于 Z/OS 的汇编程序分析工具集)

    Tape/Z(用于 Z/OS 的汇编程序分析工具集) 是一个专为主机 HLASM(高级汇编)代码分析而开发的工具集,由 Thoughtworks 工程师创建。它具备解析、控制流图构建、依赖追踪和流程图可视化等功能。长期以来,主机领域一直缺乏开源、社区驱动的工具,大多数可选方案都属于专有产品或绑定于特定厂商生态。Tape/Z 通过提供易于访问、可脚本化的分析能力,正在弥补这一空白。与之配套的还有 COBOL REKT——我们多次在客户项目中使用的一款 COBOL 工具,这两者标志着主机系统迈向现代化、开发者友好工具的积极进展。

暂缓 ?

无异常点

是不是没有找到你预期的内容?

 

每一期的雷达都会收录我们过去六个月所发现的亮点(blip)。您想寻找的内容,我们可能已经在之前的雷达中有所涵盖。有时,仅仅是因为可讨论的内容太多,我们不得不有所取舍。某个亮点之所以缺失,也可能是因为雷达反映的是我们的实际经验,而非基于全面的市场分析。

下载

 

 

 

English | Español | Português | 中文

订阅科技雷达新闻简报

 

订阅

查看存档并阅读往期内容