Tools
Adopt
-
51. Renovate
Renovate has become the tool of choice for many of our teams looking to take a proactive approach to dependency version management. While Dependabot remains a safe default choice for GitHub-hosted repositories, we continue to recommend evaluating Renovate as a more comprehensive and customizable solution. To maximize Renovate’s benefits, configure it to monitor and update all dependencies, including tooling, infrastructure and private or internally hosted dependencies. To reduce developer fatigue, consider automatic merging of dependency update PRs.
-
52. uv
Since the last Radar, we’ve gained more experience with uv, and feedback from teams has been overwhelmingly positive. uv is a next-generation Python package and project management tool written in Rust, with a key value proposition: it’s "extremely fast." It outperforms other Python package managers by a large margin in benchmarks, accelerating build and test cycles and significantly improving developer experience. Beyond performance, uv offers a unified toolset, effectively replacing tools like Poetry, pyenv and pipx. However, our concerns around package management tools remain: a strong ecosystem, mature community and long-term support are critical. Given that uv is relatively new, moving it to the Adopt ring is bold. That said, many data teams are eager to move away from Python’s legacy package management system, and our frontline developers consistently recommend uv as the best tool available today.
-
53. Vite
Since Vite was last mentioned in the Radar, it has gained even more traction. It’s a high-performance front-end build tool with fast hot-reloading. It’s being adopted and recommended as a default choice in many front-end frameworks, including Vue, SvelteKit and React which recently deprecated create-react-app. Vite also recently received significant investment, which led to the founding of VoidZero, an organization dedicated to Vite’s development. This investment should accelerate development and enhance the project's long-term sustainability.
Trial
-
54. Claude Sonnet
Claude Sonnet is an advanced language model that excels in coding, writing, analysis and visual processing. It's available in the browser, terminal, most major IDEs and even integrates with GitHub Copilot. As of writing, benchmarking shows it outperforms previous models with versions 3.5 and 3.7, including earlier Claude models. It's also adept at interpreting charts and extracting text from images, and it features a developer-focused experience, such as with the "Artifacts" feature in the browser UI for generating and interacting with dynamic content such as code snippets and HTML designs.
We’ve used version 3.5 of Claude Sonnet extensively in software development and found it significantly boosts productivity across various projects. It excels in greenfield projects, particularly in collaborative software design and architectural discussions. While it may be too early to call any AI model "stable" for coding assistance, Claude Sonnet is among the most reliable models we've worked with. At the time of writing, Claude 3.7 has also been released and is promising, though we’ve not yet fully tested it in production.
-
55. Cline
Cline is an open-source VSCode extension that is currently one of the strongest contenders in the space of supervised software engineering agents. It lets developers drive their implementation entirely from the Cline chat, integrating seamlessly with the IDE they already use. Key features like Plan & Act mode, transparent token usage and MCP integration help developers interact effectively with LLMs. Cline has demonstrated advanced capabilities in handling complex development tasks, especially with Claude 3.5 Sonnet. It supports large codebases, automates headless browser testing and proactively fixes bugs. Unlike cloud-based solutions, Cline enhances privacy by storing data locally. Its open-source nature not only ensures greater transparency but also enables community-driven improvements. However, developers should be mindful of token usage cost, as Cline's code context orchestration, while very effective, is resource-intensive. Another potential bottleneck is rate limiting, which can slow down workflows. Until this is resolved, using API providers like OpenRouter, which provide better rate limits, is advisable.
-
56. Cursor
We continue to be impressed by the AI-first code editor Cursor, which remains a leader in the competitive AI coding assistance space. Its code context orchestration is very effective, and it supports a wide range of models, including the option to use a custom API key. The Cursor team often comes up with innovative user experience features before the other vendors, and they include an extensive list of context providers in their chat, such as the referencing of git diffs, previous AI conversations, web search, library documentation and MCP integration. Alongside tools like Cline and Windsurf, Cursor also stands out for its strong agentic coding mode. This mode allows developers to guide their implementation directly from an AI chat interface, with the tool autonomously reading and modifying files, as well as executing commands. Additionally, we appreciate Cursor's ability to detect linting and compilation errors in generated code and proactively correct them.
-
57. D2
D2 is an open-source diagrams-as-code tool that helps users create and customize diagrams from text. It introduces the D2 diagram scripting language, which prioritizes readability over compactness with a simple, declarative syntax. D2 ships with a default theme and leverages the same layout engine as Mermaid. Our teams appreciate its lightweight syntax, which is specifically designed for software documentation and architecture diagrams.
-
58. Databricks Delta Live Tables
Delta Live Tables (DLT) continues to prove its value in simplifying and streamlining data pipeline management, supporting both real-time streaming and batch processing through a declarative approach. By automating complex data engineering tasks, such as manual checkpoint management, DLT reduces operational overhead while ensuring a robust end-to-end system. Its ability to orchestrate simple pipelines with minimal manual intervention enhances reliability and flexibility, while features like materialized views provide incremental updates and performance optimization for specific use cases.
However, teams must understand DLT’s nuances to fully leverage its benefits and avoid potential pitfalls. As an opinionated abstraction, DLT manages its own tables and restricts data insertion to a single pipeline at a time. Streaming tables are append-only, requiring careful design considerations. Additionally, deleting a DLT pipeline also deletes the underlying table and data, potentially creating operational issues.
-
59. JSON Crack
JSON Crack is a Visual Studio Code extension that renders interactive graphs from textual data. Despite its name it supports multiple formats, including YAML, TOML and XML. Unlike Mermaid and D2, where the textual form is a means to create a specific visual graph, JSON Crack is a tool to look at data that happens to be in a textual format. The layout algorithm works well and the tool allows selective hiding of branches and nodes, making it a great choice for exploring data sets. A companion web-based tool is also available, but our reservations about relying on online services for formatting or parsing code apply. JSON Crack does have a node limit, and directs users to a commercial sibling tool for handling files with more than a few hundred nodes.
-
60. MailSlurp
Testing workflows that involve email are often complex and time-consuming. Development teams must build custom email API clients for automation while also setting up temporary inboxes for manual testing scenarios, such as user testing or internal product training before major releases. These challenges become even more pronounced when developing customer onboarding products. We’ve had a positive experience with MailSlurp, a mail server and SMS API service. It provides REST APIs for creating inboxes and phone numbers as well as validating emails and messages directly in code, and its no-code dashboard is also useful for manual testing preparations. Additional features like custom domains, webhooks, auto-reply and forwarding are worth checking out for more complex scenarios.
-
61. Metabase
Metabase is an open-source analytics and business intelligence tool that allows users to visualize and analyze data from a variety of data sources, including relational and NoSQL databases. The tool helps users create visualizations and reports, organize them into dashboards and easily share insights. It also offers an SDK for embedding interactive dashboards in web applications, matching the theme and style of the application — making it developer-friendly. With both officially supported and community-backed data connectors, Metabase is versatile across data environments. As a lightweight BI tool, our teams find it useful for managing interactive dashboards and reports in their applications.
-
62. NeMo Guardrails
NeMo Guardrails is an easy-to-use open-source toolkit from NVIDIA that empowers developers to implement guardrails for LLMs used in conversational applications. Since we last mentioned it in the Radar, NeMo has seen significant adoption across our teams and continues to improve. Many of the latest enhancements to NeMo Guardrails focus on expanding integrations and strengthening security, data and control, aligning with the project’s core goal.
A major update to NeMo’s documentation has improved usability and new integrations have been added, including AutoAlign and Patronus Lynx, along with support for Colang 2.0. Key upgrades include enhancements to content safety and security as well as a recent release that supports streaming LLM content through output rails for improved performance. We've also seen added support for Prompt Security. Additionally, Nvidia released three new microservices: content safety NIM microservice, topic control NIM microservice and jailbreak detection, all of which have been integrated with NeMo Guardrails.
Based on its growing feature set and increased usage in production, we’re moving NeMo Guardrails to Trial. We recommend reviewing the latest release notes for a complete overview of the changes since our last blip.
-
63. Nyx
Nyx is a versatile semantic release tool that supports a wide range of software engineering projects. It’s language-agnostic and works with all major CI and SCM platforms, making it highly adaptable. While many teams use semantic versioning in trunk-based development, Nyx also supports workflows like Gitflow, OneFlow and GitHub Flow. One key advantage of Nyx in production is its automatic changelog generation, with built-in support for Conventional Commits.
As noted in previous Radar editions, we caution against development patterns that rely on long-lived branches (e.g., Gitflow, GitOps), as they introduce challenges that even powerful tools like Nyx cannot mitigate. We highly recommend trying Nyx in CI/CD workflows, especially for trunk-based development, where we’ve seen repeated success.
-
64. OpenRewrite
OpenRewrite continues to serve us well as a tool for large-scale refactorings that follow a set of rules such as moving to a new API version of a widely used library or applying updates to many services that were created from the same template. Support for languages beyond Java, notably JavaScript, has been introduced. With short LTS release cycles in frameworks like Angular, keeping projects updated to newer versions has become increasingly important. OpenRewrite supports this process effectively. Using an AI coding assistant is an alternative, but for rule-based changes, it’s usually slower, more expensive and less reliable. We like that OpenRewrite comes bundled with a catalog of recipes (rules), which describe the changes to be made. The refactoring engine, bundled recipes and build tool plugins are open-source software, which makes it easier for teams to reach for OpenRewrite when they need it.
-
65. Plerion
Plerion is an AWS-focused cloud security platform that integrates with hosting providers to uncover risks, misconfigurations and vulnerabilities across your cloud infrastructure, servers and applications. Similar to Wiz, Plerion uses risk-based prioritization for detected issues, promising to let you "focus on the 1% that matters." Our teams report positive experiences with Plerion, noting it has provided our clients with significant insights and reinforced the importance of proactive security monitoring for their organizations.
-
66. Software engineering agents
Since we last wrote about software engineering agents six months ago, the industry still lacks a shared definition of the term "agent." However, a major development has emerged — not in fully autonomous coding agents (which remain unconvincing) but in supervised agentic modes within the IDE. These modes allow developers to drive implementation via chat, with tools not only modifying code in multiple files but also executing commands, running tests and responding to IDE feedback like linting or compile errors.
This approach, sometimes called chat-oriented programming (CHOP) or prompt-to-code, keeps developers in control while shifting more responsibility to AI than traditional coding assistants like auto-suggestions. Leading tools in this space include Cursor, Cline and Windsurf, with GitHub Copilot slightly behind but catching up. The usefulness of these agentic modes depends on both the model used (with Claude's Sonnet series the current state of the art) and how well the tool integrates with the IDE to provide a good developer experience.
We've found these workflows intriguing and promising, with a notable increase in coding speed. However, keeping problem scopes small helps developers better review AI-generated changes. This works best with low-abstraction prompts and AI-friendly codebases that are well-structured and properly tested. As these modes improve, they’ll also heighten the risk of complacency with AI-generated code. To mitigate this, employ pair programming and other disciplined review practices, especially for production code.
-
67. Tuple
Tuple, a tool optimized for remote pair programming, was originally designed to fill the gap left by Slack’s Screenhero. Since we last mentioned it in the Radar, it has seen wider adoption, addressed previous quirks and constraints and now supports Windows. A key improvement is enhanced desktop sharing with a built-in privacy feature, allowing users to hide private app windows (such as text messages) while sharing tools like the browser window. Previously, UI limitations made Tuple feel like a pair programming tool rather than a general collaboration tool. With these updates, users can now collaborate on content beyond the IDE.
However, it’s important to note that the remote pair has access to the entire desktop. If not configured properly, this could be a security concern, especially if the pair is not trustworthy. We strongly recommend educating teams on Tuple’s privacy settings, best practices and etiquette before use.
We encourage teams to try the latest version of Tuple in your development workflow. It aligns with our pragmatic remote pairing recommendation, offering low-latency pairing, an intuitive UX and significant usability improvements.
-
68. Turborepo
Turborepo helps manage large JavaScript or TypeScript monorepos by analyzing, caching, parallelizing and optimizing build tasks to speed up the process. In large monorepos, projects often depend on each other; rebuilding all dependencies for every change is inefficient and time-consuming, but Turborepo makes this easier. Unlike Nx, Turborepo's default setup uses multiple package.json files — one per project — which allows having dependencies with different versions (multiple versions of React, for example) in a single monorepo, which Nx discourages. While this might be considered an anti-pattern, it does address certain use cases, like migrating from multi- to monorepo, where teams may temporarily require multiple versions of dependencies. In our experience, TurboRepo is quite simple to set up and performs well.
Assess
-
69. Anythingllm
AnythingLLM es una aplicación de escritorio de código abierto que permite chatear con documentos o fragmentos de contenido extensos, respaldada por una integración lista para usar con modelos de lenguaje de gran tamaño (LLMs) y bases de datos vectoriales. Cuenta con una arquitectura modular para modelos de incrustación y puede utilizarse con la mayoría de los LLM comerciales, así como con modelos de código abierto gestionados por Ollama. Además de RAG, se pueden crear diferentes habilidades y organizarlas como agentes para realizar tareas y flujos de trabajo personalizados. La aplicación permite a los usuarios organizar documentos e interacciones en distintos espacios de trabajo, que funcionan como hilos de conversación persistentes con diferentes contextos. Recientemente, también se ha añadido la posibilidad de desplegarlo como una aplicación web multiusuario mediante una imagen de Docker. Algunos de nuestros equipos lo están utilizando como asistente personal local y lo consideran una herramienta potente y útil.
-
70. Gemma Scope
La interpretabilidad mecánica, el entendimiento del funcionamiento interno de los grandes modelos de lenguaje, se está convirtiendo en un campo cada vez más importante. Herramientas como Gemma Scope y librerías open-source Mishax proporcionan perspectivas sobre la familia Gemma2 de modelos abiertos. Las herramientas de interpretabilidad desempeñan un papel crucial a la hora de depurar comportamientos inesperados, identificando los componentes responsables de alucinaciones, sesgos u otros casos que causan fallos y, en última instancia, generan confianza ofreciendo una visibilidad más detallada de los modelos. Aunque este campo puede ser de especial interés para los investigadores, cabe señalar que con la reciente publicación de DeepSeek-R1, el entrenamiento de modelos es cada vez más factible para las empresas más allá de los actores establecidos. A medida que la GenAI siga evolucionando, tanto la interpretabilidad como la seguridad irán ganando importancia.
-
71. Hurl
Hurl es una herramienta versátil para realizar secuencias de solicitudes HTTP, definidas en archivos de texto plano utilizando una sintaxis específica de Hurl. Además de enviar solicitudes, Hurl puede validar respuestas, asegurando que una solicitud devuelva un código de estado HTTP específico; comprobar condiciones en los encabezados de respuesta o en el contenido usando XPATH, JSONPath o expresiones regulares; y extraer datos de la respuesta en variables, que luego pueden usarse para encadenar solicitudes.
Gracias a su conjunto de características, Hurl es útil para automatizaciones de API simples, pero también sirve como una herramienta de pruebas de API automatizada. Su capacidad para generar informes de pruebas detallados en formato HTML o JSON mejora su utilidad en flujos de trabajo de pruebas. Aunque herramientas especializadas como Bruno y Postman ofrecen interfaces gráficas de usuario (GUIs) y características adicionales, nos gusta Hurl por su simplicidad. Al igual que Bruno, que también usa archivos de texto plano, las pruebas de Hurl pueden almacenarse en el repositorio de código.
-
72. Jujutsu
Git es el principal sistema de control de versiones distribuido (VCS), acumulando la vasta mayoría de la cuota de mercado. Aún así, y pese a más de una década de liderazgo, los desarrolladores aún encuentran dificultades con los complejos flujos de trabajo para la gestión de ramas, la fusión, el rebase y la resolución de conflictos. Esta frustración constante ha dado lugar a una serie de herramientas diseñadas para aliviar este problema; algunas ofreciendo ayudas visuales para aclarar la complejidad, otras a través de interfaces gráficas que abstraen la misma por completo.
Jujutsu va un paso más allá, ofreciendo una alternativa completa a Git, pero manteniendo la compatibilidad al usar repositorios de Git como almacenamiento de backend. Esto permite a los desarrolladores seguir utilizando servidores y servicios Git existentes mientras se benefician de los flujos de trabajo optimizados de Jujutsu. Posicionado como “simple y poderoso”, Jujutsu enfatiza la facilidad de uso para desarrolladores de todos los niveles de experiencia. Una de sus características destacadas es la resolución de conflictos de primera clase, con el potencial de mejorar significativamente la experiencia de desarrollo.
-
73. kubenetmon
La monitorización y la comprensión del tráfico de red asociado a Kubernetes puede ser desafiante, particularmente cuando tu infraestructura se extiende a múltiples zonas, regiones o nubes.kubenetmon, creado por ClickHouse y recientemente disponible en código abierto, tiene la esperanza de resolver este problema ofreciendo mediciones detalladas del tráfico de datos de Kubernetes a través de los mayores proveedores de servicios en la nube. Si usas Kubernetes y te has frustrado por costos opacos de transferencia de datos en tu factura, puede merecer la pena que explores kubenetmon.
-
74. Mergiraf
Resolver conflictos de fusión es probablemente una de las actividades menos apreciadas en el desarrollo de software. Y aunque existen técnicas que reducen la complejidad de las fusiones —por ejemplo practicar la integración continua, en el sentido original de fusionar con una rama principal compartida, al menos una vez al día—, vemos que se dedica demasiado esfuerzo a las fusiones. Long-lived feature branches es uno de los culpables, pero la codificación asistida por IA también tiende a incrementar el tamaño de los conjuntos de cambios. La ayuda podría llegar en forma de Mergiraf, una nueva herramienta que resuelve conflictos de fusión analizando el árbol sintáctico en lugar de tratar el código como líneas de texto. Como un controlador de fusión para git, puede configurarse para que subcomandos como
merge
ycherry-pick
usen automáticamente Mergiraf en lugar de los métodos predeterminados. -
75. ModernBERT
El sucesor de BERT (Bidirectional Encoder Representations from Transformers), ModernBERT constituye la nueva generación de modelos transformadores centrados exclusivamente en la fase de codificación diseñados para abordar un amplio espectro de tareas de procesamiento del lenguaje natural (PLN). Como sustituto directo de BERT, ModernBERT no solo incrementa el rendimiento y la precisión, sino que también solventa algunas de sus limitaciones; destacando especialmente su capacidad de manejar longitudes de contexto notablemente mayores gracias a la técnica denominadaAlternating Attention. Para los equipos que requieran soluciones de PLN, resulta recomendable evaluar ModernBERT antes de adoptar un modelo generativo de propósito general.
-
76. OpenRouter
OpenRouter es una API unificada para acceder a múltiples modelos de lenguaje extenso. Ofrece un punto de integración único para principales proveedores de LLM, simplificando la experimentación, reduciendo la dependencia de un proveedor y optimizando los costos al enrutar las solicitudes al modelo más apropiado. Herramientas populares como Cline y Open WebUI utilizan OpenRouter como su punto de acceso primario. Durante el análisis del Radar, cuestionamos la necesidad real de alternar entre modelos en la mayoría de los proyectos, dado que OpenRouter debe añadir un margen de precio como modelo de negocio sobre esta capa de encapsulación. Sin embargo, también reconocemos que OpenRouter proporciona diversas estrategias de balanceo de carga para ayudar a optimizar los costos. Una característica particularmente útil es su capacidad para evitar los límites de tasa de las APIs. Si una aplicación excede la tasa límite de un solo proveedor de LLM, OpenRouter puede ayudar a evitar esta restricción y lograr un mejor rendimiento.
-
77. Redactive
Redactive es una plataforma empresarial de habilitación de IA diseñada para ayudar a organizaciones reguladas a preparar de forma segura datos no estructurados para aplicaciones de inteligencia artificial, como asistentes y copilotos potenciados por IA. Se integra con plataformas de contenido como Confluence, creando índices de texto seguros para búsquedas con generación mejorada por recuperación (RAG). Al servir únicamente datos en vivo y aplicar en tiempo real los permisos de usuario desde los sistemas fuente, Redactive garantiza que los modelos de IA accedan a información precisa y autorizada sin comprometer la seguridad. Además, proporciona a los equipos de ingeniería herramientas para construir casos de uso de IA de forma segura usando cualquier LLM. Para las organizaciones que están explorando soluciones impulsadas por IA, Redactive ofrece un enfoque simplificado para la preparación de datos y el cumplimiento, equilibrando seguridad y accesibilidad para equipos que experimentan con capacidades de IA en un entorno controlado.
-
78. System Initiative
Seguimos entusiasmados con System Initiative. Esta herramienta experimental representa una radical nueva dirección para el trabajo en DevOps. Nos gusta mucho el pensamiento creativo detrás de esta herramienta y esperamos que motive a otros a romper con el status quo de los enfoques de infraestructura como código. System Initiative ha superado la fase beta, ahora está disponible de forma gratuita y open source bajo licencia Apache 2.0. Aunque sus desarrolladores la utilizan para gestionar su infraestructura en producción, aún le falta camino por recorrer antes de poder escalar y satisfacer las demandas de grandes empresas. Sin embargo, seguimos creyendo que vale la pena probarla para experimentar un enfoque completamente diferente a otras herramientas de DevOps.
-
79. TabPFN
TabPFN es un modelo basado en transformadores, diseñado para una clasificación rápida y precisa de conjuntos pequeños de datos tabulares. Aprovecha el aprendizaje contextual (ICL) para hacer predicciones directamente a partir de ejemplos etiquetados sin ajustar hiperparámetros ni entrenamiento adicional. Pre entrenado en millones de conjuntos de datos sintéticos, TabPFN generaliza bien a través de diversas distribuciones de datos y maneja eficazmente valores ausentes y valores atípicos. Sus fortalezas incluyen procesamiento eficiente de datos heterogéneos y robustez frente a características poco informativas.
TabPFN es especialmente adecuado para aplicaciones a pequeña escala en las que la velocidad y la precisión son cruciales. Sin embargo, se enfrenta a desafíos de escalabilidad con conjuntos de datos más grandes y tiene limitaciones en el manejo de tareas de regresión. Como una solución vanguardista, merece la pena evaluar TabPFN por su potencial para superar a los modelos de clasificación tabular tradicionales, especialmente cuando los transformadores se aplican con menos frecuencia.
-
80. v0
v0 de Vercel es una herramienta de IA para generar código de interfaz web a partir de una captura de pantalla, diseño de Figma o un simple prompt. Soporta React, Vue, shadcn y Tailwind entre otros frameworks de interfaz web. Más allá del código generado por IA, v0 proporciona una gran experiencia de usuario, que incluye la posibilidad de previsualizar el código generado y desplegarlo en Vercel en un solo paso. Aunque la construcción de una aplicación real implica la integración de múltiples funcionalidades más allá de una única pantalla, v0 proporciona una manera sólida de prototipar y puede usarse para inicializar un punto de partida para el desarrollo de aplicaciones complejas.
-
81. Windsurf
Windsurf es un asistente de código con IA desarrollado por Codeium que destaca por sus habilidades agénticas. Es similar a Cursor y Cline, permitiendo a los desarrolladores dirigir su implementación a través de un chat con IA que navega y modifica el código, además de ejecutar comandos. Con frecuencia, lanza nuevas funciones e integraciones para su modo agéntico. Recientemente, por ejemplo, ha introducido una vista previa del navegador que facilita el acceso del agente a los elementos del DOM y la consola del navegador, así como una capacidad de investigación web que le permite buscar documentación y soluciones en internet cuando sea necesario. Windsurf ofrece acceso a una variedad de modelos populares y permite a los usuarios activar y referenciar la búsqueda en la web, la documentación de bibliotecas y la integración con MCP como proveedores de contexto adicionales.
-
82. YOLO
La serie YOLO (You Only Look Once), desarrollada por Ultralytics, sigue avanzando en los modelos de visión por computadora. La última versión, YOLO11, ofrece mejoras significativas tanto en precisión como en eficiencia en comparación con sus versiones anteriores. YOLO11 es capaz de realizar clasificación de imágenes a alta velocidad con recursos mínimos, lo que la hace idónea para aplicaciones en tiempo real en dispositivos periféricos. También, encontramos que la capacidad de utilizar este mismo framework para llevar a cabo la estimación de posturas, detección de objetos, segmentación de imágenes y otras tareas es muy poderosa. Este importante desarrollo también nos recuerda que emplear modelos de aprendizaje automáticos “tradicionales” para tareas específicas puede ser más eficaz que utilizar modelos generales de Inteligencia Artificial, como los LLMs.
Hold
Unable to find something you expected to see?
Each edition of the Radar features blips reflecting what we came across during the previous six months. We might have covered what you are looking for on a previous Radar already. We sometimes cull things just because there are too many to talk about. A blip might also be missing because the Radar reflects our experience, it is not based on a comprehensive market analysis.
