Herramientas
Adoptar
-
51. Renovate
Renovate se ha convertido en la herramienta preferida por muchos de nuestros equipos que buscan adoptar un enfoque proactivo en la gestión de versiones de dependencias. Mientras Dependabot sigue siendo una opción segura por defecto para los repositorios alojados en GitHub, seguimos recomendando evaluar Renovate como una solución más completa y personalizable. Para maximizar los beneficios, configurar Renovate para monitorear y actualizar todas las dependencias, incluidas las herramientas, la infraestructura y las dependencias privadas o alojadas internamente. Para reducir la sobrecarga de las desarrolladoras, considerar la fusión automática de solicitudes de actualización de dependencias.
-
52. uv
Desde el último Radar, hemos ganado más experiencia con uv, y el feedback de los equipos han sido abrumadoramente positivos. uv es una herramienta de gestión de paquetes y proyectos de Python de la próxima generación escrita en Rust, con una propuesta de valor clave: es “extremadamente rápida”. Supera a otros gestores de paquetes de Python por un amplio margen en los benchmarks, acelerando los ciclos de construcción y pruebas y mejorando significativamente la experiencia del desarrollador. Más allá del rendimiento, uv ofrece un conjunto de herramientas unificado, reemplazando efectivamente herramientas como Poetry, pyenv y pipx. Sin embargo, nuestras preocupaciones sobre las herramientas de gestión de paquetes siguen siendo las mismas: un ecosistema fuerte, una comunidad madura y soporte a largo plazo son cruciales. Dado que uv es relativamente nuevo, moverlo al anillo de Adopción es atrevido. Sin embargo, muchos equipos de datos están ansiosos por abandonar el sistema heredado de gestión de paquetes de Python, y nuestros desarrolladores más cercanos al trabajo diario recomiendan consistentemente a uv como la mejor herramienta disponible hoy en día.
-
53. Vite
Desde la última vez que Vite fue mencionado en el Radar, ha cobrado aún más fuerza. Se trata de una herramienta de alto rendimiento para la construcción de front-end con un rápido hot-reloading. Está siendo adoptado y recomendado como la elección predeterminada de muchos frameworks de front-end, incluyendo Vue, SvelteKit y React, que recientemente deprecó create-react-app. Vite también recibió recientemente una importante inversión, lo que llevó a la fundación de VoidZero, una organización dedicada al desarrollo de Vite. Esta inversión debería acelerar el desarrollo y reforzar la sostenibilidad del proyecto a largo plazo.
Probar
-
54. Claude Sonnet
Claude Sonnet es un modelo de lenguaje avanzado que destaca en programación, redacción, análisis y procesamiento visual. Está disponible en navegadores, la terminal, la mayoría de los principales IDE e incluso se integra con GitHub Copilot. Hasta la fecha, las pruebas de rendimiento muestran que supera a los modelos anteriores con las versiones 3.5 y 3.7, incluyendo modelos previos de Claude. También es hábil en la interpretación de gráficos y la extracción de texto de imágenes, y ofrece una experiencia centrada en desarrolladores, con funciones comoArtifacts en la interfaz del navegador, que permite generar e interactuar con contenido dinámico como fragmentos de código y diseños en HTML.
Hemos utilizado la versión 3.5 de Claude Sonnet en el desarrollo de software y hemos encontrado que mejora significativamente la productividad en diversos proyectos. Destaca especialmente en proyectos que surgen desde cero, en particular para el diseño colaborativo de software y discusiones de arquitectura. Si bien aún es prematuro considerar a cualquier modelo de IA comoestable como asistente en programación, Claude Sonnet es uno de los modelos más fiables con los que hemos trabajado. En el momento de redactar este texto, también se ha lanzado Claude 3.7, con resultados prometedores, aunque aún no lo hemos probado en producción.
-
55. Cline
Cline es una extensión de código abierto para VSCode que actualmente es uno de los competidores más fuertes en el espacio de los agentes de ingeniería de software supervisados. Permite a los desarrolladores dirigir su implementación completamente desde el chat de Cline, integrándose sin problemas con el IDE que ya utilizan. Características clave, como el modo Plan & Act, el uso transparente de tokens y la integración de MCP, ayudan a los desarrolladores a interactuar de manera efectiva con los LLMs. Cline ha demostrado capacidades avanzadas en el manejo de tareas de desarrollo complejas, especialmente con Claude 3.5 Sonnet. Soporta grandes bases de código, automatiza las pruebas de navegadores headless y corrige errores de forma proactiva. A diferencia de soluciones basadas en la nube, Cline intensifica la privacidad al almacenar datos localmente. Su naturaleza de código abierto no solo asegura una mayor transparencia, sino que también permite mejoras impulsadas por la comunidad. Sin embargo, los desarrolladores deben ser conscientes del costo del uso de tokens, ya que la orquestación de contexto de código de Cline, aunque muy efectiva, es intensiva en recursos. Otro cuello de botella potencial es el rate limiting, que puede ralentizar los flujos de trabajo. Hasta que esto se resuelva, es aconsejable utilizar proveedores de API como OpenRouter, que ofrecen mejores reductores de tráfico.
-
56. Cursor
Continuamos impresionados por el editor de código basado en Inteligencia Artificial Cursor, el cual sigue siendo líder en el competitivo espacio de la asistencia de código con IA. Su orquestación del contexto del código es muy efectiva y admite una amplia gama de modelos, incluyendo la opción de utilizar una clave de API personalizada. El equipo de Cursor a menudo introduce características innovadoras de experiencia de usuario antes que otros proveedores e incluye una lista extensa de proveedores de contexto en su chat, como la referencia a diferencias en git, conversaciones previas con la IA, búsquedas web, documentación de librerías e integración con MCP. Junto con herramientas como Cline y Windsurf, Cursor se destaca por su poderoso modo de agente de codificación. Este modo permite a los desarrolladores guiar su implementación directamente desde una interfaz de chat basada en IA, donde la herramienta lee y modifica archivos de forma autónoma, así como también ejecuta comandos. También valoramos la capacidad de Cursor para detectar errores de linting y de compilación en el código generado, y corregirlos proactivamente.
-
57. D2
D2 es una herramienta de código abierto de tipo diagramas como código que ayuda a los usuarios a crear y personalizar diagramas a partir de texto. Introduce el lenguaje de scripting de diagramas D2, que prioriza la legibilidad frente a la compacidad con una sintaxis simple y declarativa. D2 incluye por defecto un tema y utiliza el mismo motor de diseño que Mermaid. Nuestros equipos valoran su sintaxis ligera, que está diseñada específicamente para documentación de software y diagramas de arquitectura.
-
58. Databricks Delta Live Tables
Delta Live Tables (DLT) sigue demostrando su valor a la hora de simplificar y agilizar la gestión de pipelines de datos, soportando tanto el streaming en tiempo real como el procesamiento por batch a través de un enfoque declarativo. Al automatizar tareas complejas de ingeniería de datos, como la gestión manual de puntos de control, DLT reduce la sobrecarga operativa y garantiza un sistema robusto de punta a punta. Su capacidad para orquestar pipelines sencillos con una intervención manual mínima mejora la fiabilidad y flexibilidad, mientras que funciones como las vistas materializadas proporcionan actualizaciones incrementales y optimización del rendimiento para casos de uso específico.
Sin embargo, los equipos deben comprender los matices de DLT para aprovechar plenamente sus ventajas y evitar posibles dificultades. DLT gestiona sus propias tablas y restringe la inserción de datos a un único pipeline simultáneamente. Las tablas de streaming son de adición, lo que requiere consideraciones de diseño cuidadosas. Además, al borrar un pipeline DLT también se borran la tabla y los datos subyacentes, lo que puede crear problemas operativos.
-
59. JSON Crack
JSON Crack es una extensión de Visual Studio Code que genera gráficos interactivos a partir de datos en formato textual. A pesar de su nombre, admite múltiples formatos, incluyendo YAML, TOML y XML. A diferencia de Mermaid y D2, donde la representación textual es un medio para crear un gráfico visual específico, JSON Crack es una herramienta para visualizar datos que se encuentran en formato de texto. Su algoritmo de diseño funciona bien y permite ocultar selectivamente ramas y nodos, lo que lo convierte en una excelente opción para explorar conjuntos de datos. También esta disponible una herramienta web complementaria, pero en este caso tenemos dudas sobre depender de servicios online para el formatear o parsear código. JSON Crack tiene un límite en la cantidad de nodos a procesar y redirige a los usuarios a una herramienta comercial relacionada para manejar archivos con más de unos pocos cientos de nodos.
-
60. MailSlurp
Los flujos de trabajo de pruebas que implican el correo electrónico suelen ser complejos y requieren mucho tiempo. Los equipos de desarrollo deben construir clientes de API de correo electrónico personalizados para la automatización, a la vez que configuran buzones de entrada temporales para escenarios de prueba manual, tales como pruebas de usabilidad o formación interna del producto antes de las liberaciones importantes. Estos desafíos se vuelven aún más pronunciados al desarrollar productos de integración de clientes. Hemos tenido una experiencia positiva con MailSlurp, un servidor de correo y servicio de API SMS. Proporciona API REST para crear buzones de entrada y números de teléfono, así como para validar correos electrónicos y mensajes directamente en el código, y su tablero sin código también es útil para la preparación de pruebas manuales. Otras características, como dominios personalizados, webhooks, respuesta automática y reenvío, merecen ser consideradas para escenarios más complejos.
-
61. Metabase
Metabase es una herramienta de análisis e inteligencia de negocio de código abierto que permite a los usuarios visualizar y analizar datos provenientes de diversas fuentes, incluidas bases de datos relacionales y NoSQL. La herramienta facilita la creación de visualizaciones e informes, su organización en tableros y el intercambio de información de forma sencilla. Además, ofrece un SDK para incrustar tableros interactivos en aplicaciones web, adaptándose al estilo y tema de la aplicación, lo que resulta muy conveniente para desarrolladores. Con conectores de datos respaldados oficialmente como por la comunidad, Metabase es versátil en diversos entornos. Como herramienta de BI ligera, nuestros equipos la encuentran útil para gestionar tableros interactivos e informes en sus aplicaciones.
-
62. NeMo Guardrails
NeMo Guardrails es un kit de herramientas de código abierto de fácil uso de NVIDIA que permite a los desarrolladores implementar barreras de protección para modelos de lenguaje de gran tamaño (LLM) utilizados en aplicaciones conversacionales. Desde que lo mencionamos por última vez en el Radar, NeMo ha experimentado una adopción significativa en nuestros equipos y continúa mejorando. Muchas de las últimas mejoras de NeMo Guardrails se centran en expandir las integraciones y fortalecer la seguridad, los datos y el control, alineándose con el objetivo principal del proyecto.
Una actualización importante de NeMo documentation es que ha mejorado la usabilidad y se han añadido nuevas integraciones, incluyendo AutoAlign y Patronus Lynx, junto con soporte para Colang 2.0. Las actualizaciones clave incluyen mejoras en la seguridad y protección del contenido, así como una versión reciente que admite la transmisión de contenido LLM a través de rieles de salida para un rendimiento mejorado. También hemos visto soporte adicional para Prompt Security. Además, Nvidia lanzó tres nuevos microservicios: el microservicio NIM de seguridad de contenido, el microservicio NIM de control de temas y la detección de jailbreak, todos los cuales se han integrado con NeMo Guardrails. Debido a su creciente conjunto de características y al aumento de su uso en producción, estamos moviendo NeMo Guardrails a la fase de Probar. Recomendamos revisar las últimas notas de la versión para obtener una visión general completa de los cambios desde nuestro último blip.
-
63. Nyx
Nyx Es una herramienta versátil de lanzamiento semántico que admite una amplia gama de proyectos de ingeniería de software. Es independiente del lenguaje y funciona con todas las principales plataformas de CI y SCM, lo que la hace altamente adaptable. Aunque muchos equipos utilizan versionado semántico en el Desarrollo basado en trunk, Nyx también es compatible con flujos de trabajo como Gitflow, OneFlow y GitHub Flow. Una ventaja clave de Nyx en producción es su generación automática de changelogs, con soporte integrado para Comits convencionales.
Como se ha señalado en ediciones anteriores del Radar, advertimos sobre los patrones de desarrollo que dependen de Ramas de larga duración (Por ejemplo, Gitflow, GitOps), ya que introducen desafíos que incluso herramientas potentes como Nyx no pueden mitigar. Recomendamos encarecidamente probar Nyx en flujos de trabajo CI/CD, especialmente en desarrollo basado en trunk, donde hemos visto repetidos casos de éxito.
-
64. OpenRewrite
OpenRewrite sigue siendo una herramienta muy útil para refactorizaciones a gran escala que siguen un conjunto de reglas, tal como la transición a una versión más reciente de la API de una librería ampliamente utilizada o la aplicación de actualizaciones a múltiples servicios que fueron creados a partir de la misma plantilla. Se ha introducido soporte para lenguajes más allá de Java, notablemente JavaScript. Con ciclos de lanzamientos LTS cortos en frameworks como Angular, mantener los proyectos actualizados a versiones más recientes es cada vez más importante. OpenRewrite facilita este proceso de forma eficaz. Utilizar un asistente de codificación basado en IA es una alternativa, pero para cambios basados en reglas, generalmente es más lento, más costoso y menos fiable. Nos gusta que OpenRewrite venga con un catálogo de recetas (reglas), que describen los cambios a realizar. El motor de refactorización, las recetas incluidas y los plugins de herramientas de construcción son software de código abierto, lo que facilita que los equipos recurran a OpenRewrite cuando lo necesiten.
-
65. Plerion
Plerion es una plataforma de seguridad en la nube centrada en AWS que se integra con los proveedores de alojamiento para descubrir riesgos, errores de configuración y vulnerabilidades en su infraestructura en la nube, servidores y aplicaciones. Similar a Wiz, Plerion utiliza una priorización basada en riesgos para los problemas detectados, prometiendo permitircentrarse en el 1% que importa”. Nuestros equipos informan de experiencias positivas con Plerion, señalando que ha proporcionado a nuestros clientes perspectivas significativas y ha reforzado la importancia del monitoreo proactivo de la seguridad para sus organizaciones.
-
66. Agentes de Ingeniería de Software
Desde que escribimos sobre agentes de ingeniería de software hace seis meses, la industria aún carece de una definición compartida del términoagente. Sin embargo, ha surgido un desarrollo importante, no en agentes de codificación completamente autónomos (que siguen sin ser convincentes), sino en modos de agentes supervisados dentro del IDE. Estos modos permiten a los desarrolladores dirigir la implementación a través de chat, con herramientas que no solo modifican el código en múltiples archivos, sino que también ejecutan comandos, realizan pruebas y responden a la retroalimentación del IDE, como errores de estilo o compilación.
Este enfoque, a veces llamadoprogramación orientada por chat (CHOP por sus siglas en inglés) oprompt-to-code (indicación a código), mantiene el control en los desarrolladores mientras se transfiere más responsabilidad a la IA que los asistentes de codificación tradicionales, como las sugerencias automáticas. Las herramientas líderes en este espacio incluyen Cursor, Cline y Windsurf, con GitHub Copilot ligeramente rezagado pero alcanzando a los otros rápidamente. La utilidad de estos modos de agentes depende tanto del modelo utilizado (con Claude's Sonnet series siendo actualmente la referencia) como qué tan bien se integra con el IDE para proporcionar una buena experiencia de desarrollo.
Hemos encontrado estos flujos de trabajo interesantes y prometedores, con un notable aumento en la velocidad de codificación. Sin embargo, mantener pequeños los alcances de los problemas ayuda a los desarrolladores a revisar mejor los cambios generados por la IA. Esto funciona mejor con indicaciones de baja abstracción y bases de código amigables con la IA que estén bien estructuradas y debidamente probadas. A medida que estos modos mejoren, también aumentarán el riesgo de complacencia con el código generado por la IA. Para mitigar esto, recomendamos la programación en pareja y otras prácticas de revisión disciplinadas, especialmente para el código de producción.
-
67. Tuple
Tuple, una herramienta optimizada para la programación en pareja de forma remota, fue diseñada originalmente para llenar el vacío que dejó Screenhero de Slack. Desde que la mencionamos en el Radar, ha ganado más adopción, ha corregido problemas y limitaciones y ahora es compatible con Windows. Una mejora clave es la optimización del uso compartido de escritorio con una función de privacidad integrada, que permite ocultar ventanas de aplicaciones privadas (como mensajes de texto) mientras se comparten herramientas como la ventana del navegador. Antes, las limitaciones de la interfaz de usuario hacían que Tuple se sintiera más como una herramienta específica para programación en pareja que como una solución de colaboración general. Con estas actualizaciones, ahora es posible colaborar en más contenidos fuera del IDE. Sin embargo, es importante destacar que la pareja remota tiene acceso a todo el escritorio. Si no se configura correctamente, esto podría representar un riesgo de seguridad, especialmente si la otra persona no es de confianza. Recomendamos encarecidamente educar a los equipos sobre la configuración de privacidad, buenas prácticas y código de conducta en Tuple antes de implementarlo. Animamos a los equipos a probar la última versión de Tuple en su flujo de trabajo de desarrollo. Se alinea con nuestra recomendación de programación en pareja remota con pragmatismo, ofreciendo baja latencia, una experiencia de usuario intuitiva y mejoras significativas en usabilidad.
-
68. Turborepo
Turborepo ayuda a gestionar grandes mono repositorios de JavaScript o TypeScript mediante el análisis, almacenamiento en caché, paralelización y optimización de las tareas de construcción para acelerar el proceso. En mono repositorios grandes, los proyectos suelen depender unos de otros; reconstruir todas las dependencias por cada cambio es ineficiente y consume mucho tiempo, pero Turborepo facilita este proceso. A diferencia de Nx, la configuración predeterminada de Turborepo utiliza múltiples archivos package.json; uno por proyecto, lo que permite tener dependencias con diferentes versiones (múltiples versiones de React, por ejemplo) en un único mono repositorio, algo que Nx desaconseja. Aunque esto podría considerarse un anti-patrón, resuelve ciertos casos de uso, como la migración de múltiples repositorios a uno único, donde los equipos pueden necesitar temporalmente varias versiones de dependencias. En nuestra experiencia, Turborepo es bastante sencillo de configurar y tiene un buen desempeño.
Evaluar
-
69. AnythingLLM
AnythingLLM 是一个开源桌面应用程序,可以与大型文档或内容交互,支持开箱即用的大语言模型(LLMs)和向量数据库集成。它具备可插拔的嵌入模型架构,可以与大多数商业化 LLM 以及由 Ollama 管理的开源模型一起使用。除了支持 检索增强生成(RAG) 模式外,用户还可以创建和组织不同技能作为代理(agents)来执行自定义任务和工作流。AnythingLLM 允许用户将文档和交互分组到不同的工作空间中,这些工作空间类似于长生命周期的线程,每个线程都有独立的上下文。最近,它还新增了通过简单的 Docker 镜像部署为多用户 Web 应用的功能。一些团队已将其用作本地个人助手,发现它是一个强大且实用的工具。
-
70. Gemma Scope
机械解释性(Mechanistic Interpretability)——理解大型语言模型的内部运行机制——正在成为一个日益重要的领域。像 Gemma Scope 和开源库 Mishax 这样的工具,为 Gemma2 系列开源模型提供了深入的洞察。这些解释性工具在调试模型的意外行为、识别导致幻觉、偏见或其他失败案例的组件方面发挥了关键作用,并通过提供更深入的可见性来建立对模型的信任。虽然这一领域对研究人员尤其具有吸引力,但需要注意的是,随着 DeepSeek-R1 的近期发布,模型训练正在成为超越传统大玩家的更多企业的可行选择。随着生成式 AI 的不断发展,解释性与安全性的重要性只会与日俱增。
-
71. Hurl
Hurl 是处理一系列 HTTP 请求的利器,这些请求可通过使用 Hurl 特定语法的纯文本文件定义。除了发送请求以外,Hurl 还可以验证响应数据,确保请求返回特定的 HTTP 状态码,使用 XPATH, JSONPath 或者正则表达式断言响应头和内容,以及提取相应数据到变量之中,以便在链式请求之中调用。
凭借这些特性,Hurl 不仅可以胜任简单的 API 自动化工作,而且也能作为 API 的自动测试工具使用。它支持生成基于 HTML 或 JSON 格式的详细测试报告,这使它在测试流程中更具实用性。虽然像 Bruno 和 Postman 这样的专业工具提供了图形用户界面以及更丰富的功能,但 Hurl 更以简洁著称。和同样使用纯文本文件的Bruno类似,Hurl 的测试文件也可以存储在代码仓库中。
-
72. Jujutsu
Git 是当前占据主导地位的分布式版本控制系统(VCS),拥有绝大多数的市场份额。然而,尽管 Git 已在过去十多年中占据主导地位,开发者仍然在其复杂的分支、合并、变基以及冲突解决工作流中苦苦挣扎。这种持续的挫败感催生了一系列旨在缓解痛点的工具——有些通过可视化方式简化复杂性,有些则提供图形界面以完全抽象操作过程。
Jujutsu 更进一步,提供了一个完整的 Git 替代方案,同时通过 使用 Git 仓库作为存储后端 保持兼容性。这使开发者能够继续使用现有的 Git 服务器和服务,同时受益于 Jujutsu 简化的工作流。Jujutsu 将自己定位为“既简单又强大”,强调为不同经验水平的开发者提供易用性。其一大亮点是 一流的冲突解决功能,这一特性有潜力显著改善开发者的使用体验。
-
73. kubenetmon
监控和理解与 Kubernetes 相关的网络流量可能是一项挑战,尤其是当您的基础设施跨多个可用区、区域或云时。由 ClickHouse 构建并最近开源的 kubenetmon,旨在通过提供主要云提供商之间详尽的 Kubernetes 数据传输计量解决这一问题。如果您正在运行 Kubernetes 并对账单中不清晰的数据传输成本感到困扰,不妨探索一下 kubenetmon。
-
74. Mergiraf
-
75. ModernBERT
BERT(Bidirectional Encoder Representations from Transformers)的继任者 ModernBERT 是一系列新一代的 encoder-only transformer 模型,专为广泛的自然语言处理(NLP)任务设计。作为一个可直接替代 BERT 的升级版本,ModernBERT 不仅提升了性能和准确性,还解决了 BERT 的一些局限——特别是通过引入“交替注意力”(Alternating Attention)实现了对极长上下文长度的支持。 对于有 NLP 需求的团队,在默认选择 通用生成式模型 之前,请优先考虑 ModernBERT。
-
76. OpenRouter
OpenRouter 是一个统一的 API,可以用于访问多个大型语言模型(LLM)。它为 主流 LLM 提供商 提供了单一的集成点,简化了实验过程,降低了供应商锁定的风险,并通过将请求路由到最合适的模型来优化成本。像 Cline 和 Open WebUI 这样的流行工具都使用 OpenRouter 作为它们的端点。在我们的技术雷达讨论中,我们质疑大多数项目是否真的需要在模型之间切换,尤其考虑到 OpenRouter 为了盈利,在这一封装层之上需要增加价格加成。然而,我们也认识到 OpenRouter 提供了多种负载均衡策略,有助于优化成本。其一项特别有用的功能是绕过 API 速率限制。如果您的应用程序超出了单一 LLM 提供商的速率限制,OpenRouter 可以帮助您突破这一限制,实现更高的吞吐量。
-
77. Redactive
Redactive 是一个企业级 AI 赋能平台,专为帮助受监管的组织安全地为 AI 应用(例如 AI 助手和协作工具)准备非结构化数据而设计。它可以与像 Confluence 这样的内容平台集成,创建用于 检索增强生成(RAG) 搜索的安全文本索引。通过仅提供实时数据并从源系统强制执行实时用户权限,Redactive 确保 AI 模型访问的是准确且授权的信息,而不会影响安全性。此外,它还为工程团队提供工具,支持他们安全地使用任何大语言模型构建 AI 应用场景。对于正在探索 AI 驱动解决方案的组织,Redactive 提供了一种简化的数据准备和合规方法,在安全与可访问性之间取得平衡,为团队在受控环境中试验 AI 能力提供支持。
-
78. System Initiative
我们对 System Initiative 依然感到非常兴奋。这款实验性工具为 DevOps 工作开辟了一条全新的激进方向。我们非常欣赏该工具背后富有创造性的思考,并希望它能够激励更多人突破基础设施即代码(Infrastructure-as-Code)的现状。System Initiative 目前已结束 Beta 阶段,并以 Apache 2.0 许可的形式免费开源。尽管其开发者已经在生产环境中使用该工具来管理基础设施,但它在满足大型企业需求的规模化能力方面仍有改进空间。然而,我们依然认为值得一试,以体验一种与众不同的 DevOps 工具方法。
-
79. TabPFN
TabPFN 是一个基于 Transformer 的模型,专为在小规模表格数据集上实现快速而准确的分类而设计。它利用了上下文学习(In-Context Learning, ICL),直接从标注样本中进行预测,无需超参数调整或额外训练。TabPFN 在数百万个合成数据集上预训练,因而能够很好地泛化到不同的数据分布,同时对缺失值和异常值具有较强的处理能力。它的优势包括高效处理异构数据以及对无信息特征的鲁棒性。
TabPFN 尤其适用于对速度和准确性要求较高的小规模应用场景。然而,它在处理大规模数据集时面临扩展性挑战,并且在回归任务中能力有限。作为一项前沿解决方案,TabPFN 值得评估,尤其是在表格分类任务中,它有潜力超越传统模型,并为 Transformer 在表格数据中的应用开辟新可能性。
-
81. Windsurf
Windsurf 是 Codeium 推出的 AI 编程助手,以其“代理型”(agentic)能力而闻名。类似于 Cursor 和 Cline,Windsurf 允许开发者通过 AI 聊天驱动实现代码的导航、修改以及命令的执行。它经常发布针对“代理模式”的全新功能和集成。例如,最近它推出了一个浏览器预览功能,使代理能够轻松访问 DOM 元素和浏览器控制台,还提供了一个网页研究功能,让 Windsurf 在适当情况下可以在互联网上查找文档和解决方案。Windsurf 支持多种主流 AI 模型,用户可以启用并引用网页搜索、库文档以及 MCP(Model Context Protocol)集成作为额外的上下文提供者。这些能力让 Windsurf 成为开发者高效工作的强大工具。
-
82. YOLO
Resistir
¿No encontraste algo que esperabas ver?
Cada edición del Radar presenta noticias que reflejan lo que hemos encontrado durante los seis meses anteriores. Es posible que ya hayamos cubierto lo que busca en un Radar anterior. A veces seleccionamos cosas simplemente porque hay demasiadas de las que hablar. También es posible que falte algún dato porque el Radar refleja nuestra experiencia, no se basa en un análisis exhaustivo del mercado.
