A medida que los vehículos definidos por software (SDVs) han ganado protagonismo en el mercado automotriz, la industria se ha visto obligada a replantear su enfoque de arquitectura. Estamos empezando a ver un cambio del diseño eléctrico basado en muchas unidades de control electrónico distribuidas (ECU) hacia lo que se conoce como arquitectura zonal.

Este cambio trae consigo muchos beneficios: un mejor flujo de datos, mayor eficiencia en las actualizaciones de software y funcionalidades over-the-air (OTA), por mencionar algunos. Sin embargo, también exige una modernización significativa de las bases de código. Esto resulta especialmente complejo porque gran parte del software que corre en los vehículos está escrito en C++, un lenguaje notoriamente difícil de leer.

Ese no es el único reto. Modernizar C++ en este contexto no significa solo refactorizar u optimizar código existente; también es necesario integrarlo con nuevas capas de software para garantizar la compatibilidad con hardware moderno y protocolos de comunicación asincrónicos, como CAN o SOME/IP.

Hacer esto bien es crucial para la industria automotriz. En este artículo exploro cómo las herramientas de IA generativa podrían ayudarnos a modernizar rápidamente el complejo código en C++. Estas herramientas pueden ser determinantes para que los fabricantes de automóviles aprovechen todo el potencial del SDV con rapidez y se mantengan competitivos en un entorno en constante evolución.

Modernización de C++ con una herramienta de IA

En Thoughtworks hemos desarrollado una herramienta de IA generativa específicamente diseñada para ayudar a los equipos a modernizar código legacy: CodeConcise. CodeConcise fue creada inicialmente para acelerar la ingeniería inversa de grandes bases de código en COBOL. Sin embargo, es extensible y puede adaptarse a muchos otros lenguajes de programación, incluido C++. Queríamos explorar cómo usar CodeConcise en el contexto automotriz y de SDVs con la esperanza de simplificar y acelerar el proceso de modernización. Comenzamos nuestras pruebas con Autoware Universe, un software stack open source para vehículos autónomos desarrollado por la Autoware Foundation, construido sobre el Robot Operating System 2 (ROS 2).

Cómo funciona CodeConcise

Antes de profundizar, vale la pena explicar cómo funciona realmente CodeConcise. Consta de dos partes: el análisis del código que se le proporciona y la interfaz de usuario que incluye, entre otras cosas, un chat. Para poder interactuar con la base de código mediante un chatbot o ver las capacidades extraídas por el LLM, primero debemos hacer que la herramienta conozca nuestra base de código específica.

CodeConcise utiliza RAG respaldado por un knowledge graph que se inserta en una base de datos Neo4j. Esta ingesta es la primera fase: el código se inserta en el grafo de forma estructurada, para que en una segunda fase el LLM pueda entender las distintas partes de la base de código y cómo encajan entre sí.

Observamos que otras integraciones de lenguajes usaban análisis de código estático para extraer e ingerir fragmentos. Empezamos dividiendo el código en clases, después en métodos, y luego extrayendo namespaces. Finalmente, dejamos atrás el análisis estático y pasamos a CLANG (usando los bindings de Python de LLVM libclang), un frontend de compilador. Esto ayudó a manejar la complejidad de C++ y nos permitió implementar distintas relaciones entre fragmentos lógicos del código.

Al hacerlo, no solo analizábamos el código; también podíamos usar el árbol de sintaxis e insertar partes de este en el grafo.