Publicado : Apr 26, 2023
Apr 2023
Probar
Vale la pena intentarlo. Es importante entender cómo construir esta habilidad. Las empresas deberían implementar esta tecnología en un proyecto que pueda manejar el riesgo.
Apache Hudi es una plataforma data lake de código abierto que provee garantías transaccionales ACID al data lake. Nuestros equipos han tenido una muy buena experiencia al utilizar Hudi en un escenario de alto volumen y de alta capacidad mediante inserciones y upserts en tiempo real. En particular, nos gusta la flexibilidad que Hudi ofrece para personalizar el algoritmo de compactación, que ayuda a abordar problemas con “archivos pequeños”. Apache Hudi se encuentra dentro de la misma categoría que Delta Lake y Apache Iceberg. Todos ellos soportan características similares, pero cada uno difiere en sus implementaciones subyacentes y listas detalladas de características.
