Menú
Oct 2020
Evaluar?

DuckDB es una base de datos embebida, basada en columnas, para cargas de trabajo analíticas y de ciencia de datos. Las personas analistas pasan una cantidad significativa de tiempo limpiando y visualizando los datos localmente antes de llevarlos a los servidores. A pesar de que hemos contado con sistemas de bases de datos por décadas, la mayoría están diseñadas para casos de uso cliente-servidor y, por lo tanto, no son adecuadas para consultas locales interactivas. Para superar esta limitación, las personas analistas normalmente recurren a herramientas de procesamiento de datos en memoria, como Pandas o data.table. Aunque estas herramientas son efectivas, limitan el alcance del análisis al volumen de datos que cabe en la memoria. Nos parece que DuckDB llena bien este vacío proporcionando un motor embebido basado en columnas, optimizado para funciones analíticas en conjuntos de datos locales y de tamaños mayores que la memoria disponible.