Cientistas e pessoas engenheiras de dados frequentemente usam bibliotecas, como pandas, para fazer uma análise ad hoc. Embora expressivas e poderosas, essas bibliotecas têm uma limitação importante: elas funcionam apenas em um único CPU e não fornecem escalabilidade horizontal para grandes grupos de dados. Dask, entretanto, inclui um agendador leve e de alta performance que pode escalar de um laptop a um cluster de máquinas. E por trabalhar com NumPy, pandas e Scikit-learn, Dask parece promissora para uma avaliação mais aprofundada.