Dada a necessidade de iniciativas de dados surgirem e manterem o alinhamento com o negócio, um departamento dedicado a cientistas de dados pode não ser a melhor abordagem. Como Hadaway ressalta, "a contratação de cientistas de dados não fará seu negócio ser bem-sucedido. O restante da organização também precisa saber como usar os dados".
"As pessoas contratam cientistas de dados descontroladamente, mas realmente não sabem onde essas pessoas se encaixam na organização, então as colocam em um time de serviços compartilhados, ou talvez como parte do departamento de marketing ou finanças", diz Collier. "Dessa forma, cientistas de dados permanecem em seus silos, não interagindo muito com o restante da empresa para entender o que é importante e com quais problemas terão que lidar".
A ativação dessas interações e a geração de insights prontos para o negócio exigem não apenas uma arquitetura de dados aberta, mas também equipes coesas. Para trabalhar bem com os dados, as equipes precisam incluir tecnologistas e líderes do negócio, sendo orientadas por uma estratégia compartilhada e resultados definidos.
"Você precisa quebrar essas barreiras entre TI negócios e estruturar equipes multifuncionais desenhadas para criar produtos", diz Collier. "Você precisa, então, colocar as pessoas certas nessas equipes, não apenas para fazer aprendizado de máquina avançado, mas também para ter especialistas em negócios que podem dizer 'sim, aprendizado de máquina é importante, e esse modelo de aprendizado de máquina realmente faz algo útil e significativo'".
Esse processo funciona nos dois sentidos. Assim como cientistas de dados precisam entender as metas do negócio, outras partes da empresa precisam reconhecer que os dados são um recurso e uma responsabilidade compartilhados. Elementos básicos de governança de dados, como definir quem detém a propriedade e o acesso aos dados, geralmente são estabelecidos e gerenciados de cima para baixo. Mas as pessoas em todas as linhas do negócio devem examinar os dados gerados no decorrer das operações diárias, para determinar o papel que podem desempenhar na tomada de decisões e garantir a manutenção de padrões consistentes.
"É o que chamamos de democratização dos dados", diz Windheuser. "Todo mundo é capaz de utilizar os dados, mas todo mundo também é responsável por limpá-los, cuidar deles, para que a qualidade esteja lá e atualizada. É como uma família vivendo em uma casa."
Essa filosofia deve se estender à organização dos dados, para que eles sejam adequados a fins comerciais. Essa é uma tarefa definitivamente não-atraente, geralmente chamada de "munging" e normalmente reservada para tecnologistas.
"Os usuários corporativos precisam se envolver no processo, porque são eles que entendem por que um dado está 'sujo'", diz Parsons. "Você também precisa de tecnologistas, preferencialmente com uma longa história na organização, porque particularmente para dados que existem há vários anos, existem todos os tipos de armadilhas. Portanto, você precisa de alguém que entenda a história dos sistemas, mas também de alguém que entenda o que os dados realmente significam, no contexto comercial para resolver os problemas que surgem."
Conforme destacado na última edição do Technology Radar, novas ferramentas e inovações de dados são apenas mais palavras da moda quando vistas isoladamente. O que estimula o progresso é descobrir como combinar essas inovações de dados com práticas de engenharia pe em equipes bem definidas.