Diante da falta de cientistas de dados, as organizações se voltam à automação de Machine Learning e a analytics embutidos
Os insights movidos por dados são completamente dependentes da habilidade das corporações em não só coletar os dados, como analisá-los para encontrar as informações relevantes, úteis e proveitosas sobre os consumidores, os mercados, o desenvolvimento de produtos, e suas operações.
Até pouco tempo atrás, isso significou contratar cientistas de dados que sabem como criar algoritmos de machine learning, construir modelos de computação preditiva, integrar dados de múltiplas fontes (incluindo dados desestruturados), e revelar a informação mais relevante para a estratégia e os objetivos de negócio.
No entanto, a demanda por cientistas de dados continua grande, o que significa que eles são difíceis de encontrar e têm salários que podem ser custosos para os orçamentos de TI. A falta de cientistas de dados treinados tem deixado muitas corporações em desvantagem competitiva na economia digital.
Machine Learning Automatizado
Para preencher a lacuna e atender a demanda do negócio, algumas organizações optaram por “democratizar” a ciência de dados fornecendo treinamento a colaboradores que trabalham com números em diferentes departamentos de áreas, tais como a visualização e a manipulação de dados, reportagem dinâmica e programação R (uma linguagem de programação de código aberto para ciência de dados e estatísticas).
Também, cada vez mais, as corporações estão se voltando a tecnologias como a inteligência artificial (IA), o machine learning (ML), a automação, e programas de analytics pré-embutidos em aplicações para coletar e interpretar dados de consumidores, dispositivos, aplicativos, bases de dados, e outras fontes.
“As APIs de Machine Learning facilitam para desenvolvedores a aplicação de machine learning em um conjunto de dados para adicionar recursos preditivos às suas aplicações.”
“As APIs de Machine Learning facilitam para desenvolvedores a aplicação de machine learning em um conjunto de dados para adicionar recursos preditivos às suas aplicações,” escreve Khushbu Shah no site de dados e analytics KDnuggets. “As APIs de Machine Learning fornecem uma camada de abstração para que os desenvolvedores integrem o machine learning em aplicações do mundo real sem ter que se preocupar com o escalonamento dos algoritmos em sua infraestrutura e com o conhecimento em detalhes dos algoritmos de machine learning.”
A Google AutoML, a AES Sagemaker e a BigML estão entre as APIs de machine learning disponíveis para empresas que buscam fazer uso de dados. O AutoML baseado em nuvem é um conjunto de ferramentas de ML desenhadas para ajudar desenvolvedores sem experiência extensa em ML e treinar em habilidades modelos de alta qualidade que revelam dados de importância para o negócio. A Sagemaker fornece aos usuários o desenvolvimento em um clique de modelos de ML e métricas em tempo real durante o processo de treinamento. A BigML oferece assinaturas mensais para sua plataforma de ML com o preço variando entre grátis a até $10.000, junto com desenvolvimentos privados e treinamento personalizado.
O ML automatizado reduz o tempo que os cientistas de dados gastam em testagem de modelo, preparação de dados, e em outras atividades importantes, porém banais. As ferramentas AutoML não têm a intenção de “substituir os cientistas de dados”, escreve Priya Dialani no Analytics Insight. Em vez disso, elas permitem que esses profissionais “descarreguem carga de trabalho das suas rotinas e organizem seus procedimentos para liberá-los e direcioná-los para diferentes partes do procedimento que requerem um nível mais significativo de razão e criatividade”
Outra forma do ML automatizado entregar valor é na escalabilidade. Humanos possuem limitações, seja em seu tempo, energia ou capacidade de carga de trabalho. Ao empregar o ML automatizado, as organizações podem transcender essas barreiras que seguram iniciativas de ciência de dados.
Benefícios dos analytics embutidos
"Por conta da funcionalidade de analytics ser integrada à aplicação do negócio, o usuário tem contexto situacional em seus dados e insights, permitindo que pessoas que não sejam cientistas de dados, de forma mais assertiva, criem relatórios, cheguem a insights, e entendam a significância dos seus dados.”
Algumas empresas estão satisfazendo suas necessidades de análises de dados ao empregar softwares com funções pré-embutidas de analytics. Em um estudo feito pela Nucleus Research, corporações que usam analytics embutidos em suas aplicações hospedeiras reportaram vários benefícios, incluindo a redução de até 85% no tempo de construção de software, custos mais baixos de desenvolvimento recorrente e manutenção, e uma produtividade do usuário muito melhor.
Além disso, o analista da Nucleus Research Daniel Elman diz, “por conta da funcionalidade de analytics ser integrada à aplicação do negócio, o usuário tem contexto situacional em seus dados e insights, permitindo que pessoas que não sejam cientistas de dados, de forma mais assertiva, criem relatórios, cheguem a insights, e entendam a significância dos seus dados.”
Os melhores dados no mundo não farão nenhum bem a uma organização se ela não for capaz de extraí-los e analisá-los. O ML automatizado e analytics pré-embutidos são ferramentas emergentes que podem permitir que empresas com pequenos (ou até sem) times de ciência de dados sejam movidas por dados e inteligência por causa deles.
Sobre o autor
Chris Nerney é um escritor de tecnologia que cobre tecnologia móvel, colaboração de espaço de trabalho, automação, IA e computação em nuvem. Ele vive no norte do estado de Nova York.