Conceito ainda é confundido com o Business Intelligence, que olha para o passado durante a leitura de um conjunto de dados em um data warehouse
Por Gabriel Camargo*
Nos meus últimos anos de pesquisas e trabalho na área de tecnologia – mais especificamente na área de análise de dados – tenho me deparado com grande confusão em torno do Business Analytics. Por isso, procurei aqui desmistificar e criar um guia rápido para aplicação do B.A. nas empresas.
Business Analytics é muito amplo: contempla mineração de dados, Big Data, Data Science, procedimentos de descoberta de conhecimento e, claro, o envolvimento da área de negócio (do business). O principal objetivo é a obtenção de informações mais ricas, profundas e precisas sobre clientes, parceiros e operações de negócio. O interessante é a obtenção em tempo real, com mecanismos que possam prever minuciosamente o comportamento do cliente a partir desses dados.
Os estatísticos e cientistas da computação sempre se depararam com um grande problema: escassez de dados. Por isso, as previsões nunca foram precisas o suficiente. Com o advento do Big Data e com o poder computacional dobrando em um curto espaço de tempo, passamos a ter dados disponíveis em abundância e sobre qualquer assunto. Aí entra o conceito de Data Science: aplicação de modelos que fazem previsões a partir da identificação de padrões do conjunto de dados de uma empresa. Modelos de deep learning estão alcançando previsões na casa de 99% de exatidão.
O conceito acima ainda se confunde bastante com o Business Intelligence. Diferente do Analytics, o BI tem um olhar para o passado, faz a leitura de um conjunto de dados em um data warehouse, extrai informação útil e elabora um dashboard para apoiar os tomadores de decisão que precisam empregar a sua intuição combinada com sua experiência para realizar essa tarefa.
Confira abaixo os 5 passos para aplicar analytics na sua empresa:
Passo 1: Defina claramente o problema
Definir claramente o problema de negócio que se deseja resolver com analytics é o primeiro passo. Essa definição determinará: quais ferramentas e técnicas serão utilizadas, os modelos que serão aplicados, dados que serão imprescindíveis e quais procedimentos serão tomados durante as fases de pré-processamento, mineração e pós-processamento para criação do modelo preditivo.
É com base no problema do negócio que você definirá qual o nível de precisão que o modelo deve ter ao final (ou apenas chamado de score). Por exemplo, ao se trabalhar com previsões de Churn, Inadimplência, Concessão de Crédito e outros, seu score poderá assumir inicialmente uma taxa de 70% a 80%. Mesmo assim os benefícios são grandes no estágio inicial. No entanto, se o objetivo das previsões estiver relacionado à área médica, como previsão de doenças cardíacas, por exemplo, o ideal é que o score seja o mais alto possível, visto que imprecisões e erros podem significar vidas humanas. Definir claramente o problema norteará todo o trabalho.
Passo 2: Selecione seus dados
A qualidade dos dados de entrada determinará a qualidade do modelo na saída. Logo após a definição do problema, você selecionará os dados que lhe ajudarão a resolvê-lo. Essa é a etapa de coleta e organização dos dados. Muito provavelmente as informações necessárias estarão em mais de uma fonte e saber extrair e associar essas informações é uma tarefa fundamental para que seu modelo não sofra de underfitting (nome dado ao modelo que não generalizou por não ter dados suficientes).
Passo 3: Minere seus dados
Mineração de dados é o processo de exploração de grandes quantidades de dados com o objetivo de encontrar anomalias, padrões e correlações para suportar a tomada de decisões e proporcionar vantagens estratégicas.
Uma vez que a base de dados foi preparada no passo anterior, a fase seguinte tem a função de extrair o conhecimento. Nesta etapa são aplicadas técnicas estatísticas e algoritmos computacionais para construção dos modelos de predição ou classificação, segmentação de clientes e identificação de perfis.
Ainda não existe uma IA genérica, por isso, deverão ser usados modelos de classificação para prever uma ou mais classes, como por exemplo, ceder ou não o crédito a um cliente. Você usará modelos de regressão se quer prever uma variável numérica e contínua. Ou seja, se vou ceder crédito ao cliente, quanto devo ceder?
Mas se o seu objetivo é a segmentação e classificação de imagens diagnósticas com intuito de prever a probabilidade de um paciente ter câncer de mama, por exemplo, muito provavelmente você deverá utilizar algoritmos de deep learning que foram concebidos para resolver problemas complexos como este. O problema de negócio lhe ajudará a definir melhor as técnicas dessa fase.
Passo 4: Defina o seu ambiente de processamento
Outro aspecto importante é saber em qual arquitetura sua modelagem será processada. Algoritmos mais avançados aplicados a grandes conjuntos de dados podem levar dias ou semanas para concluírem seu processamento. Existem inúmeras soluções de processamento paralelo que nos ajudam a ter performance nesses momentos, seja através de computadores trabalhando paralelamente, seja por meio de GPU (unidade gráfica de processamento), que vem ganhando destaque no processamento de cálculos em machine e deep learning na última década.
Passo 5: Gere bons dashboards
Ter um bom dashboard garante não apenas visualizar as previsões por diversos ângulos, mas ajuda a compreender outro grande problema que é o overfitting (nome dado ao modelo que decorou o relacionamento entre os dados ao invés de aprender). Um modelo com esse problema não consegue detectar os relacionamentos entre os dados e, por consequência, não consegue fazer as previsões com novos dados de produção. Saber visualizar, analisar e interpretar corretamente a saída do modelo lhe permitirá colocá-lo em produção com maior segurança.
Embora, segundo a Gartner, apenas 3% das empresas utilizem essas técnicas, tenho certeza que dados os ganhos e benefícios que ela proporciona, esse é um caminho sem volta para qualquer empresa que pretende se manter ativa no futuro.
Gabriel Camargo é Engenheiro de dados, co-fundador e CEO da Deep Center