Ir para conteúdo principal

O poder do aprendizado semissupervisionado em marketing e vendas

Veja como o aprendizado semissupervisionado (semi‑supervised learning) funciona e a diferença para aprendizado supervisionado e não supervisionado.

O aprendizado semissupervisionado é o futuro do aprendizado de máquina (machine learning) em vendas e marketing.

Cientistas de dados especializados em aprendizado de máquina às vezes falam de secas e inundações de dados. Às vezes, analistas de dados especializados em vendas e marketing estão desesperados por dados que não possuem. Outras vezes, eles estão se afogando em dados que não podem usar.

O aprendizado semissupervisionado aborda os problemas de secas e inundações de dados. Mas, para entender as vantagens do aprendizado semissupervisionado, precisamos entender o aprendizado supervisionado e não supervisionado e como o semissupervisionado melhora as técnicas de vendas e marketing.

O que é aprendizado de máquina semissupervisionado?

O aprendizado semissupervisionado é uma técnica híbrida de aprendizado de máquina que usa uma combinação de dados rotulados e não rotulados.

Essa técnica trata os pontos de dados de maneira diferente com base no fato de terem um rótulo ou não. Se um ponto de dados for rotulado, o algoritmo usará o ponto de dados para atualizar os pesos dados aos coeficientes em, por exemplo, uma equação de regressão linear. Se o ponto de dados não estiver rotulado, ele procura minimizar as diferenças capturadas na análise de médias k, por exemplo.

A eficiência do aprendizado semissupervisionado pode ser melhorada por uma coleção de algoritmos para aprendizado ativo. Algoritmos de aprendidos ativos precisam de menos consultas para alcançar alta precisão do que a seleção de consultas aleatórias. Mas, por enquanto, consideraremos o aprendizado ativo como uma forma de aprendizado não supervisionado.

Aqui estão as duas conclusões mais importantes sobre o aprendizado semissupervisionado.

  1. O aprendizado de máquina semissupervisionado trata os dados rotulados da mesma forma que o aprendizado supervisionado. Ele faz previsões e calcula pesos para diferentes variáveis.
  2. O aprendizado de máquina semissupervisionado usa pontos de dados não rotulados para tornar o modelo mais consistente. Exemplos não rotulados se baseiam no progresso feito com dados rotulados.

Técnicas de aprendizados supervisionados vs. semissupervisionados vs. não supervisionados

Quando se trata de saber a diferença entre aprendizado supervisionado, semissupervisionado e não supervisionado, o principal fator é o tipo de dados de que cada um depende.

O aprendizado de máquina supervisionado usa dados rotulados para treinar seus algoritmos. O aprendizado supervisionado é dividido em dois tipos principais: classificação e regressão. Algoritmos de classificação podem, por exemplo, atribuir clientes potenciais a uma posição em seu funil de vendas. Algoritmos de regressão podem identificar valores de corte para uma métrica de decisão, como concessão de crédito, com base em uma combinação de fatores.

Algoritmos de aprendizado supervisionado criam um modelo pós-dictivo que encontra relações entre observações que dizem aos humanos coisas que eles não sabiam sobre os dados que possuem. Mas como a rotulagem de dados é demorada e cara, os algoritmos de aprendizado de máquina supervisionados geralmente não têm todos os dados de que precisam para atingir seu potencial poder pós-dictivo.

O aprendizado não supervisionado encontra relacionamentos em dados não rotulados. Não pode necessariamente dizer o que seus dados estão descrevendo, mas pode dizer quais observações são semelhantes. Como as entradas humanas em um processo de rotulagem não são necessárias, não há falta de dados para alimentar os algoritmos.

Mas o grande volume de dados em uma imagem pode tornar o processamento tão lento que a quantidade de informações úteis dos dados é limitada pelo fluxo de dados que flui para o sistema. Como resultado, a análise pode não atingir uma pontuação F1 adequada.

A pontuação F1 é um cálculo da proporção de verdadeiros positivos (observações categorizadas corretamente) para o total de falsos positivos (observações classificadas como algo que não eram) mais falsos negativos (observações não classificadas como algo que eram).

Como mencionado, o aprendizado semissupervisionado não requer que todos os dados sejam rotulados, mas também pode usar dados não rotulados. Essa característica torna o aprendizado semissupervisionado um meio termo entre o aprendizado supervisionado e o não supervisionado.

Os fundamentos básicos do aprendizado semissupervisionado

Vamos detalhar como o aprendizado semissupervisionado funciona em 4 etapas para ajudar você a entender alguns de seus principais componentes.

1. Rotulagem de dados

Primeiro, e um dos componentes mais importantes, são os dados. Como mencionado, o aprendizado semissupervisionado usa dados rotulados e não rotulados para treinar seus algoritmos.

Com o aprendizado semissupervisionado, você primeiro adicionará rótulos a alguns dos dados. Isso lhe dará uma base para construir, o que será importante para as etapas seguintes.

2. Treinamento de modelo

Agora que você rotulou os dados, deve ensinar ao seu algoritmo o que fazer com eles e quais resultados são esperados antes de adicionar quaisquer dados não rotulados à mistura.

3. Integração de dados não rotulados

Depois que seu modelo for treinado nos dados rotulados, você poderá adicionar os dados não rotulados. Como essa técnica de aprendizado de máquina pode usar os dois tipos de dados, isso permite reduzir os custos em comparação com o aprendizado supervisionado porque você está expandindo seu conjunto de dados por meio da adição de dados não rotulados.

4. Avaliação e refinamento do modelo

O aprendizado de máquina requer avaliação e alterações para garantir que o modelo que você criou seja preciso. O treinamento é um progresso contínuo, então provavelmente você terá que fazer ajustes em seu algoritmo.

As vantagens do aprendizado semissupervisionado em vendas e marketing

O aprendizado de máquina em marketing pode ajudar a melhorar a pontuação de leads para personalização aprimorada e identificar o público-alvo, gerenciar seu público e reduzir a rotatividade de clientes.

O aprendizado de máquina semiestruturado também é útil para uma variedade de objetivos de análise de dados comuns às operações de marketing digital.

Melhor segmentação de clientes

Em estudos de aprendizado de máquina semissupervisionado como uma ferramenta para melhorar a segmentação de clientes, a técnica é frequentemente descrita como uma rede neural de encaminhamento do feed treinada por um algoritmo de retropropagação.

O que isso significa é que, quando você não tem informações completas sobre seus clientes em potencial, um programa de aprendizado de máquina semissupervisionado pode preencher os dados para que você não precise coletar, inserir e verificá-los.

Por que isso é importante?

Você provavelmente se deparou com o Princípio de Pareto. Aplicado a um negócio, isso significaria que 20% de seus clientes geram 80% de seus lucros. Ou você pode estar familiarizado com uma ideia desenvolvida por dois pesquisadores de marketing chamados Reichfeld e Teal, chamada O efeito da lealdade. Um aumento de 5% na fidelidade do cliente pode resultar em um aumento de 20 a 95% em seus lucros.

Há uma compensação entre o custo da coleta de dados e os benefícios da segmentação aprimorada de clientes com programas de aprendizado supervisionado, mas o custo da coleta de dados é muito menor com programas de aprendizado semissupervisionado.

Melhor pontuação e qualificação de leads

Os vendedores querem ser capazes de prever quais leads serão fechadas com uma venda. Especialmente em vendas B2B, os dados para pontuar e qualificar leads provavelmente já existem em seu rastreamento da web e análise de e-mail do Mailchimp, além de seus registros de banco de dados de CRM.

Algumas pontuações e qualificações de leads podem ser feitas com aprendizado de máquina supervisionado. Por exemplo, seus dados analíticos do Mailchimp informarão o número de e-mails abertos. Você pode explorar seus dados de vendas para calcular a correlação entre o número de e-mails abertos e as conversões de vendas.

Da mesma forma, você pode calcular uma estatística correlacionando o número de visitas ao seu site com a probabilidade de fechar uma venda com seus dados de rastreamento da web do Mailchimp. Mas, provavelmente, você descobriria que nem todas as visitas a páginas da web são iguais. O aprendizado de máquina semissupervisionado pode identificar as análises na página que aumentam o poder preditivo do seu modelo de pontuação e qualificação de leads.

Maior eficácia de publicidade direcionada

A publicidade direcionada é voltada para públicos que compartilham certas características, dependendo do produto que está sendo promovido. Essas características podem ser demográficas, psicográficas ou padrões passados de decisões de compra.

Depois que o público-alvo é identificado, a publicidade é direcionada à propriedade, colocada em uma página específica de um site escolhido ou segmentada por comportamento, exibida depois que um cliente em potencial realiza um determinado comportamento online.

A eficácia da publicidade direcionada é limitada pela quantidade de dados que o vendedor possui sobre clientes em potencial. O aprendizado de máquina semiestruturado funciona com os dados disponíveis. Cria um modelo de comportamento do comprador com base em uma combinação de dados rotulados e não rotulados.

Cria pseudo-rótulos para fazer previsões adicionais e refina o modelo à medida que os dados de vendas chegam. À medida que o modelo preenche cada vez mais as lacunas na coleta de dados, ele oferece uma compreensão cada vez melhor da persona ideal do comprador.

O que é personalização de marketing por e-mail

Todo mundo usa aprendizado de máquina semissupervisionado em sua conta de e-mail todos os dias. Os filtros de spam operam com dados rotulados (as mensagens que você marcou como spam) e dados não rotulados (mensagens que você provavelmente nunca verá) para pelo menos reduzir a quantidade de spam em sua caixa de correio.

O desafio do aprendizado de máquina semissupervisionado no marketing por e-mail é "filtrar" suas mensagens, para que sejam abertas e executadas. Para isso, o aprendizado de máquina semissupervisionado pode ser extremamente útil.

  • Limitando a quantidade de tempo que você gasta em testes A/B. Com o aprendizado de máquina não supervisionado, você pode misturar mais elementos em seus e-mails para aumentar as taxas de abertura, o envolvimento do leitor e os cliques.
  • Calibrando o horário dos seus e-mails. Você não gostaria de saber quando seus clientes terão tempo e vontade de ler seus e-mails? O aprendizado de máquina semiestruturado pode identificar os hábitos dos destinatários de e-mail para informar quando enviar para obter os melhores resultados.
  • Personalização da promoção. Quando você sabe o que seus clientes querem, você pode vendê-la a eles!

Modelagem preditiva de rotatividade de clientes

O aprendizado de máquina semiestruturado não apenas ajuda você a fazer vendas. Às vezes, ajuda a salvar o relacionamento com os clientes. Os modelos de rotatividade de clientes são mais precisos com menos dados com aprendizado de máquina semiestruturado.

Desafios e limitações comuns do aprendizado semissupervisionado

É importante entender que os modelos de aprendizado de máquina semiestruturados funcionam melhor à medida que são treinados e que sua qualidade dependerá de seus dados de treinamento. Como tal, isso pode levar a algumas limitações diferentes.

Dados rotulados limitados e seu impacto no desempenho do modelo

Como mencionado, os modelos de aprendizado de máquina são limitados pelos dados que possuem. Isso significa que um modelo com dados rotulados limitados ficará restrito a essas informações.

Manutenção contínua necessária

O aprendizado de máquina semiestruturado não é um modelo único. Requer manutenção constante e experiente. Isso significa que o aprendizado de máquina precisará ser um investimento de longo prazo e exigirá supervisão enquanto é executado.

Perspectivas futuras para aprendizado semissupervisionado

O aprendizado de máquina e semissupervisionado como um todo continuará crescendo e se tornando disponível por meio de ofertas como serviço para empresas sem recursos para construir seus próprios modelos.

À medida que as ofertas se tornam mais acessíveis, as empresas poderão entender o aprendizado de máquina como uma ferramenta para aprimorar seus serviços e experiências do cliente.

Compartilhar este artigo