Passer au contenu principal

Le pouvoir de l'apprentissage semi‑supervisé dans les ventes et le marketing

L'apprentissage semi‑supervisé peut utiliser des données étiquetées et non étiquetées. Découvrez les avantages et les inconvénients de l'apprentissage supervisé.

L'apprentissage semi-supervisé est l'avenir de l'apprentissage automatique dans le domaine de la vente et du marketing.

Les analystes de données spécialisés dans l'apprentissage automatique parlent souvent d'un manque et d'une surabondance de données. Parfois, les analystes de données spécialisés dans les ventes et le marketing sont désespérément en quête de données qu'ils ne possèdent pas. À d'autres moments, ils se noient dans des données qu'ils ne peuvent pas utiliser.

L'apprentissage semi-supervisé répond à ces problèmes de manque et de surabondance de données. Mais pour comprendre les avantages de l'apprentissage semi-supervisé, nous devons comprendre l'apprentissage supervisé et non supervisé et comment le semi-supervisé améliore les techniques de vente et de marketing.

Qu'est-ce que l'apprentissage automatique semi-supervisé ?

L'apprentissage semi-supervisé est une technique d'apprentissage automatique hybride qui utilise une combinaison de données étiquetées et non étiquetées.

Cette technique traite les points de données différemment selon si ces points ont une étiquette ou non. Si un point de données est étiqueté, l'algorithme utilise le point de données pour mettre à jour les pondérations données aux coefficients dans, par exemple, une équation de régression linéaire. Si le point de données n'est pas étiqueté, il cherche à minimiser les différences capturées, par exemple, dans l'analyse des k-moyennes.

L'efficacité de l'apprentissage semi-supervisé peut être améliorée par un ensemble d'algorithmes pour l'apprentissage actif. Les algorithmes d'apprentissage actif nécessitent moins de requêtes pour obtenir une précision élevée que la sélection aléatoire de requêtes. Mais pour l'instant, nous considérerons l'apprentissage actif comme une forme d'apprentissage non supervisé.

Voici les deux points les plus importants à retenir sur l'apprentissage semi-supervisé.

  1. L'apprentissage automatique semi-supervisé traite les données étiquetées de la même manière que l'apprentissage supervisé. Il effectue des prédictions et calcule les pondérations pour différentes variables.
  2. L'apprentissage automatique semi-supervisé utilise des points de données non étiquetés pour rendre le modèle plus cohérent. Les exemples non étiquetés s'appuient sur les progrès réalisés avec les données étiquetées.

Techniques d'apprentissage supervisé, semi-supervisé ou non supervisé

Lorsqu'il s'agit de connaître la différence entre l'apprentissage supervisé, semi-supervisé et non supervisé, le facteur le plus important est le type de données sur lesquelles chacun s'appuie.

L'apprentissage automatique supervisé utilise des données étiquetées pour entraîner ses algorithmes. L'apprentissage supervisé est divisé en deux principaux types : la classification et la régression. Les algorithmes de classification peuvent, par exemple, affecter des prospects à un poste dans votre entonnoir de vente. Les algorithmes de régression peuvent identifier les valeurs limites pour un indicateur de décision, comme l'octroi de crédit, en fonction d'une combinaison de facteurs.

Les algorithmes d'apprentissage supervisé créent un modèle rétrospectif qui trouve des relations entre les observations qui disent aux humains des choses qu'ils ne savaient pas sur les données qu'ils ont. Mais comme l'étiquetage des données prend beaucoup de temps et est coûteux, les algorithmes d'apprentissage automatique supervisés ne disposent souvent pas de toutes les données dont ils ont besoin pour atteindre leur potentiel de prévision.

L'apprentissage non supervisé trouve des relations dans des données non étiquetées. Cette méthode ne peut pas réellement vous dire ce que vos données décrivent, mais elle peut vous indiquer quelles observations sont similaires. Le processus d'étiquetage ne nécessitant pas d'intervention humaine, car il n'y a pas de manque de données pour alimenter les algorithmes.

Mais le volume de données d'une image peut ralentir le traitement de telle sorte que la quantité d'informations utiles provenant des données est limitée par l'afflux de données entrant dans le système. Par conséquent, l'analyse peut ne pas atteindre un score F1 adéquat.

Le score F1 est un calcul du rapport entre les vrais positifs (observations qui sont catégorisées correctement) et le total des faux positifs (observations classées comme quelque chose qu'elles n'étaient pas) et les faux négatifs (observations non classées comme quelque chose qu'elles étaient).

Comme mentionné, l'apprentissage semi-supervisé ne nécessite pas que toutes les données soient étiquetées, mais peut également utiliser des données non étiquetées. Cette caractéristique fait de l'apprentissage semi-supervisé un terrain intermédiaire entre l'apprentissage supervisé et l'apprentissage non supervisé.

Les bases de l'apprentissage semi-supervisé

Décomposons le fonctionnement de l'apprentissage semi-supervisé en 4 étapes pour vous aider à comprendre certains de ses composants clés.

1. Étiquetage des données

Tout d'abord, les données, l'un des éléments les plus importants. Comme mentionné, l'apprentissage semi-supervisé utilise des données étiquetées et non étiquetées pour former ses algorithmes.

Avec l'apprentissage semi-supervisé, vous allez d'abord ajouter des étiquettes à certaines données. Cela vous donnera une base sur laquelle vous appuyer, ce qui sera important pour les étapes suivantes.

2. Formation du modèle

Maintenant que vous avez étiqueté des données, vous devez apprendre à votre algorithme ce qu'il faut en faire et quels résultats sont attendus avant d'ajouter des données non étiquetées.

3. Intégration des données non étiquetées

Une fois que votre modèle est entraîné sur les données étiquetées, vous pouvez ajouter des données non étiquetées. Étant donné que cette technique d'apprentissage automatique peut utiliser les deux types de données, cela vous permet de réduire les coûts par rapport à l'apprentissage supervisé, car ces données non étiquetées élargissent votre jeu de données.

4. Évaluation et perfectionnement du modèle

L'apprentissage automatique nécessite une évaluation et des modifications pour s'assurer que le modèle que vous avez créé est précis. La formation est un progrès continu, vous devez donc faire des ajustements à votre algorithme.

Les avantages de l'apprentissage semi-supervisé dans le domaine de la vente et du marketing

L'apprentissage automatique dans le marketing peut vous aider à améliorer votre lead scoring pour une personnalisation accrue afin de vous aider à identifier votre audience cible, à gérer votre audience et à réduire le taux de désabonnement des clients.

L'apprentissage automatique semi-structuré est également utile pour une variété d'objectifs d'analyse de données communs aux opérations de marketing numérique.

Segmentation améliorée des clients

Dans les études sur l'apprentissage automatique semi-supervisé comme outil d'amélioration de la segmentation des clients, la technique est souvent décrite comme un réseau neuronal à progression lente entraîné par un algorithme de rétropropagation.

Cela signifie que lorsque vous n'avez pas d'informations complètes sur vos leads, un programme d'apprentissage automatique semi-supervisé peut remplacer les données afin que vous n'ayez pas à les collecter, les saisir et les vérifier.

Pourquoi est-ce si important ?

Vous avez probablement déjà entendu parler du principe de Pareto. Appliqué à une entreprise, cela signifie que 20 % de vos clients génèrent 80 % de vos bénéfices. Ou vous connaissez peut-être une idée développée par deux chercheurs en marketing, Reichfeld et Teal, appelée The Loyalty Effect. Une augmentation de 5 % de la fidélité des clients peut entraîner une augmentation de 20 à 95 % de vos bénéfices.

Il existe un compromis entre le coût de la collecte de données et les avantages d'une meilleure segmentation des clients avec des programmes d'apprentissage supervisés, mais le coût de la collecte de données est beaucoup plus faible avec des programmes d'apprentissage semi-supervisés.

Amélioration de la notation et de la qualification des leads

Les vendeurs veulent être en mesure de prédire quels leads déboucheront sur une vente. En particulier dans les ventes B2B, les données permettant de noter et de qualifier les leads qui existent probablement déjà dans votre suivi Web et votre analyse des e-mails depuis Mailchimp, ainsi que dans vos registres de base de données GRC.

Certaines notations et qualifications de leads peuvent être effectuées avec l'apprentissage automatique supervisé. Par exemple, vos données analytiques Mailchimp vous indiqueront le nombre d'e-mails ouverts. Vous pouvez extraire vos données de vente pour calculer la corrélation entre le nombre d'e-mails ouverts et les conversions de ventes.

De même, vous pouvez calculer une statistique corrélant le nombre de visites sur votre site Web avec la probabilité de conclure une vente avec vos données de suivi Web Mailchimp. Mais vous constateriez probablement que toutes les visites sur les pages Web ne sont pas les mêmes. L'apprentissage automatique semi-supervisé peut identifier les données analytiques on-page qui renforcent le pouvoir prédictif de votre modèle d'évaluation et de qualification des leads.

Efficacité accrue de la publicité ciblée

La publicité ciblée est orientée vers des audiences qui partagent certaines caractéristiques, en fonction du produit à promouvoir. Ces caractéristiques peuvent être démographiques, psychographiques ou des modèles de décisions d'achat antérieures.

Une fois l'audience cible identifiée, la publicité est ciblée sur une propriété, placée sur une page particulière d'un site Web choisi, ou ciblée sur le comportement, c'est-à-dire affichée après qu'un prospect ait adopté un certain comportement en ligne.

L'efficacité de la publicité ciblée est limitée par la quantité de données dont dispose le vendeur sur ses clients potentiels. L'apprentissage automatique semi-structuré fonctionne avec les données disponibles. Il crée un modèle de comportement de l'acheteur basé sur un mélange de données étiquetées et non étiquetées.

Il crée des pseudo-étiquettes pour faire d'autres prédictions et affine le modèle à mesure qu'il reçoit des données de vente. Alors que le modèle comble de plus en plus les lacunes dans la collecte de données, il offre une meilleure compréhension du profil de l'acheteur idéal.

Personnalisation du marketing par e-mail

Nous utilisons tous l'apprentissage automatique semi-supervisé au quotidien dans notre boîte mail. Les filtres anti-spam fonctionnent avec des données étiquetées (les messages que vous avez marqués comme spam) et des données non étiquetées (messages que vous ne verrez probablement jamais) pour au moins réduire la quantité de courriers indésirables dans votre boîte de réception.

Le défi de l'apprentissage automatique semi-supervisé dans le marketing par e-mail est de "filtrer" vos messages, afin qu'ils soient ouverts et traités. Pour cela, l'apprentissage automatique semi-supervisé peut être extrêmement utile.

  • Limiter le temps que vous devez consacrer aux tests A/B. Avec l'apprentissage automatique non supervisé, vous pouvez mélanger plus d'éléments dans vos e-mails pour augmenter les taux d'ouverture, l'engagement des lecteurs et les clics.
  • Calibrer le timing de vos e-mails. N'aimeriez-vous pas savoir quand vos clients auront le temps et l'envie de lire vos e-mails ? L'apprentissage automatique semi-structuré peut identifier les habitudes des destinataires d'e-mails pour vous indiquer quand envoyer un e-mail pour obtenir les meilleurs résultats.
  • Personnalisation des promotions. Lorsque vous connaissez les besoins de vos clients, vous pouvez leur vendre le bon produit ou service.

Modélisation prédictive du taux de désabonnement des clients

L'apprentissage automatique semi-structuré ne vous aide pas seulement à réaliser des ventes. Parfois, cela vous aide à sauver vos relations avec les clients. Les modèles de désabonnement des clients sont plus précis avec moins de données grâce à l'apprentissage automatique semi-structuré.

Défis et limites de l'apprentissage semi-supervisé

Il est important de comprendre que les modèles d'apprentissage automatique semi-structurés fonctionnent mieux lorsqu'ils sont formés et que leur qualité dépendra de leurs données de formation. Ainsi, cela peut entraîner quelques limitations différentes.

Données étiquetées limitées et leur impact sur la performance du modèle

Comme mentionné, les modèles d'apprentissage automatique sont limités par les données dont ils disposent. Cela signifie qu'un modèle avec des données étiquetées limitées sera limité à ces informations.

Maintenance continue

L'apprentissage automatique semi-structuré n'est pas un modèle que l'on peut mettre en place une fois et laisser se débrouiller seul. Cela nécessite une maintenance constante et compétente. L'apprentissage automatique devra être un investissement à long terme et nécessitera une supervision pendant son exécution.

Perspectives futures pour l'apprentissage semi-supervisé

L'apprentissage semi-supervisé et l'apprentissage automatique dans leur ensemble continueront à se développer et à devenir disponibles par le biais d'offres de services pour les entreprises qui n'ont pas les ressources nécessaires pour créer leurs propres modèles.

À mesure que les offres deviennent plus accessibles, les entreprises pourront se saisir de l'apprentissage automatique pour améliorer leurs services et l'expérience de leurs clients.

Partagez cet article