Passer au contenu principal

Qu’est-ce que le surajustement et le sous-ajustement ?

Comprenez ce que ces concepts signifient pour un modèle d’intelligence artificielle.

Mis à jour cette semaine

Aperçu

La force de l’IA réside dans sa capacité à détecter des modèles et à formuler des prédictions à partir de vastes ensembles de données — un travail qui prendrait un temps considérable, voire impossible, à accomplir pour des humains.

Dans le contexte de DORA (apprentissage supervisé), le modèle a besoin d’une orientation pour identifier des motifs pertinents sans être trop ou pas assez dirigé.

  • Trop de prescriptions peuvent conduire à un surajustement (le modèle ne détecte que des cas très similaires aux exemples d’apprentissage).

  • Pas assez de guidage peut entraîner un sous-ajustement (le modèle génère trop de prédictions erronées).

L’objectif est de trouver le bon équilibre entre la capacité du modèle à apprendre les bons motifs et sa performance sur des données spécifiques à votre projet.


Qu’est-ce que le surajustement ?

Le surajustement se produit lorsqu’un modèle apprend excessivement les détails des données d'entraînement — y compris le bruit ou les éléments non pertinents. Résultat : il performe très bien sur les données connues, mais échoue à généraliser à de nouvelles données.

Ce phénomène peut se produire lorsque :

  • L’ensemble d'entraînement est trop petit et peu représentatif des conditions géologiques du terrain.

  • Les données d’apprentissage contiennent beaucoup de bruit ou d’informations sans lien réel avec la minéralisation.

Dans ce cas, le modèle risque de ne reconnaître que les motifs déjà vus, et de passer à côté de nouvelles structures géologiques pertinentes.

Par exemple, une précision de 99 % peut sembler excellente, mais cela peut indiquer un surajustement. Une précision idéale se situe généralement entre 90 % et 95 %, ce qui suggère une bonne performance tout en conservant la capacité de généralisation.


Qu’est-ce que le sous-ajustement ?

Le sous-ajustement se produit lorsque le modèle est trop simple pour identifier les relations importantes dans les données géologiques. Il échoue alors à bien prédire, tant sur les données d’apprentissage que sur les nouvelles données du projet.

Dans ce scénario, les prédictions générées peuvent ressembler à des suppositions aléatoires, car le modèle ne saisit pas les motifs géologiques sous-jacents. Cela mène à des résultats peu fiables.


Comment éviter le surajustement et le sous-ajustement ?

Équilibrer la complexité du modèle est essentiel pour en maximiser la performance. Voici quelques bonnes pratiques :

  • Pour éviter le surajustement :

    • Utilisez la validation croisée

    • Simplifiez l’architecture du modèle
      Appliquez des techniques de régularisation pour limiter l’apprentissage du bruit

  • Pour éviter le sous-ajustement :

    • Ajoutez des caractéristiques (features) pertinentes

    • Adaptez les paramètres du modèle pour mieux refléter la complexité des données

Un modèle bien équilibré sera à la fois précis et capable de généraliser à de nouveaux jeux de données.


Vous avez encore des questions ?

Contactez votre contact DORA ou envoyez un e-mail à support@VRIFY.com pour plus d'informations.

Avez-vous trouvé la réponse à votre question ?