Vue d’ensemble
Lors de cette étape, un classificateur Random Forest est utilisé pour prédire la probabilité de minéralisation dans votre zone d’intérêt (AOI). Cette méthode d’ensemble s’appuie sur plusieurs arbres de décision, chacun entraîné sur un sous-ensemble des données, afin d’améliorer la robustesse et la précision des prédictions.
Les paramètres avancés permettent de régler finement la façon dont la forêt est entraînée, en équilibrant entre surajustement (overfitting) et sous-ajustement (underfitting) pour optimiser les résultats.
Vous trouverez ci-dessous une description de chaque paramètre de fonctionnalité avancée :
Nombre de simulations
Le nombre de simulations correspond au nombre de fois que le modèle Random Forest est exécuté afin d’introduire une variance dans les prédictions.
Chaque simulation modifie légèrement les points d’apprentissage et les données d’entrée par sous-échantillonnage, ce qui permet d’obtenir des résultats différents à chaque exécution.
Cela permet au modèle de produire des prédictions plus généralisées. La valeur par défaut est 10, mais peut être augmentée jusqu’à 100. Plus ce nombre est élevé, plus le temps de traitement sera long.
Équilibre négatif
Ce paramètre contrôle le ratio d’échantillonnage entre les classes positives et négatives.
Dans les forêts aléatoires, un jeu de données déséquilibré peut biaiser le modèle en faveur de la classe dominante. L’équilibre négatif permet de sous-échantillonner la classe négative afin d’éviter ce biais, ce qui est particulièrement pertinent dans les contextes géologiques où les échantillons non minéralisés sont souvent plus nombreux.
La valeur par défaut est de 1,3 (ex. : pour 1 000 points positifs, le modèle sélectionne 1 300 négatifs).
Conseil : il peut être judicieux de favoriser légèrement la précision des prédictions négatives, afin d’écarter de manière fiable les zones non prometteuses.
Profondeur des arbres
Ce paramètre détermine le nombre de niveaux dans chaque arbre de décision.
Des arbres plus profonds peuvent capturer des détails plus fins, mais augmentent le risque de surajustement. À l’inverse, une profondeur moindre favorise la généralisation.
La valeur par défaut est de 24, en lien avec les 24 dimensions d’incorporation utilisées. Cette valeur peut être ajustée selon la complexité géologique de votre projet.
Nombre d'arbres
Définit le nombre total d’arbres de décision dans la forêt.
Un plus grand nombre d’arbres améliore généralement la précision, mais un excès par rapport au nombre de points d’entraînement disponibles peut entraîner un surajustement.
La valeur par défaut est de 300, ce qui constitue un bon compromis entre performance et précision.
Division minimale
La division minimale correspond au nombre minimum d’échantillons nécessaires pour qu’un nœud soit divisé en deux branches.
Des valeurs élevées réduisent le risque de surajustement en limitant la création de branches trop spécifiques.
Une plage comprise entre 20 et 30 est généralement recommandée.
Échantillons minimum
Nombre minimal d’échantillons requis pour qu’un nœud soit considéré comme une classe finale.
Des valeurs trop basses peuvent rendre le modèle trop sensible aux variations dans les données (surajustement), tandis que des valeurs trop élevées peuvent le rendre trop rigide (sous-ajustement).
Prédire la profondeur
Ce paramètre permet d’indiquer si la prédiction doit inclure ou non la profondeur.
Si désactivé, la sortie du modèle sera en 2D. Si activé, une composante verticale (profondeur) sera intégrée à la prédiction.
Vous avez encore des questions ?
Contactez votre référent DORA ou envoyez un e-mail à support@VRIFY.com pour plus d'informations.