Ir al contenido principal

Paso 3: Cómo configurar los datos de aprendizaje

Aprenda cómo configurar ejemplos positivos (mineralizados) y negativos (no mineralizados) para entrenar el modelo para su experimento DORA.

Actualizado esta semana

Descripción general

Los datos de aprendizaje definen los elementos que se están analizando y separan los puntos de muestra en ejemplos positivos (mineralizados) y negativos (no mineralizados). Estos puntos etiquetados entrenan al modelo para reconocer patrones en el conjunto de datos y realizar predicciones precisas.

En este paso, seleccionará los elementos objetivo y establecerá umbrales para clasificar sus puntos de aprendizaje.


¿Qué son los datos de aprendizaje?

Los Datos de Aprendizaje provienen del archivo Shapefile de Puntos de Aprendizaje ( Learning Points Shapefile) que se carga como parte de los datos del proyecto. Este archivo contiene puntos de muestreo, incluyendo atributos como leyes de elementos y valores de elevación.

Como mínimo, cada punto de aprendizaje debe incluir datos de ensayo, y cada valor debe contener la siguiente información:

  • Coordenadas (este y norte)

  • Elevación

La mayoría de los puntos de aprendizaje provienen de ensayos de perforación (que se des-referencian para ubicarlos con precisión en el espacio 3D) o de ensayos de roca superficial in situ. Las ubicaciones precisas son esenciales para que el modelo realice predicciones exactas.

A partir de este archivo, DORA genera puntos de aprendizaje que se etiquetan como positivos o negativos en función de los umbrales que usted defina:

  • Los puntos de aprendizaje positivos representan muestras que cumplen o superan un umbral de ley elegido.

  • Los puntos de aprendizaje negativos se encuentran por debajo de ese umbral.

En proyectos de exploración en etapas tempranas, donde los datos de análisis pueden ser limitados, puede incluir opcionalmente puntos de aprendizaje sintéticos basados ​​en información geológica disponible públicamente para guiar el aprendizaje del modelo.


Por qué este paso es importante

Perspectiva geocientífica

Separar datos mineralizados de no mineralizados refleja la forma en que los geocientíficos interpretan las anomalías. Esto garantiza que el modelo se entrene con ejemplos que representan objetivos de exploración reales, lo que conduce a predicciones más confiables.

Perspectiva de la IA

Desde la perspectiva de ciencia de datos, los datos de aprendizaje constituyes la base de un modelo de clasificación binaria, donde cada muestra se etiqueta como positiva o negativa. Umbrales claros ayudan al modelo a distinguir patrones significativos de datos irrelevantes.

Se recomienda un conjunto de datos balanceado, típicamente con alrededor de 10 -20 % de puntos de aprendizaje etiquetados como positivos y el resto como negativos. Este equilibrio evita el sesgo del modelo y mejora tanto la precisión del entrenamiento como el rendimiento predictivo.

💡 Los Datos de Aprendizaje son la base de la Matriz de Confusión, uno de los tres gráficos de salida generados por DORA junto con el Puntaje de Prospectividad VRIFY (VPS por sus siglas en inglés VRIFY Prospectivity Score). La Matriz de Confusión evalúa qué tan bien los ejemplos etiquetados ayudaron al modelo a distinguir entre zonas mineralizadas y no mineralizadas.


Instrucciones paso a paso

  1. Abrir configuración de datos de aprendizaje

    • Desde el panel de configuración del experimento, haga clic en Paso 3: Configurar Datos de Aprendizaje.

  2. Seleccionar archivo de puntos de aprendizaje

    • Seleccione el archivo de Puntos de Aprendizaje desde el menú desplegable. Si solo existe un archivo, se usará automáticamente y esta opción no estará disponible.

  3. Seleccionar campo de elevación

    • Elija el campo de elevación desde el menú desplegable. Este debe coincidir con la columna de coordenadas Z de su archivo Shapefile de puntos de aprendizaje ( Learning Points Shapefile) y se utiliza para la predicción en 3D.

  4. Configurar filtros de datos de aprendizaje

    • Seleccione un elemento objetivo desde el menú desplegable

    • Defina el interruptor mayor que/menor que según cómo se deba clasificarse el elemento.

    • Por defecto, el filtro incluye los elementos que superan el umbral objetivo. Utilice el interruptor para cambiar a "menores que", si es necesario.

    • Ingrese un umbral de ley. Las muestras que alcancen o superen este valor se considerarán positivas. Las demás serán negativas.

    • Los valores mínimo y máximo para su elemento se muestran debajo del campo de entrada.

    • Nota: La tabla de desglose de datos de aprendizaje solo aparecerá después de hacer clic en Generar datos de aprendizaje. Si no está seguro de por dónde empezar, pruebe con cualquier valor dentro del rango permitido y ajústelo según los resultados en tiempo real después de completar el paso 5

    • (Opcional)Agregar más elementos de destino

    • Haga clic en Agregar para incluir elementos adicionales y establecer umbrales individuales. Si utilizas múltiples elementos, elija cómo deben evaluarse.

      • AND: Todos los umbrales deben cumplirse para clasificar un punto como positivo. Use esta opción al analizar una combinación específica de elementos.

      • OR: Cualquier umbral alcanzado clasificará un punto como positivo. Use esto para una segmentación más amplia en múltiples elementos.

  5. Revisar Desglose de Datos de Aprendizaje

    • Haga clic en Generar datos de aprendizaje.

      • La tabla muestra la proporción de positivos frente a negativos.

      • Úsala para comprobar si tu conjunto de datos está bien balanceado. El objetivo es mantener entre un 10-20 % de positivos para una estabilidad general del modelo. Puede ajustarlo en tiempo real para encontrar el equilibrio adecuado.

  6. Completar Paso

    • Haga clic en Continuar para guardar y avanzar al siguiente paso.


Consejos y Consideraciones

Consejos sobre el desglose de datos de aprendizaje

La proporción de puntos de aprendizaje positivos frente a negativos afecta significativamente la capacidad de DORA para aprender de sus datos:

  • Una proporción positiva inferior al 10% ofrece al modelo muy pocos ejemplos de los que aprender, aumentando el riesgo de predicciones sesgadas o poco confiables.

  • Un número demasiado bajo de resultados positivos puede distorsionar la agrupación (clustering), generando áreas objetivo sin ninguna muestra positiva en absoluto.

  • Definir un umbral muy alto (por ejemplo, el 2% superior en leyes de cobre) concentra el enfoque pero limita la variación, disminuyendo la capacidad del modelo para generalizar.

  • Apunte a una proporción positiva del 10-20% para equilibrar la calidad de la ley con suficientes ejemplos para permitir un aprendizaje efectivo.

  • Si sus puntos de aprendizaje se concentran en una sola área, puede necesitar una mayor proporción de positivos para enseñar al modelo los patrones de mineralización local. Esto se hará evidente cuando llegue al Paso 6: Cómo construir un modelo predictivo.

Ampliar la cobertura con ejemplos regionales

Para abarcar objetivos más amplios, considere agregar puntos de aprendizaje cerca de depósitos conocidos o ocurrencias minerales documentadas, especialmente si se alinean con el estilo de mineralización que está explorando.

En algunos casos, los puntos de aprendizaje sintéticos (positivos o negativos) pueden ayudar a entrenar el modelo utilizando señales externas relevantes cuando los datos son limitados.

Recordatorio final de compensación

Los umbrales altos enfocan el modelo en mineralización de élite, pero pueden resultar muy poco positivos para obtener información útil. Los umbrales más bajos proporcionan más resultados positivos, pero pueden incluir muestras de menor calidad.

Piense estratégicamente: ¿cuál es el objetivo geológicamente significativo y cuántos ejemplos necesitas para representarlo adecuadamente?


Más información


¿Aún tiene preguntas?

Comuníquese con su contacto exclusivo de DORA o envíe un correo electrónico a support@VRIFY.com para obtener más información.

¿Ha quedado contestada tu pregunta?