Ir al contenido principal

Paso 4: Cómo incrustar características de entrada

Aprenda cómo seleccionar un Modelo de Fusión de Datos para incrustar sus características de entrada en su experimento DORA.

Actualizado esta semana

Descripción general

En este paso, seleccionará un Modelo de Fusión de Datos y definirá el número de épocas de entrenamiento para incrustar sus características de entrada. Este proceso reduce la complejidad de los datos al mismo tiempo que adapta el modelo a su contexto geológico específico.


¿Por qué incorporamos funciones de entrada?

Incrustar características de entrada consiste en transformar los rásteres seleccionados (hasta 64) en un conjunto de 24 representaciones de menor dimensión (embeddings) que preservan patrones y relaciones espaciales significativas. Esto se realiza mediante un Modelo de Fusión de Datos, un modelo de IA preentrenado con cientos de miles de rásteres de tipos específicos de sistemas minerales.

El proceso de incrustación captura:

  • Relaciones espaciales entre rásteres (cómo se relacionan las diferentes capas entre sí)

  • Estructura espacial dentro de cada ráster (cómo se organizan las características en el espacio)

El Modelo de Fusión de Datos, entrenado con datos a gran escala, se ajusta posteriormente con los rásteres y puntos de aprendizaje seleccionados. Esto genera 24 nuevos rásteres incrustados que están optimizados para su Área de Interés y contexto geológico.


Por qué este paso es importante

Perspectiva geocientífica

La incrustación ayuda a aislar patrones geológicos que podrían no ser inmediatamente visibles en los datos sin procesar. Al usar un modelo de fusión de datos entrenado en sistemas minerales similares, puede aprovechar información global y adaptarla a su área de proyecto específica. Esto aumenta la confianza en sus predicciones y ayuda a garantizar que el modelo se base en geociencia relevante para el dominio.

Consulte la lista completa de Modelos de Data Fusion (Fusión de Datos) disponibles y los sistemas minerales con los que han sido entrenados aquí.

Perspectiva de la IA

Este paso aplica una reducción de dimensionalidad a su conjunto de datos, haciéndolo más manejable para el aprendizaje automático mientras preserva las características espaciales y estructurales esenciales.

Seleccionar la combinación adecuada de rásteres mejora la capacidad del modelo para reconocer patrones geológicos durante el entrenamiento. El número de épocas que defina controla cuánto aprende el modelo de sus datos locales, permitiéndole ajustar las predicciones específicas de su proyecto. DORA incluye un mecanismo de detención temprana que interrumpe automáticamente el entrenamiento una vez que el rendimiento deja de mejorar, lo que ayuda a evitar el sobreajuste y los cómputos innecesarios.

Se trata de una forma de few-shot learning. El modelo ya ha aprendido de cientos de miles de rásteres en proyectos globales, pero se adapta a sus características de entrada seleccionadas aprendiendo lo suficiente para optimizar las predicciones según su contexto geológico.

💡Consejo: Al ajustar el número de épocas de entrenamiento, tenga en cuenta las ventajas y desventajas:

  • Si se utilizan muy pocas épocas, el modelo apenas aprende de los datos. Es posible que se pasen por alto señales importantes específicas del proyecto.

  • Si se utilizan demasiadas épocas, el modelo memoriza los datos (sobreajuste), lo que reduce su capacidad de generalización.


Instrucciones paso a paso

  1. Abrir incrustar características de entrada

    • Desde el panel de configuración del experimento, haga clic en Paso 4: Incrustar Características de Entrada.

  2. Seleccionar un modelo de fusión de datos

    • En el menú desplegable, seleccione el modelo que mejor se ajuste a su sistema mineral objetivo.

    • ¿No estás seguro? Empiezce con Master_Model.

    • Seleccione None si su depósito es altamente único y desea entrenar las incrustaciones desde cero.

  3. Establecer el número de épocas de entrenamiento

    • Ingrese el número de épocas de entrenamiento. Esto determina cuánto se ajustará el modelo a los datos que ha seleccionado.

    • El valor predeterminado es 100.

    • El entrenamiento puede detenerse prematuramente si el rendimiento del modelo deja de mejorar.

  4. Haga clic en generar incrustaciones

    • Esto activa la reducción de dimensionalidad y crea salidas rasterizadas para cada característica de entrada.

  5. (Opcional) Revisar los resultados visuales

    • Use la lista de capas 3D para previsualizar las capas ráster generadas. Active o desactive la visibilidad (icono del ojo) y ajuste el esquema de colores o la escala base de desplazamiento para visualizar mejor las texturas y los patrones de la superficie.

    • Durante la revisión, busque signos de artefactos: inconsistencias visuales causadas por la mezcla de conjuntos de datos de alta resolución con cuadrículas más gruesas que cubren toda el área de interés. Estos pueden aparecer como bordes abruptos o patrones lineales dentro de las capas incrustadas.

    • Estos artefactos pueden generar resultados sesgados en el Puntaje de prospectividad VRIFY (VPS)), como áreas excesivamente prospectivas alrededor de los bordes de levantamientos más pequeños.

    • Si esto ocurre, intente eliminar la capa problemática y vuelva a ejecutar las incrustaciones para comprobar si el problema se resuelve.

  6. Completar paso

    • Haz clic en Continuar para pasar a la siguiente etapa.


Consejos y consideraciones

Nomenclatura del modelo de fusión de datos

  • Los nombres de los modelos como c2p4 hacen referencia al número de imágenes de entrenamiento utilizadas (por ejemplo, c2p4 representa 24.000 imágenes de entrenamiento).

  • Priorice los modelos entrenados con el tipo de depósito correcto y, a continuación, seleccione el que tenga el mayor número de entrenamientos para obtener los resultados más fiables.

  • ¿Se ha fijado en la convención de nombres c2p4, c1p8, etc.? ¡Es una referencia a C-3PO de Star Wars!

Estrategia de épocas

  • Si los resultados no mejoran con épocas adicionales, mantenga el modelo detenido tempranamente ( early-stopped model); es probable que ya esté optimizado.

  • Si selecciona el modelo de fusión de datos None, considere usar un número mayor de épocas (por ejemplo, 300) para permitir un refinamiento más profundo, ya que hay menos imágenes preentrenadas disponibles para guiar el proceso de incrustación.


Más información


¿Aún tiene preguntas?

Comuníquese con su contacto exclusivo de DORA o envíe un correo electrónico a support@VRIFY.com para obtener más información.

¿Ha quedado contestada tu pregunta?