Visão geral
Os dados de treinamento definem quais elementos você está visando e separam os pontos de amostra em exemplos positivos (mineralizados) e negativos (não mineralizados). Esses pontos rotulados treinam o modelo para reconhecer padrões em seu conjunto de dados e fazer previsões precisas.
Nesta etapa, você selecionará os elementos-alvo e definirá os limites para classificar seus pontos de aprendizado.
O que são dados de aprendizagem?
Os dados de aprendizagem provêm do arquivo Shapefile de Pontos de Aprendizagem que você carrega como parte dos dados do seu projeto. Este arquivo contém pontos de amostra, incluindo atributos como declives dos elementos e valores de elevação.
No mínimo, cada ponto de aprendizagem deve incluir dados de ensaio, sendo que cada valor deve conter as seguintes informações:
Coordenadas (coordenadas leste e norte)
Elevação
A maioria dos pontos de aprendizagem provém de ensaios de perfuração (que são desmembrados para serem posicionados com precisão no espaço 3D) ou Análises in situ de rochas superficiais. Localizações precisas são essenciais para que o modelo faça previsões precisas.
A partir desse arquivo, DORA gera pontos de aprendizado que são classificados como positivos ou negativos com base nos limites que você define:
Os pontos de aprendizagem positivos representam exemplos que atingem ou superam um limite de avaliação escolhido.
Os pontos de aprendizagem negativos ficam abaixo desse limite.
Em projetos de exploração em estágio inicial, onde os dados de ensaio podem ser limitados, você pode opcionalmente incluir pontos de aprendizado sintéticos baseados em informações geológicas disponíveis publicamente para orientar o aprendizado do modelo.
Por que essa etapa é importante
Perspectiva das Geociências
A separação entre dados mineralizados e não mineralizados reflete a maneira como os geocientistas interpretam as anomalias. Isso garante que o modelo seja treinado com exemplos que refletem alvos de exploração do mundo real, levando a previsões mais confiáveis.
Perspectivas da IA
Do ponto de vista da ciência de dados, o aprendizado de dados forma a base de um modelo de classificação binária, onde cada amostra é rotulada como positiva ou negativa. Limites claros ajudam o modelo a distinguir padrões significativos de dados irrelevantes.
Recomenda-se um conjunto de dados balanceado, normalmente com cerca de 10% a 20% de pontos de aprendizado rotulados como positivos e o restante como negativos. Esse equilíbrio evita o viés do modelo e melhora tanto a precisão do treinamento quanto o desempenho preditivo.
💡 Os dados de aprendizagem são a base da Matriz de Confusão, um dos três gráficos de saída gerados pelo DORA juntamente com a Pontuação de prospectividade VRIFY (VPS). A Matriz de Confusão avalia o quão bem os exemplos rotulados ajudaram o modelo a distinguir entre zonas mineralizadas e não mineralizadas.
Saiba mais em Precisão da previsão (matriz de confusão).
Instruções passo a passo
Abra os dados de aprendizagem da configuração Open Learning.
No painel de configuração do experimento, clique em “Step 3: Set Up Learning Data” (Etapa 3: Configurar dados de aprendizado).
Selecione o arquivo de Pontos de Aprendizagem
Selecione o arquivo de Pontos de Aprendizagem no menu suspenso. Se houver apenas um arquivo, ele será usado automaticamente e esta opção não estará disponível.
Selecione o campo de elevação
Configurar filtros de dados de aprendizagem (Learning Data Filters)
Selecione um elemento-alvo no menu suspenso.
Insira um valor limite. Amostras que atingirem ou ultrapassarem esse valor serão consideradas positivas. As demais serão consideradas negativas.
Os valores mínimo e máximo (Range) para o seu elemento são mostrados abaixo do campo de entrada.
Observação: a tabela de detalhamento dos dados de aprendizagem só aparecerá depois que você clicar em "Gerar dados de aprendizagem". Se não tiver certeza de por onde começar, tente qualquer valor dentro do intervalo permitido e ajuste com base nos resultados em tempo real após concluir a etapa 5 abaixo.
(Opcional) Adicionar mais elementos-alvo
Clique em Adicionar para incluir elementos adicionais e definir limites individuais. Se estiver usando vários elementos, escolha como eles devem ser avaliados.
“AND” (E): Todos os limites devem ser atendidos para classificar um ponto como positivo. Use isso ao selecionar uma combinação específica de elementos.
“OR” (OU): Qualquer limite atingido classifica um ponto como positivo. Use isso para segmentação mais ampla em vários elementos.
Análise da Detalhamento dos Dados de Aprendizagem
Clique em Gerar Dados de Aprendizagem.
A tabela exibe a proporção de valores positivos para valores negativos.
Use essa ferramenta para verificar se seu conjunto de dados está bem balanceado. Busque entre 10% e 20% de valores positivos para garantir a estabilidade geral do modelo. Você pode ajustar em tempo real para encontrar o equilíbrio ideal.
Etapa concluída
Clique em “Proceed” (Prosseguir) para salvar e continuar.
Dicas e Considerações
Dicas para análise de dados de aprendizagem
A proporção de pontos de aprendizagem positivos para negativos afeta significativamente a capacidade de DORA de aprender com seus dados:
Uma taxa positiva inferior a 10% resulta em poucos exemplos para o modelo aprender, aumentando o risco de previsões distorcidas ou não confiáveis.
Um número insuficiente de resultados positivos pode distorcer o agrupamento, levando à identificação de áreas sem nenhuma amostra positiva.
Definir um limite muito alto (por exemplo, os 2% melhores teores de cobre) restringe o foco, mas limita a variação, reduzindo a capacidade de generalização do modelo.
O objetivo é alcançar uma taxa de acertos de 10% a 20% para equilibrar a qualidade das notas com exemplos suficientes para um aprendizado eficaz.
Se seus pontos de aprendizado estiverem muito concentrados em uma área específica, você pode precisar de uma proporção maior de acertos para ensinar ao modelo os padrões de mineralização local. Isso ficará evidente quando você chegar à Etapa 6: Construir o Modelo Preditivo.
Ampliando a cobertura com exemplos regionais
Para abranger alvos mais amplos, considere adicionar pontos de aprendizado perto de depósitos conhecidos ou ocorrências minerais documentadas, especialmente se estiverem alinhados com o estilo de mineralização que você está explorando.
Em alguns casos, pontos de aprendizagem sintéticos (positivos ou negativos) podem ajudar a treinar o modelo usando sinais externos relevantes quando os dados são limitados.
Lembrete final sobre a compensação
Limites altos direcionam o modelo para mineralização de elite, mas podem resultar em um número insuficiente de resultados positivos para aprendizado. Limites mais baixos fornecem mais resultados positivos, mas podem incluir amostras de qualidade inferior.
Pense estrategicamente: qual é o alvo geologicamente significativo e quantos exemplos você precisa para representá-lo bem?
Saber mais
Etapas anteriores:
Próximos passos:
Ainda tem dúvidas?
Entre em contato com seu contato dedicado DORA ou envie um e-mail para support@VRIFY.com para obter mais informações.







