Volver a historias

Se anuncian los ganadores del premio Data Prep de ExploreSA: The Gawler Challenge

25 de mayo de 2020 Competiciones 2

Se han anunciado los primeros ganadores de ExploreSA: The Gawler Challenge, y los cuatro ganadores del Premio de preparación de datos compartirán parte de un pozo total de premios de $250,000.

ExploreSA: El desafío de Gawler es un desafío de ciencia de datos realizado en asociación con el Gobierno de Australia del Sur y Unearthed, que ha atraído más de 2000 inscripciones de más de 90 países de todo el mundo.

El cratón de Gawler es una de las regiones de óxido de hierro, cobre y oro más importantes del mundo y, al aplicar enfoques analíticos creativos e innovadores a los datos geofísicos, estamos potencialmente un paso más cerca de descubrir la próxima presa olímpica o Carrapateena.

El premio Data Prep Prize se creó para alentar a los participantes a compartir enfoques de limpieza de datos y conjuntos de datos limpios. Este trabajo ayuda a todos a ahorrar tiempo en la preparación de datos, lo que permite a los participantes concentrarse en la creación y prueba de modelos de datos. 

La limpieza de datos es una parte fundamental y crucial de la aplicación del aprendizaje automático a los datos de exploración. Algunos científicos de datos estiman que dedican el 90 % de su tiempo a la preparación de datos, en proyectos que duran varios meses. La limpieza de datos es tan importante y requiere tanto tiempo que muchos están creando algoritmos y canales de limpieza de datos patentados. 

Gracias a todos por las presentaciones y felicitaciones a los cuatro ganadores, que se llevaron a casa $5,000 cada uno del total de $250,000 XNUMX en premios. Ahora, profundicemos un poco más sobre los ganadores.

Perfil del ganador | Michael Rodda 

Michael Rodda es el fundador de Caldera Analytics, con sede en Melbourne. Michael y su equipo ganaron el primer lugar y 1 500,000 dólares en el concurso Desafío de exploración de minerales de Oz desenterrados En 2019, antes de ganar el Explorer Challenge, trabajó como analista de datos en NAB. Después de ganar, al darse cuenta de la oportunidad de aplicar el aprendizaje automático a la exploración, Michael fundó Caldera Analytics para crear una solución para la industria minera.

Presentación de Michael para el Premio de preparación de datos es un proceso completo y fácil de entender para eliminar errores de los datos geoquímicos, antes de utilizar aplicaciones de aprendizaje automático. Las técnicas analíticas modernas, como el aprendizaje automático, pueden ingerir millones de filas de datos a la vez, de forma automática, lo que significa que los errores de datos tienen el potencial de causar problemas importantes en el proceso de modelado, lo que puede provocar que se oculten datos realmente útiles, como valores anómalos de metales económicos.

Uno de los factores clave que diferencian la propuesta de Michael es el enfoque paso a paso, que es fácil de seguir tanto para expertos como para personas que no tienen experiencia en aprendizaje automático. Es una guía excelente, combinada con un conjunto de datos limpios y utilizables, para cualquiera que busque utilizar datos geoquímicos en sus predicciones.


“La calidad de los datos es un tema muy importante para aplicar el aprendizaje automático a la exploración minera: muchas de las fuentes de datos pueden parecer de buena calidad a primera vista, pero en realidad hay muchos problemas que pueden hacer descarrilar un proyecto de ciencia de datos. Al mostrar cómo lidiar con los errores de ingreso de datos geoquímicos, debería alentar a los científicos de datos a analizar los datos en profundidad y realizar presentaciones de mayor calidad”. - Michael Rodda 

Perfil del ganador | Russell Menezes | Ahmad Saleem y Tyler Hall | Datos de Incerto. 

Russell es un geólogo petrolero y científico de datos. Recientemente fundó RadixGeo después de darse cuenta de la necesidad de optimizar la creación de bases de datos y los procesos de procesamiento de datos para utilizar los datos petroleros en técnicas modernas de análisis de datos, automatización y aprendizaje automático. 

Russell se ha asociado con Ahmad Saleem, analista de investigación de un fondo de minería de capital y conocido productor y portavoz de Radio de exploración y Tyler Salón, quien está completando su doctorado en geociencias en la Universidad de Stanford en Estados Unidos. Juntos, han formado una empresa emergente y un equipo para el desafío, Incerto Data.

Para su presentación, Incerto Data abordó algunos de los problemas más importantes relacionados con el uso de datos de exploración para el aprendizaje automático. Uno de los mayores problemas es el manejo de diferentes poblaciones de muestras, lo que también es un problema para los enfoques analíticos estándar. En particular, con grandes bases de datos de geoquímica, como la de ExploreSA, hay muchos tipos de muestras, métodos analíticos y límites de detección diferentes. El enfoque de Incerto es un proceso fácil de usar para manejar estas múltiples poblaciones de manera rápida y eficiente. Por supuesto, también proporcionaron el resultado final del conjunto de datos limpio.

El aprendizaje automático también requiere que se apilen varias capas de datos geoespaciales. Incerto ofrece una manera sencilla de combinar datos geoquímicos puntuales con datos geofísicos, de modo que se puedan incorporar en modelos de aprendizaje automático. Para quienes estén considerando aplicar el aprendizaje automático a la exploración, una pregunta clave es si se debe utilizar un enfoque de clasificación o de regresión.


“Como equipo, nuestra intención al participar en ExploreSA era mostrar formas de combinar la experiencia en el campo de la exploración minera con técnicas comprobadas de ciencia de datos. Actualmente estamos desarrollando productos en este ámbito y vimos la oportunidad de participar en este desafío como una forma de perfeccionar nuestras habilidades”. - Russell Menezes

Perfil del ganador | Jack Maughan

Jack es un geólogo con conocimientos avanzados en ciencia de datos y un gran interés en aplicar el aprendizaje automático a la exploración minera. Escribe artículos con regularidad y comparte sus enfoques con la comunidad de exploración. Jack es conocido por sus enfoques simples y fáciles de usar.

Jack presentó dos enfoques para el Premio de preparación de datos, que son muy útiles tanto para las personas que participan en el desafío como para los exploradores en general. La primera propuesta de Jack aborda el problema de que el gran conjunto de datos geoquímicos de Australia del Sur no se puede incorporar fácilmente en un software SIG. Jack ofrece un proceso simple para transformar estos datos, lo que supone un verdadero cambio de paradigma para las personas que desean ver rápidamente el gran conjunto de datos.

Jack también proporcionó una versión unida de los datos geofísicos del proyecto, lo que permitió a las personas volver a verlos más fácilmente en paquetes SIG como un solo archivo de datos, en lugar de múltiples regiones.


“Como geólogo, visualizar es comprender. Por eso, estructurar los datos geológicos de forma que se puedan representar gráficamente, mapear o modelar rápidamente es una buena manera de no perderse mientras se realiza la limpieza y el análisis de grandes conjuntos de datos”. Jack Maughan

Perfil del ganador | Liang Chen | Ouyang Hua | Liu Wei | TriPandas

Liang es un ingeniero de software/desarrollador geoespacial a tiempo completo que se centra en el software geoespacial, por lo que sus habilidades son particularmente aplicables para ExploreSA. Liang formó el equipo TriPandas con Ouyang es un científico de datos y desarrollador de inteligencia empresarial experimentado, y Liu Wei, un científico de datos de China.

TriPandas se centró en procesar múltiples tipos de datos para su uso en enfoques de aprendizaje automático. Algunos de estos conjuntos de datos son bastante desconocidos para muchos científicos de datos, por lo que la presentación fue una excelente manera de permitir que las personas se familiaricen con el procesamiento de tipos de datos bastante únicos, como los magnetotelúricos (MT) y los datos de teledetección espectral.

TriPanda documentó claramente su proceso y fundamento para que otros lo utilicen, así como todos los conjuntos de datos procesados, ahorrándoles un tiempo significativo a los demás participantes.


“Nos gustaría que nuestra publicación pudiera ahorrar tiempo a otros equipos y permitirles dedicar más tiempo a la parte divertida: el modelado. También proporcionamos un ejemplo de cómo hacer nuestro trabajo en Google Colab gratuito para ayudar a aquellas personas que tienen dificultades con los recursos informáticos”. - Liang Chen

Colaboración con el Gobierno de Australia del Sur para descubrir el próximo gran yacimiento mineral de Australia del Sur

ExploreSA: El desafío de Gawler Se lleva a cabo en colaboración entre el Gobierno de Australia del Sur y Unearthed. Hasta el momento, más de 1700 miembros de la comunidad de Unearthed de todo el mundo se han inscrito para participar en el desafío.

“Si bien las empresas a nivel mundial se ven limitadas por las medidas adoptadas para reducir la transmisión del virus, el gobierno de Australia del Sur se ha centrado en garantizar que el estado esté en la mejor posición posible para la recuperación económica una vez que termine esta emergencia sanitaria. ExploreSA: The Gawler Challenge es una faceta importante de esta recuperación”. - Ministro de Energía y Minería Dan van Holst Pellekaan.

El cratón de Gawler es una de las regiones de óxido de hierro, cobre y oro más importantes del mundo y, al aplicar enfoques analíticos creativos e innovadores a los datos geofísicos, estamos potencialmente un paso más cerca de descubrir la próxima presa olímpica o Carrapateena.

La industria de exploración ha tenido dificultades para utilizar software y enfoques tradicionales, y confío en que esto cambiará las reglas del juego para el uso de conjuntos de datos abiertos.

ExploreSA: El desafío de Gawler Faltan poco más de dos meses para que se cierre la competición principal el 31 de julio. El Gran Premio, el Premio de Estudiantes y muchas otras categorías se anunciarán en septiembre, momento en el que todos los objetivos y datos generados por los equipos estarán disponibles públicamente.

¿Te encanta la ciencia de datos, el aprendizaje automático o la geología? Únete a este desafío épico de 250 XNUMX dólares para encontrar el próximo gran depósito mineral del sur de Australia. ¡Regístrate aquí!

Explora lo último en destacados e historias

Alianzas 11 de mayo de 2026

Unearthed ayuda a llevar a cabo el programa The Pitch de Rio Tinto para 2025.

Unearthed trabajó con Rio Tinto para apoyar la entrega de The Pitch, el programa interno de innovación para empleados de Rio Tinto diseñado

leer el artículo
Alianzas 12 de Abril, 2026

BHP Invent anuncia la cohorte del acelerador Ore Body Knowledge (OBK).

BHP Invent ha anunciado la próxima cohorte de innovadores seleccionados para el Programa Acelerador del Conocimiento de Yacimientos Minerales, que incluye a...

leer el artículo
Alianzas 3 de noviembre.

Financiando el futuro de la tecnología minera en IMARC 2025

Organizada por Unearthed en colaboración con Founders Factory, nuestra sesión “Financiando el futuro de la tecnología minera” reunió a un

leer el artículo
Alianzas 27 de octubre de 2025

Interacciones con innovadores en IMARC 2025 (las tecnologías mineras emergentes más punteras)

Tres miembros del equipo de Unearthed viajaron al este para asistir a la Conferencia Internacional de Minería y Recursos 2025 en Sídney el mes pasado.

leer el artículo