
Astro-Datatón 2024
Place the Dark on the Map
La Astro-Datatón 2024 busca contribuir al desarrollo de la ciencia y tecnología en Chile mediante el descubrimiento de soluciones para problemas abiertos de la Astrofísica. La competencia de este año se centra en uno de los fenómenos astrofísicos más relevantes predichos por la Teoría de la Relatividad General de Einstein: el efecto de lente gravitacional.
Ganadores
🥇
1er Lugar
Los Fiducials
🥈
2do Lugar
Purrfect Predict
🥉
3er Lugar
That's a machine
Competencia
¿Quienes pueden participar?
La participación en la datatón está abierta a estudiantes universitarios de pregrado y postgrado, tanto chilenos como extranjeros, siempre que estén asociados a una universidad o centro de investigación chileno.
¿Cómo se deben conformar los equipos?
Los participantes deben formar equipos de 1 a 3 personas e inscribirse obligatoriamente para poder competir.
Reglamento.
Detalles adicionales se encuentran en el reglamento oficial de la datatón, disponible en este enlace desde el día del lanzamiento de la competencia.
¿Cómo se determina el ganador?
Para la competencia, se proporcionará un conjunto de mapas de convergencia (masa proyectada adimensional) de cúmulos de galaxias simulados que actúan en sus alrededores como lentes gravitacionales débiles, produciendo una leve distorsión sobre la forma de las fuentes de fondo. Los participantes deberán desarrollar una solución que permita generar automáticamente la distribución de convergencia de estos cúmulos.
Sus soluciones se evaluarán tanto cuantitativa como cualitativamente. Los criterios de evaluación incluirán aspectos como la completitud, originalidad, corrección técnica, claridad y profundidad de las soluciones.
El evento se divide en dos fases principales. En la Fase 1, los equipos trabajarán remota y asincrónicamente (online) para desarrollar y enviar soluciones preliminares a través de una plataforma dedicada. Durante esta fase, se seleccionarán los equipos finalistas que pasarán a la siguiente etapa. En la Fase 2, de carácter presencial, los equipos finalistas presentarán sus soluciones ante un jurado de expertos que definirá a los ganadores de cada categoría en base a criterios definidos en una rúbrica.
Inscríbete
Inscríbete al Datatón
Inscríbete desde el 15 de julio hasta el 30 de agosto usando el botón "Inscríbete".
La lista de los equipos participantes se puede encontrar en este enlace, en actualización continua (aunque no inmediata).
Después de inscribirse al datatón, su equipo debe registrarse a la plataforma CodaLab con los nombres de usuario sugeridos en la última columna del listado de los equipos.
Inscríbete a CodaLab
Al aceptar el reglamento, el sistema enviará un e-mail a los administradores para que ellos habiliten a su equipo para subir sus resultados.
La entrega de los resultados por parte de los equipos será posible cuando la mayoría de ellos se haya inscrito a CodaLab con el nombre sugerido. La habilitación general será realizada e informada por correo electrónico después del 22 de agosto.
Las soluciones se podrán entregar hasta las 23:59 hrs. del día 1 de octubre.
Premios
🥇
1er Lugar
🥈
2do Lugar
🥉
3er Lugar
Los premios son excluyentes, es decir, cada equipo solo puede ganar uno.
Fechas
Inscripciones
Webinar de promoción y logística
Fase 1 de competencia
Fase 2 de competencia

¿Qué es una datatón?
Una datatón es un evento en el que una serie de personas, típicamente organizadas en equipos, se reúnen (de modo virtual o presencial) para competir en la resolución de un problema que requiere el análisis y el procesamiento de un conjunto de datos. Usualmente estos datos son recolectados y preparados específicamente para el evento. La competencia puede durar desde algunos días a algunos meses y normalmente incluye premios para los equipos que propongan las soluciones mejor evaluadas, proceso que puede hacerse tanto en base a criterios cuantitativos como cualitativos. Típicamente estas competencias buscan estimular la creatividad, la innovación, el aprendizaje, y el trabajo colaborativo en torno a un problema real.
¿Qué tipos de datatones existen?
Es posible distinguir esencialmente dos tipos de datatón. Existen competencias que podríamos denominar de tipo exploratoria, en que se solicita a los participantes proponer una aplicación que valorice un dataset específico. El énfasis en este tipo de datatón es la búsqueda de ideas para sacar provecho al conjunto de datos, sin una aplicación específica en mente.
Otro tipo de datatón, probablemente el más común, es el que podríamos denominar predictivo. En este tipo de competencias, se puede distinguir siempre una respuesta o salida deseada que se debe inferir a partir de un dato de entrada (imagen, texto, o conjunto de características). En este caso, los participantes deben diseñar e implementar un algoritmo que sea capaz de predecir la respuesta deseada ante un caso de entrada cualquiera, utilizando para ellos un conjunto de datos denominado conjunto de entrenamiento en que se conocen las respuestas correctas para un serie de posibles casos de entrada. Normalmente, la evaluación de las soluciones se realiza sobre un conjunto de datos independiente del conjunto de datos entregado a los participantes que se denomina conjunto de pruebas. En ocasiones este conjunto de pruebas tiene diferencias importantes respecto a los casos expuestos en el conjunto de entrenamiento, sobre todo si se desea medir la capacidad del equipo de transferir soluciones de un dominio a otro.
Para esta datatón, se propone la organización de una competencia de tipo predictivo. Además de su simplicidad, este tipo de competencias tienen la ventaja de permitir una evaluación objetiva y cuantitativa de las soluciones entregadas por los participantes, lo que permite mantener actualizado un tablero de resultados, es decir, un cuadro/tabla en la que los diferentes participantes aparecen ordenados según su desempeño en la competencia. Mantener un tablero durante toda la duración del evento permite entregar feedback sobre la calidad de las soluciones alcanzadas por los participantes y estimular la mejora continua de las mismas.
¿Para qué es útil una datatón?
Las múltiples experiencias hoy en día documentadas demuestran que, para empresas y organizaciones, estas datatones pueden convertirse en oportunidades costo-efectivas para resolver problemas, identificar talentos, generar nuevas ideas, o promover una marca. Para estudiantes, profesionales, y entusiastas, estos eventos suelen ser ocasiones de mejorar habilidades técnicas en el manejo de datos, entrar en contacto con problemas reales de la ciencia o de la industria, encontrar trabajos, y construir comunidades y redes de colaboración. Este esquema de beneficio mutuo win-win en que todas las partes que intervienen resultan ganadores, explica la proliferación de compañías que financian este tipo de eventos, la multitud de plataformas que permiten hoy en día hospedar datatones en la nube, y el creciente interés de universidades y centros formativos por estimular la participación de sus estudiantes en ellas, integrándose incluso como parte de sus métodos de enseñanza.

¿Qué es el gravitational lensing?
La tarea propuesta para el desafío de este año se enmarca en el área del lensing gravitacional, que es uno de los fenómenos más fascinantes predichos por la Teoría de la Relatividad General de Einstein. Este fenómeno ocurre cuando el campo gravitacional de un sistema, como una galaxia, un cúmulo de galaxias o un agujero negro, actúa como un lente, curvando la luz proveniente de un objeto detrás de él, distorsionando su imagen e incluso, en casos extremos, produciendo múltiples imágenes del objeto mismo.
La imagen proporcionada tiene dos paneles que ilustran el fenómeno del "Weak Lensing" o "Lente Débil".
El panel superior muestra una cuadrícula ordenada de galaxias en espiral. Todas las galaxias tienen la misma forma y tamaño, y están distribuidas uniformemente. Este panel representa cómo se verían las galaxias si no hubiera ninguna masa intermedia que distorsione su luz, es decir, sin la influencia del lente gravitacional.
El panel inferior muestra las mismas galaxias en espiral, pero ahora sus imágenes están distorsionadas alrededor de regiones oscuras. Estas indican la presencia de materia que actúa como un lente gravitacional débil y que se encuentra entre las galaxias de fondo y nosotros, los observadores. Las distorsiones mostradas están exageradas para una mejor visualización del efecto.

¿Qué tipos de gravitational lensing existen?
El lensing gravitacional se manifiesta en dos regímenes principales (vease el esquema en la imagen presentada): el régimen de lente fuerte y el régimen de lente débil.
El primero ocurre cuando una masa muy grande crea una distorsión significativa en el espacio-tiempo, suficiente para producir múltiples imágenes de un mismo objeto de fondo, arcos brillantes o incluso anillos completos (anillos de Einstein). Las imágenes son fácilmente observables, pueden aparecer notablemente desplazadas y tienen grandes distorsiones.
El régimen de lente débil ocurre cuando la distorsión del espacio-tiempo es más sutil y no suficiente para crear múltiples imágenes. En este régimen, las imágenes de los objetos de fondo son ligeramente distorsionadas y requieren un análisis estadístico de un gran número de objetos para ser detectadas.
¿Para qué sirve el gravitational lensing?
El lensing gravitacional tiene importantes aplicaciones en Astrofísica y Cosmología, como las siguientes (que no constituyen una lista exhaustiva).
Uno de los usos más relevantes es en la medición de la masa de los objetos cósmicos que actúan como lentes, como galaxias, grupos o cúmulos de galaxias. Al analizar cómo la luz de objetos distantes se desvía al pasar cerca de ellos, los científicos pueden calcular la cantidad de masa que debe estar presente para causar dicha deflexión, que resulta en la deformación de la imagen del objeto. Esto es especialmente útil para estudiar la materia oscura, que constituye la gran mayoría de la materia en el Universo, ya que la materia ordinaria que se presenta en forma de planetas, estrellas, gas galáctico e intergaláctico es en un porcentaje casi despreciable. La materia oscura no absorbe ni emite radiación (lo que los científicos miden con los telescopios para detectar y estudiar los objetos astronómicos), por lo tanto, su presencia puede inferirse solo indirectamente por los efectos gravitacionales que ejerce sobre la luz de los objetos de fondo. Así, el lensing gravitacional permite detectarla, cuantificarla y poner restricciones a sus propiedades.
Además, los lentes gravitacionales permiten a los científicos mapear la distribución de la materia a gran escala en el universo, la cual se distribuye en el universo reciente en una suerte de telaraña, compuesta de partes vacías rodeadas de filamentos, en su mayoría de materia oscura y, por lo tanto, invisibles a nuestros telescopios. Al estudiar cómo las imágenes de las galaxias distantes se distorsionan por el efecto de lentes gravitacionales producidas por estas estructuras, los astrónomos pueden reconstruir las características de los filamentos, en cuyos nodos se encuentran los cúmulos de galaxias, y probar la teoría cosmológica estándar.
Por otra parte, el lensing gravitacional permite a los astrónomos estudiar varias épocas cósmicas y medir la tasa de expansión del universo. Al actuar como una especie de "telescopio natural", los lentes gravitacionales amplifican la luz de las galaxias distantes, permitiendo una observación más detallada de sus características. Esto ha proporcionado información valiosa sobre cómo se formaron y evolucionaron las galaxias en el universo primitivo. Además, al observar y analizar los lentes gravitacionales a diferentes distancias, los científicos pueden obtener datos cruciales sobre la velocidad a la que el universo se está expandiendo.
Finalmente, el lensing se utiliza para descubrir planetas extrasolares mediante un fenómeno conocido como microlente gravitacional. Cuando una estrella con planetas pasa delante de otra estrella más distante, la gravedad de la estrella en primer plano puede actuar como un lente, magnificando la luz de la estrella de fondo. Si un planeta está presente, se puede observar un efecto adicional en la magnificación, lo que permite a los astrónomos detectar la presencia de planetas incluso cuando estos no pueden ser observados directamente.
Sobre nosotros
Somos un equipo de estudiantes, investigadores post-doctorales, profesores y colaboradores interesados en el desarrollo interdisciplinario de la IA y la Astrofísica en Chile.
Este desafío, creado gracias al financiamiento de la Alianza Scotiabank-UTFSM, busca motivar a otros estudiantes a entrar en estas áreas, practicar sus habilidades, e involucrarse en la búsqueda de soluciones e innovaciones que contribuyan a la sociedad.
Organizadores
Dr. Ricardo Ñanculef
Professor
Departamento de Informática
Universidad Técnica Federico Santa María
Dr. Umberto Rescigno
Postdoctoral Researcher
Instituto de Astronomía y Ciencias Planetarias de Atacama
Universidad de Atacama
Gonzalo Aichele
Master's student
Departamento de Informática
Universidad Técnica Federico Santa María
Marcos Maldonado
Master's student
Departamento de Informática
Universidad Técnica Federico Santa María
Colaboradores
Dr. Verónica Motta
Full Professor
Instituto de Física y Astronomía
Universidad de Valparaíso
Dr. Cristóbal Sifón
Associate Professor
Instituto de Física
Pontificia Universidad Católica de Valparaíso
Dr. Julie Nantais
Associate Professor
Instituto de Astrofísica
Universidad Andrés Bello
Dr. Christopher Haines
Assistant Professor
Instituto de Astronomía y Ciencias Planetarias de Atacama
Universidad de Atacama
Dr. Raquel Pezoa
Professor
Universidad Técnica Federico Santa María

Noticias
30 de septiembre de 2024
- Les recordamos que estén preparados para enviar el video explicativo de máximo 20 minutos y el código de su solución de forma de garantizar la reproducibilidad y facilitar el trabajo de los jueces. Esto será solicitado a los 3 finalistas el día 8 de octubre como fue mencionado anteriormente.
- Para obtener el tablero final de resultados que evalúa las soluciones sobre la totalidad de los datos de prueba (por detalles, ver reglamento), la plataforma nos obliga a crear una nueva instancia de la competencia. Esta instancia se abrirá 02 de octubre a las 23:59 hrs. y tendrá un sólo intento por equipo. Los equipos tendrán que enviar sus predicciones finales para la totalidad de los datos de prueba hasta el día viernes 04 octubre a las 21:00 hrs.
28 de septiembre de 2024
-
Ya en la recta final de competencia queremos recordarles algunas instrucciones para que sus entregas no presenten errores:
- Para evitar errores de tiempo de procesamiento como el error "Soft time limit exceeded", es importante que los archivos en formato ".npy" lleven una precisión "float16" y además hayan sido comprimidos utilizando los métodos recomendados de compresión señalados tanto en el video tutorial de la sección Recursos en la página web como en los últimos correos. Un indicio de que este error ocurrirá se puede notar en el tamaño de las entregas, ocurriendo cuando estas pesan al rededor de los 4 GB.
- Para evitar errores por falta de mapas predichos en la entrega, cada uno de estos 76522 archivos debe llevar exactamente el mismo nombre que los archivos facilitados en el conjunto de validación.
- Para evitar problemas del formato de la entrega como el error "Incorrect submission formatting", es importante que el nombre del archivo ".zip" y la carpeta que contiene los archivos ".npy" respeten las indicaciones señaladas en la sección "Get Started" >> "Entregas (submissions)" en CodaBench.
- Debido a que la plataforma CodaBench funciona por defecto con un desfase no modificable de 3 horas respecto a la hora de Chile continental, se ha decidido extender la duración de la "Fase 1: Tablero Preliminar", así que será posible hacer las submissions hasta las 21:00 horas del día 2 de octubre, hora de Chile continental.
24 de septiembre de 2024
- Dado los equipos recurrentemente sufren el problema de la falta de espacio en CodaBench que les impide hacer entregas, hemos decidido que todas las entregas en estado "Cancelled" (canceladas) serán eliminadas al final de cada jornada. Esto se comenzará a realizar de manera sistemática a partir de la tarde del miércoles 25 de septiembre.
12 de septiembre de 2024
- Para incentivar el que las subidas al tablero se produzcan paulatinamente, y no todas el último día, queremos informar que para aquellos equipos que figuren en el tablero antes del día 25 de Septiembre a las 23:59 se les considerará para la asignación de una beca de asistencia a modo de ayuda para que estén presencialmente en la final de la competencia en el Campus Casa Central de la UTFSM, Valparaíso independiente de si son finalistas o no. La beca se asignará a solo un algunos equipo de manera aleatoria y priorizando el tiempo que han estado en tablero. Allí podrán conocer la universidad, los jueces, participar en el cierre de la competencia y disfrutar de la ciudad.
- Se avisa que los equipos que pasen a la fase final, es decir, la fase 2 de la competencia, el 8 de octubre deberán enviar un video explicativo de sus soluciones y adjuntar con este video el código asociado a la solución para así revisar la reproducibilidad de los resultados y la correctitud técnica de la solución. Se destaca que esto en ningún caso compromete la autoría del código por parte de los participantes.
- La fecha para la Fase 2 de competencia se ha escogido para el día 15 de octubre, iniciando a las 10:30 hrs y finalizando a las 14:30 hrs.
10 de septiembre de 2024
- Todas las submissions realizadas antes de las 23:59 del 1 de octubre que se ajusten a formato serán consideradas aunque no estén en estatus 'Finished', excepto aquellas en estado 'Canceled' o 'Failed'. Por favor, tengan en cuenta que la plataforma puede tener problemas, especialmente debido a la alta demanda en el último día, por lo que se les recomienda hacer la última submission con suficiente antelación. Establecemos desde ahora que, en caso de problemas con la plataforma CodaBench (y solo en este caso) en los minutos previos a la fecha límite, se considerarán en el tablero final todas aquellas submission que recibamos por correo electrónico antes de las 23:59 del 1 de octubre. Por la misma razón, tengan en cuenta que la versión definitiva del tablero no será necesariamente la que se podrá visualizar justo después de que pase la fecha límite establecida.
27 de agosto de 2024
- Viendo que algunas de las entregas hechas a la plataforma han tardado bastante en terminar, incluso quedando en un estado intermedio que no cambia por horas, hemos decidido permitir la re-ejecución de sus soluciones. Para esto, en caso que su entrega o submission se encuentre en el estado anterior por más de 2 horas y media, envíenos un e-mail con el asunto "Re-ejecución de entrega" informando en el cuerpo del e-mail el identificador de su entrega, el nombre de su equipo y la fecha y hora en la que hicieron la entrega, así nosotros podremos volver a ejecutarla esperando que pueda procesarse esta vez sin problemas.
24 de agosto de 2024
- Hemos liberado el código de las métricas de éxito implementadas en CodaLab, el cual pueden encontrar en el siguiente enlace. Nota: el método de Lenstools para encontrar peaks se podia replicar fácilmente haciendo el cómputo más ligero, de manera que se optó por este camino.
19 de agosto de 2024
- Considerando múltiples solicitudes, hemos decidido extender el período de inscripciones a la Astro-Datatón 2024 hasta el día 30 de agosto de 2024 23:59 horas (Chile Continental). ¡Ya tenemos más de 160 inscritos de 17 universidades diferentes! Nos encantaría que más mujeres y estudiantes de regiones puedan participar.
- Reiteramos que la entrega de los resultados por parte de los equipos será posible cuando la mayoría de ellos se haya inscrito a CodaLab con el nombre sugerido. La habilitación general será realizada e informada por correo electrónico después del 22 de agosto.
14 de agosto de 2024
- Para facilitar el proceso de registro en la plataforma CodaBench de manera correcta, hemos creado una nueva columna en la lista de equipos (link) con los usuarios que cada equipo debe registrar en la plataforma.
09 de agosto de 2024
- Una vez que hayan completado el registro en el formulario de la sección 'Inscríbete' de este sitio, usen este enlace que los llevará a la plataforma que hospeda la competencia (CodaLab). Allí, los participantes deben registrarse con una única cuenta que tenga el nombre de su equipo. Encontrarán todo lo que necesitan para empezar (incluyendo los datos y el Starting Kit) en la sección Get started >> Datos de la competencia 'Astro-Datatón 2024'.
- Ya hemos publicado el material del webinar de promoción y logística, el cual pueden ver en la sección Recursos.
05 de agosto de 2024
- Si el nombre del equipo se encuentra en la lista disponible en la sección "Inscríbete" del sitio web, significa que el equipo está inscrito.
- La inscripción en CodaBench debe hacerse usando el nombre del equipo.
- Las solicitudes para subir los resultados en CodaBench serán aceptadas cuando la mayoría de los equipos estén inscritos de la manera indicada.
Fase 2
¿Dónde se llevará a cabo el evento?
El evento se desarrollará en el Auditorio Claudio Matamoros (F106), Edificio F, Departamento de Informática, UTFSM Casa Central. En el punto de reunión "Patio de los Ceibos" (señalado en el mapa con una "X") los esperarán ayudantes para quienes no sepan llegar directamente al aula. Al campus se accede por una de las siguientes porterías: Avenida España 1680 (Portería España), Avenida Placeres 401 (Portería Placeres), Avenida Placeres 590 (Portería Portales), Calle Valdés altura Dr. Quiroz (Portería Valdés, al lado del edificio de Biotecnología en el mapa adjunto). Es posible simular el recorrido a efectuar en tour360 usm.
¿Cómo se evaluará a los finalistas?
Cada uno de los tres equipos finalistas dispondrá de 20 minutos para exponer su solución y 10 minutos para responder preguntas. Se solicitará a cada uno de los jueces que evalúe cada solución expuesta en base a una rúbrica durante la fase de presentaciones.
Una vez concluida la fase de presentaciones, se desarrollará una fase de discusión que permitirá a cada juez/jueza modificar la puntuación otorgada. Al final de esta fase, se calculará el promedio del puntaje final obtenido por cada equipo a partir de todas las rúbricas recibidas. El equipo con el puntaje más alto obtendrá el primer premio, y así sucesivamente. En caso de empate, el jurado podrá votar por el equipo que debe ocupar la primera posición empatada y las sucesivas, determinándose el equipo ganador por mayoría simple. Si este proceso continuara generando un empate, se desempatará considerando la posición en el tablero final. Es importante aclarar que el modo en que cada juez o jueza considera el desempeño numérico de cada equipo para asignar un puntaje en la rúbrica es personal y libre de cambiar durante la fase de debate.
Mapa de referencia
