Diseñar y construir contenedores de software científico utilizando Singularity, que permitan ejecutar herramientas bioinformáticas y de análisis de datos masivos (Big Data) de manera reproducible y eficiente. El objetivo es integrar software existente, tanto desarrollado internamente como de terceros, en un entorno contenedor, garantizando que las herramientas sean ejecutadas dentro del contenedor durante el proceso computacional, optimizando así la portabilidad, la escalabilidad y la reproducibilidad de los análisis científicos.
1. Herramientas disponibles:
• Código fuente y binarios de varias herramientas de análisis científico desarrolladas en la unidad de bioinformática y en colaboración con otros investigadores.
• Ejemplos funcionales de contenedores simples ya creados con Singularity.
2. Datos disponibles:
• Scripts de análisis y flujos de trabajo bioinformáticos que requieren contenedorización.
• Datos de prueba para validar las herramientas dentro del contenedor.
3. Recursos adicionales:
• Documentación interna sobre la instalación y uso de herramientas bioinformáticas.
• Soporte del equipo para resolver dudas técnicas o metodológicas.
1. Contenedores funcionales de Singularity que incluyan las herramientas especificadas, con pruebas de funcionamiento documentadas.
2. Manual de uso y despliegue de los contenedores, incluyendo instrucciones para la ejecución en sistemas de computación en clúster y ejemplos reproducibles de análisis.
3. (Opcional) Propuesta de mejoras o automatización en la creación de contenedores para futuros proyectos.
1. Tecnologías que van a utilizar:
• Singularity, Linux (Bash scripting), Docker (opcional como punto de partida), y herramientas bioinformáticas específicas (se proporcionarán).
2. Horarios y modalidad:
• Horario flexible según disponibilidad del estudiante.
• Modalidad híbrida, con reuniones presenciales en la unidad de bioinformática en el IPBLN según necesidad.
3. Otros detalles:
• El proyecto ofrece la oportunidad de trabajar con datos y herramientas científicas de última generación, en un entorno colaborativo con investigadores y bioinformáticos expertos.