fbpx
Huber et al., 2015

Orquestando análisis genómicos con Bioconductor

Bioconductor es software de código abierto para el análisis y la comprensión de datos genómicos y de biología molecular. Tiene como objetivo permitir la investigación interdisciplinaria, la colaboración y el rápido desarrollo de software científico. Basado en el lenguaje de programación estadística R, Bioconductor comprende más de 900 paqueterías generadas por la comunidad científica. Estas paqueterías tienen una variedad de aplicaciones bioinformáticas y estadísticas. A contiuación te presentamos una descripción general para posibles usuarios y colaboradores.

El progreso de la biotecnología conduce continuamente a nuevos tipos de datos, y los conjuntos de datos aumentan rápidamente en volumen, resolución y diversidad. Esto promete avances sin precedentes en nuestra comprensión de los sistemas biológicos y en la medicina. Sin embargo, la complejidad y el volumen de datos también desafían la capacidad de los científicos para analizarlos.

Bioconductor proporciona estructuras y métodos de datos centrales que permiten el análisis a escala genómica de datos en el contexto de programación estadística de R. Bioconductor acepta diversos tipos de datos de secuenciación, incluidos ADN, ARN, inmunoprecipitación de cromatina, Hi-C, metilomas y perfiles de ribosomas así como recursos de anotación asociados. También contiene paqueterías para el análisis de microarreglos, proteómica, metabolómica, citometría de flujo, imágenes cuantitativas, quimioinformática y otros más.

Bioconductor permite la creación rápida de flujos de trabajo que combinan múltiples tipos de datos y herramientas para inferencia estadística, regresión, análisis de red, aprendizaje automático y visualización en todas las etapas de un proyecto, desde la generación de datos hasta la publicación.

Bioconductor es un entorno flexible para desarrollar las herramientas necesarias basado en dos principios:

1.Proporcionar una experiencia de usuario atractiva

La documentación de bioconductor se presenta en tres niveles:

  1. Flujos de trabajo que documentan análisis completos que abarcan múltiples herramientas.
  2. Viñetas de paqueterías que proporcionan una descripción de los usos previstos de un paquete en particular, incluidos ejemplos detallados de código ejecutable.
  3. Páginas de manual de funciones con descripciones precisas de todas las entradas y salidas junto con ejemplos de trabajo.

En muchos casos, los usuarios finalmente se convierten en desarrolladores, poniendo sus propios algoritmos y enfoques a disposición de otros.

2. Apoyar a la comunidad científica

El soporte incluye orientación y capacitación sobre desarrollo y documentación de software, así como el uso de paradigmas de programación apropiados, como pruebas unitarias y optimización juiciosa. Uno de los objetivos principales es el desarrollo distribuido de componentes de software interoperables por parte de expertos en el dominio científico.

Esto se logra utilizando estructuras de datos comunes que permitan flujos de trabajo que integren múltiples tipos de datos y disciplinas. Para facilitar la investigación y la innovación, se emplea un lenguaje de programación de alto nivel. Esta elección produce prototipos rápidos, creatividad, flexibilidad y reproducibilidad.

R es la opción debido a sus capacidades informáticas científicas y estadísticas, por sus facilidades gráficas y por la conveniencia de un lenguaje interpretado. R también interactúa con lenguajes de bajo nivel, incluidos C y C ++ para operaciones computacionalmente intensivas, Java para la integración con software empresarial y JavaScript para aplicaciones e informes interactivos basados ​​en la web.

¡Aprende a programar con R!

Nuestro curso teórico-práctico de Introducción a R te permitirá comprender los conceptos básicos de R. Aprenderás los principios de programación en R, el uso de objetos, estructuras de datos y desarrollarás habilidades básicas para generar gráficas entre muchas cosas más. Además, realizarás estadística descriptiva para poner en práctica lo aprendido del curso.
Más info

Referencias:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4509590/