Errores en bioinformática - Winter Genomics

Al iniciarse en la bioinformática, uno comete muchos errores. Para que no te pase, revisa nuestro curso de “Introducción a la Bioinformática y NGS” donde te explicamos las buenas prácticas de la bioinformática. Aquí te compartimos los errores más comunes que hay:

Olvidarte de revisar ambas cadenas del ADN
Generar sitios genómicos aleatorios sin evitar espacios enmascarados (NNN)
Confundir el genoma e incluso las especies
Almacenar tus datos genéticos en un archivo de Excel quien ha cambiado SEPT9 por sept-9.
Confiar en que un archivo descargado se descargó completo
Confiar en que un alineador aceptará una lista de archivos en lugar de simplemente tomar el primero e ignorar el resto
Suponer que los puntajes de calidad en un archivo FASTQ provienen de una excelente ejecución codificada por Sanger en lugar de una ejecución de Illumina-1.3 muy deficiente
Suponer que chr1 va seguido de chr2 y no de chr10
Analizar incorrectamente una alineación / formato de archivo complejo (por ejemplo, BLAST o GenBank)
No tener en cuenta la cadena del ADN a estudiar
No analizar el último elemento en un archivo (debido a un mal script)
No tener en cuenta los saltos de línea dependientes del sistema operativo
Usar el ensamblaje / anotación / referencia incorrectos
Usar el sistema de coordenadas del genoma incorrecto
Usar el archivo incorrecto (múltiples versiones, versión sesgada)
No tener en cuenta las características de anotación
Asumir que todos los trabajos se han completado en un clúster
Borrar archivos
Usar inadecuadamente de pruebas estadísticas
No documentar completamente los métodos (para verificar y corregir todo lo anterior).