Al iniciarse en la bioinformática, uno comete muchos errores. Para que no te pase, revisa nuestro curso de “Introducción a la Bioinformática y NGS” donde te explicamos las buenas prácticas de la bioinformática. Aquí te compartimos los errores más comunes que hay:
- Olvidarte de revisar ambas cadenas del ADN
- Generar sitios genómicos aleatorios sin evitar espacios enmascarados (NNN)
- Confundir el genoma e incluso las especies
- Almacenar tus datos genéticos en un archivo de Excel quien ha cambiado SEPT9 por sept-9.
- Confiar en que un archivo descargado se descargó completo
- Confiar en que un alineador aceptará una lista de archivos en lugar de simplemente tomar el primero e ignorar el resto
- Suponer que los puntajes de calidad en un archivo FASTQ provienen de una excelente ejecución codificada por Sanger en lugar de una ejecución de Illumina-1.3 muy deficiente
- Suponer que chr1 va seguido de chr2 y no de chr10
- Analizar incorrectamente una alineación / formato de archivo complejo (por ejemplo, BLAST o GenBank)
- No tener en cuenta la cadena del ADN a estudiar
- No analizar el último elemento en un archivo (debido a un mal script)
- No tener en cuenta los saltos de línea dependientes del sistema operativo
- Usar el ensamblaje / anotación / referencia incorrectos
- Usar el sistema de coordenadas del genoma incorrecto
- Usar el archivo incorrecto (múltiples versiones, versión sesgada)
- No tener en cuenta las características de anotación
- Asumir que todos los trabajos se han completado en un clúster
- Borrar archivos
- Usar inadecuadamente de pruebas estadísticas
- No documentar completamente los métodos (para verificar y corregir todo lo anterior).