fbpx

Bioinformática y proteómica

La bioinformática es un componente esencial de la proteómica; por lo tanto, sus implicaciones han ido aumentando progresivamente con la llegada de métodos de alto rendimiento que dependen de un análisis de datos potente. Este campo nuevo y emergente presenta algoritmos novedosos para gestionar datos proteómicos enormes y heterogéneos y avanzar hacia el procedimiento de descubrimiento.

El uso de la bioinformática para la proteómica se ha enriquecido significativamente durante los últimos años. El desarrollo de un nuevo algoritmo para el análisis de una mayor cantidad de datos con mayor especificidad y precisión ayuda en la identificación y cuantificación de proteínas, por lo que han hecho posible lograr datos expuestos con respecto a la expresión de proteínas.

La gestión de una cantidad tan elevada de datos es el principal problema asociado a este tipo de análisis. Además, todavía es difícil encontrar la asociación entre los datos proteómicos y las otras tecnologías ómicas, incluidas la genómica y la metabolómica. Sin embargo, la tecnología de la base de datos junto con los nuevos algoritmos estadísticos semánticos son herramientas potentes que podrían ser útiles para superar estas limitaciones.

Los datos proteómicos se pueden cargar en los repositorios que también pueden ser útiles para buscar en la base de datos. Los repositorios de proteomas más grandes, incluida la base de datos de identificación de proteómica PRIDE, el proyecto Proteome Commons y PeptideAtlas, brindan acceso directo a la mayoría de los datos almacenados y son herramientas valiosas para la minería de datos.

Las rutas de las proteínas son una serie de reacciones dentro de la célula que ejercen un efecto biológico particular. Las proteínas que participan directamente en la reacción junto con las que regulan las vías se combinan en bases de datos de vías; por lo tanto, se encuentran disponibles varios recursos y bases de datos para las rutas de las proteínas. KEGG, Ingenuity, Pathway Knowledge Base Reactome y BioCarta son algunas de las bases de datos que incluyen datos completos sobre el metabolismo, la señalización y las interacciones. Además de estas bases de datos completas, se han desarrollado bases de datos específicas para vías de traducción de señales como GenMAPP o PANTHER.

Se han desarrollado bases de datos como Netpath, que involucran las vías activas en el cáncer que son útiles para la identificación de proteínas relevantes para un tipo de cáncer. Estas bases de datos públicas poseen una mayor conectividad que permite nuevos hallazgos para proteínas.

NombreTipoLinks
GenBank Base de datoshttp://www.ncbi.nih.gov/entrez/query.fcgi?db=protein 
RefSeq Base de datos https://www.ncbi.nlm.nih.gov/refseq/ 
nr Base de datoshttp://www.ncbi.nlm.nih.gov/BLAST/ 
UniProt Base de datos http://www.pir.uniprot.org/ 
UniRef Base de datoshttp://www.pir.uniprot.org/database/nref.shtml 
UniParc Base de datoshttp://www.pir.uniprot.org/database/archive.shtml 
TrEMBL Base de datoshttp://kr.expasy.org/sprot/ 
SwissProt Base de datoshttp://kr.expasy.org/sprot/ 
PIR Base de datoshttp://pir.georgetown.edu/ 
OWL Base de datoshttp://www.bioinf.man.ac.uk/dbbrowser/OWL/ 
BLASTP BLAST http://blast.ncbi.nlm.nih.gov 
TBLASTN BLAST https://blast.ncbi.nlm.nih.gov 
PSI-BLAST BLAST https://blast.ncbi.nlm.nih.gov 
PHI-BLAST BLAST https://blast.ncbi.nlm.nih.gov 
DELTA-BLAST BLAST https://blast.ncbi.nlm.nih.gov 
InterProScan Dominio protéicohttp://www.ebi.ac.uk/lnterProScan/ 
CD server Dominio protéicohttp://www.ncbi.nlm.nih.gov/Structure/cdd/cdd.shtml 
ProWleScan Dominio protéicohttp://hits.isb-sib.ch/cgi-bin/PFSCAN 
ScanProsite Dominio protéicohttp://us.expasy.org/tools/scanprosite/ 
PATTINPROT Dominio protéicohttp://pbil.ibcp.fr/html/pbiljndex.html 
SIRW Dominio protéicohttp://sirw.embl.de/index.html 
Match Box Motifshttp://www.sciences.fundp.ac.be/biologie/bms/help.html 
MEME Motifshttp://meme.sdsc.edu/meme/website/meme.html 
Gibbs Motifshttp://bayesweb.wadsworth.org/gibbs/gibbs.html 
Dialign Motifshttp://bibiserv.techfak.uni-bielefeld.de/dialign/ 
BlockMakei Motifshttp://blocks.fhcrc.org/make_blocks.html 
PDB Estructura protéicahttp://www.rcsb.org/pdb/ 
SwissModel Estructura protéicahttp://swissmodel.expasy.org/repository/ 
SCOP Estructura protéicahttp://scop.mrc-lmb.cam.ac.uk/scop/ 
ModBase Estructura protéicahttp://alto.compbio.ucsf.edu/modbase-cgi/index.cgi 
CATH Estructura protéicahttp://www.biochem.ucl.ac.uk/bsm/cath/ 
MMDD Estructura protéicahttp://www.ncbi.nlm.nih.gov/Structure/ 
ConSurf Estructura protéicahttp://consurf.tau.ac.il/ 
CASTp Estructura protéicahttp://sts.bioe.uic.edu/castp/index.php 
ProtSkin Estructura protéicahttp://www.mcgnmr.ca/ProtSkin/intro/ 
LigandProtein Estructura protéicahttp://bip.weizmann.ac.il/oca-bin/lpccsu 
PredictProtein Estructura protéicahttp://www.embl-heidelberg.de/predictprotein 
O-GlycoBase Estructura protéicahttp://www.cbs.dtu.dk/services/NetOGIyc/ 
PhosphoBase Estructura protéicahttp://www.cbs.dtu.dk/services/NetPhos 
SwissModel Estructura protéicahttp://www.expasy.org/swissmod 
Whatlf Estructura protéicahttp://www.cmbi.kun.nl/gv/servers/WIWWWI 
ESyPred3D Estructura protéicahttp://www.fundp.ac.be/urbm/bioinfo/esypred 
EBI Estructura protéicahttp://biotech.ebi.ac.uk:8400/ 

Las proteínas no actúan de forma independiente en la mayoría de los casos y forman complejos transitorios o estables con otras proteínas. La proteína puede ser intrincada como complejos de composición variable y es esencial estudiar los complejos de proteínas junto con las condiciones que resultan en su formación o disociación para la comprensión completa de un sistema biológico.

Las bases de datos como BioGRID, IntAct, MINT y HRPD contienen la información con referencia a interacciones de proteínas en complejos. STRING no solo es una base de datos ampliamente utilizada para los datos de interacción de proteínas, sino que se conecta a varios otros recursos para la minería de literatura. Además, las redes de proteínas se pueden dibujar basándose en la lista de genes proporcionada y las interacciones disponibles utilizando la base de datos STRING.

Referencias:

Journal of Chromatographic Science, Volume 55, Issue 2, 1 February 2017, Pages 182–196