Skip to content

Article image
Bioinformática de Proteómica: Análisis de Datos de Proteínas

Visión General

La bioinformática de proteómica es la disciplina computacional que transforma datos crudos de espectrometría de masas en conocimiento biológico sobre proteínas. Aborda la inmensa complejidad del proteoma — miles de proteínas, cada una potencialmente portando múltiples modificaciones postraduccionales, variantes de empalme y productos de degradación. El campo desarrolla algoritmos para identificación de péptidos, inferencia de proteínas, cuantificación y validación estadística. Al convertir señales espectrales en proteínas identificadas y cuantificadas, la bioinformática de proteómica permite a los investigadores plantear preguntas a nivel de sistemas sobre la función celular, los mecanismos de enfermedad y las respuestas a fármacos.

Conceptos Clave

Central para el campo es el paradigma de búsqueda en bases de datos, donde los espectros de masas en tándem experimentales se comparan con espectros teóricos derivados de una base de datos de secuencias de proteínas. Algoritmos como SEQUEST, Mascot y MS-GF+ asignan coincidencias péptido-espectro (PSMs) usando funciones de puntuación que consideran las series de iones de fragmentos y la masa precursora. La estimación de la tasa de falsos descubrimientos (FDR) mediante búsqueda diana-señuelo controla la tasa de error de las identificaciones. La inferencia de proteínas aborda el problema de los péptidos compartidos — péptidos comunes a múltiples proteínas — utilizando principios de parsimonia y enfoques bayesianos.

Aplicaciones

La bioinformática de proteómica se aplica en el descubrimiento de biomarcadores, donde la expresión diferencial de proteínas entre tejidos sanos y enfermos se explora en busca de candidatos diagnósticos. Apoya la identificación de dianas farmacológicas mediante el perfilado de cambios en la abundancia de proteínas tras el tratamiento con compuestos. El campo también impulsa la caracterización de modificaciones postraduccionales y se integra con flujos de trabajo de proteómica y espectrometría de masas. Los datos de experimentos de espectrometría de masas se procesan a través de pipelines que también incorporan resultados de extracción y purificación de proteínas para garantizar que la calidad de la muestra se refleje en el análisis final.