Bioinformatique de la protéomique : analyse des données protéiques

Présentation

La bioinformatique de la protéomique est la discipline computationnelle qui transforme les données brutes de spectrométrie de masse en connaissances biologiques sur les protéines. Elle aborde l’immense complexité du protéome — des milliers de protéines, chacune pouvant porter de multiples modifications post-traductionnelles, variants d’épissage et produits de dégradation. Le domaine développe des algorithmes pour l’identification des peptides, l’inférence des protéines, la quantification et la validation statistique. En convertissant les signaux spectraux en protéines identifiées et quantifiées, la bioinformatique de la protéomique permet aux chercheurs de poser des questions systémiques sur le fonctionnement cellulaire, les mécanismes pathologiques et les réponses aux médicaments.

Concepts clés

Au cœur du domaine se trouve le paradigme de la recherche dans les bases de données, où les spectres de masse tandem expérimentaux sont comparés aux spectres théoriques dérivés d’une base de données de séquences protéiques. Des algorithmes tels que SEQUEST, Mascot et MS-GF+ attribuent les correspondances peptide-spectre (PSM) à l’aide de fonctions de score qui tiennent compte des séries d’ions fragments et de la masse du précurseur. L’estimation du taux de fausses découvertes (FDR) via la recherche cible-leurre contrôle le taux d’erreur des identifications. L’inférence des protéines aborde le problème des peptides partagés — des peptides communs à plusieurs protéines — en utilisant des principes de parcimonie et des approches bayésiennes.

Applications

La bioinformatique de la protéomique est appliquée à la découverte de biomarqueurs, où l’expression différentielle des protéines entre tissus sains et malades est explorée pour identifier des candidats diagnostiques. Elle soutient l’identification de cibles médicamenteuses en profilant les changements d’abondance des protéines suite à un traitement par un composé. Le domaine alimente également la caractérisation des modifications post-traductionnelles et s’intègre aux workflows de protéomique et spectrométrie de masse. Les données des expériences de spectrométrie de masse sont traitées via des pipelines qui incorporent également les résultats de l’extraction et purification des protéines pour garantir que la qualité de l’échantillon se reflète dans l’analyse finale.