Convertisseur de format et type de séquence

Convertissez vos séquences d’ADN, d’ARN ou d’acides aminés entre différents types et formats avec ce convertisseur polyvalent.

Conversions prises en charge

Ce convertisseur prend en charge les conversions suivantes :

ADN vers ARN et acides aminés
ARN vers ADN et acides aminés
Les conversions d’acides aminés vers ADN et d’acides aminés vers ARN ne sont pas encore prises en charge

Comment utiliser

Saisissez votre séquence d’ADN, d’ARN ou d’acides aminés dans la zone de saisie.
Sélectionnez le type de séquence d’entrée (ADN, ARN ou acides aminés).
Sélectionnez le type de séquence de sortie souhaité.
Saisissez le nom de la séquence, la description et le numéro d’accession (si applicable) dans les champs correspondants.
Sélectionnez le format d’entrée dans le menu déroulant.
Sélectionnez le format de sortie souhaité dans le menu déroulant.
Cliquez sur le bouton « Convertir ».
La séquence convertie sera affichée dans la zone de sortie.
Cliquez sur le bouton « Télécharger » pour enregistrer la séquence convertie.

Formats pris en charge

Ce convertisseur prend en charge les formats de séquence suivants :

FASTA : Un format textuel simple représentant des séquences nucléotidiques ou d’acides aminés. Une séquence au format FASTA commence par une description sur une seule ligne, suivie de lignes de données de séquence. La ligne de description doit commencer par le symbole « > ».
EMBL : Un format complet pour stocker des données de séquences nucléotidiques. Un fichier au format EMBL peut contenir plusieurs séquences, chacune avec des annotations détaillées. Les données de séquence sont précédées des lignes ID, AC, DE et SQ, et la séquence elle-même est souvent divisée en lignes de 60 caractères. La séquence se termine par « // ».
GCG : Un format utilisé par le progiciel Genetics Computer Group (GCG). Un fichier au format GCG contient généralement une seule séquence avec des annotations. Le début de la séquence est marqué par une ligne se terminant par deux points (« .. »).
GenBank : Un format largement utilisé pour stocker des données de séquences nucléotidiques et d’acides aminés. Similaire à EMBL, les fichiers GenBank peuvent contenir plusieurs séquences avec des annotations. Les séquences commencent après le mot-clé « ORIGIN » et se terminent par « // ».
IG/Stanford : Un format utilisé par le logiciel Integrated Genetics (IG). Les fichiers au format IG peuvent contenir plusieurs séquences, chacune avec des commentaires (lignes commençant par « ; »), une ligne de nom et la séquence elle-même, terminée par « 1 » (linéaire) ou « 2 » (circulaire).
Plain/Raw : Un format simple contenant uniquement les caractères de la séquence (caractères IUPAC et espaces). Aucun en-tête ou annotation n’est inclus. Un fichier de séquence simple peut contenir une seule séquence.
Pretty : La séquence est formatée pour la lisibilité, généralement en ajoutant des espaces tous les 10 caractères.

Remarque : Ce convertisseur fournit des conversions de base de type et de format de séquence. Pour une manipulation ou une analyse plus avancée des données de séquence, des outils bioinformatiques spécialisés sont recommandés. Le formatage de certains formats (comme GCG) peut nécessiter un ajustement supplémentaire en fonction des exigences logicielles spécifiques. Les sommes de contrôle et autres métadonnées peuvent ne pas être entièrement exactes. Vérifiez toujours la sortie, en particulier pour les applications critiques. La détection du format d’entrée est basique et peut ne pas identifier correctement toutes les variations d’un format. Il est préférable de sélectionner explicitement le format d’entrée. Les conversions d’acides aminés vers ADN et d’acides aminés vers ARN ne sont pas encore prises en charge. La traduction des acides aminés utilise une table de codons simplifiée ; les codons rares peuvent ne pas être représentés avec précision. Les codons d’arrêt sont représentés par un astérisque (*).