Conversor de formatos y tipos de secuencias

Convierta sus secuencias de ADN, ARN o aminoácidos entre diferentes tipos y formatos con este versátil conversor.

Conversiones admitidas

Este convertidor admite las siguientes conversiones:

ADN a ARN y aminoácidos
ARN a ADN y aminoácidos
Actualmente no se admiten las conversiones de aminoácidos a ADN y aminoácidos a ARN

Cómo utilizar

Ingrese su secuencia de ADN, ARN o aminoácidos en el área de entrada.
Seleccione el tipo de secuencia de entrada (ADN, ARN o aminoácidos).
Seleccione el tipo de secuencia de salida deseada.
Ingrese el nombre de la secuencia, la descripción y el número de acceso (si corresponde) en los campos de entrada correspondientes.
Seleccione el formato de entrada en el menú desplegable.
Seleccione el formato de salida deseado en el menú desplegable.
Haga clic en el botón “Convertir”.
La secuencia convertida se mostrará en el área de salida.
Haga clic en el botón “Descargar” para guardar la secuencia convertida.

Formatos compatibles

Este convertidor admite los siguientes formatos de secuencia:

FASTA: Un formato simple basado en texto que representa secuencias de nucleótidos o aminoácidos. Una secuencia en formato FASTA comienza con una descripción de una sola línea, seguida de líneas de datos de secuencia. La línea de descripción debe comenzar con un símbolo mayor que (”>”).
EMBL: Un formato integral para almacenar datos de secuencias de nucleótidos. Un archivo de formato EMBL puede contener múltiples secuencias, cada una con anotaciones detalladas. Los datos de secuencia están precedidos por líneas ID, AC, DE y SQ, y la secuencia en sí misma a menudo se divide en líneas de 60 caracteres. La secuencia termina con ”//”.
GCG: Un formato utilizado por el paquete de software Genetics Computer Group (GCG). Un archivo de formato GCG generalmente contiene una sola secuencia con anotaciones. El inicio de la secuencia está marcado por una línea que termina con dos caracteres de punto (”..”).
GenBank: Un formato ampliamente utilizado para almacenar datos de secuencias de nucleótidos y aminoácidos. Al igual que EMBL, los archivos GenBank pueden contener múltiples secuencias con anotaciones. Las secuencias comienzan después de la palabra clave “ORIGIN” y terminan con ”//”.
IG/Stanford: Un formato utilizado por el software Integrated Genetics (IG). Los archivos de formato IG pueden contener múltiples secuencias, cada una con comentarios (líneas que comienzan con ”;”), una línea de nombre y la secuencia misma, terminada con “1” (lineal) o “2” (circular).
Plain/Raw: Un formato simple que contiene solo los caracteres de la secuencia (caracteres IUPAC y espacios). No se incluyen encabezados ni anotaciones. Un archivo de secuencia simple puede contener solo una secuencia.
Pretty: La secuencia está formateada para facilitar su lectura, generalmente agregando espacios cada 10 caracteres.

Nota: Este convertidor proporciona conversiones básicas de tipo y formato de secuencia. Para una manipulación o análisis más avanzados de los datos de secuencia, se recomiendan herramientas bioinformáticas especializadas. El formato de algunos formatos (como GCG) puede requerir un ajuste adicional según los requisitos específicos del software. Las sumas de comprobación y otros metadatos podrían no ser totalmente precisos. Siempre verifique dos veces la salida, especialmente para aplicaciones críticas. La detección del formato de entrada es básica y puede no identificar correctamente todas las variaciones de un formato. Es mejor seleccionar explícitamente el formato de entrada. Las conversiones de aminoácidos a ADN y aminoácidos a ARN aún no son compatibles. La traducción de aminoácidos utiliza una tabla de codones simplificada; los codones raros podrían no estar representados con precisión. Los codones de terminación se representan con un asterisco (*).