Skip to content

Article image
Convertidor de formato de secuencia

Convierta sus secuencias de ADN o aminoácidos entre diferentes formatos bioinformáticos con este versátil conversor.

Cómo utilizar

  1. Ingrese su secuencia de ADN o aminoácidos en el área de entrada.
  2. Ingrese el nombre de la secuencia, la descripción y el número de acceso (si corresponde) en los campos de entrada correspondientes.
  3. Seleccione el formato de entrada en el menú desplegable.
  4. Seleccione el formato de salida deseado en el menú desplegable.
  5. Haga clic en el botón “Convertir”.
  6. La secuencia convertida se mostrará en el área de salida.
  7. Haga clic en el botón “Descargar” para guardar la secuencia convertida en un archivo. La extensión del archivo se determinará automáticamente en función del formato de salida seleccionado.

Formatos compatibles

Este convertidor admite los siguientes formatos de secuencia:

  • FASTA: Un formato simple basado en texto que representa secuencias de nucleótidos o aminoácidos. Una secuencia en formato FASTA comienza con una descripción de una sola línea, seguida de líneas de datos de secuencia. La línea de descripción debe comenzar con un símbolo mayor que (”>”).
  • EMBL: Un formato completo para almacenar datos de secuencias de nucleótidos. Un archivo de formato EMBL puede contener múltiples secuencias, cada una con anotaciones detalladas. Los datos de secuencia están precedidos por líneas ID, AC, DE y SQ, y la secuencia en sí misma a menudo se divide en líneas de 60 caracteres. La secuencia termina con ”//”.
  • GCG: Un formato utilizado por el paquete de software Genetics Computer Group (GCG). Un archivo de formato GCG generalmente contiene una sola secuencia con anotaciones. El inicio de la secuencia está marcado por una línea que termina con dos caracteres de punto (”..”).
  • GenBank: Un formato ampliamente utilizado para almacenar datos de secuencias de nucleótidos y aminoácidos. De manera similar a EMBL, los archivos GenBank pueden contener múltiples secuencias con anotaciones. Las secuencias comienzan después de la palabra clave “ORIGIN” y terminan con ”//”.
  • IG/Stanford: Un formato utilizado por el software Integrated Genetics (IG). Los archivos de formato IG pueden contener múltiples secuencias, cada una con comentarios (líneas que comienzan con ”;”), una línea de nombre y la secuencia misma, terminada con “1” (lineal) o “2” (circular).
  • Simple/Raw: Un formato simple que contiene solo los caracteres de la secuencia (caracteres IUPAC y espacios). No se incluyen encabezados ni anotaciones. Un archivo de secuencia simple puede contener solo una secuencia.
  • Pretty: La secuencia está formateada para facilitar su lectura, generalmente agregando espacios cada 10 caracteres.

Nota: Este convertidor proporciona conversiones de formato básicas. Para una manipulación o análisis más avanzados de los datos de secuencia, se recomiendan herramientas bioinformáticas especializadas. El formato de algunos formatos (como GCG) puede requerir un ajuste adicional según los requisitos específicos del software. Las sumas de comprobación y otros metadatos pueden no ser completamente precisos. Siempre verifique dos veces la salida, especialmente para aplicaciones críticas. La detección del formato de entrada es básica y puede no identificar correctamente todas las variaciones de un formato. Es mejor seleccionar explícitamente el formato de entrada.