Converta suas sequências de DNA ou aminoácidos entre diferentes formatos de bioinformática com este conversor versátil.
Como Usar
- Insira sua sequência de DNA ou aminoácidos na área de entrada.
- Insira o nome da sequência, descrição e número de acesso (se aplicável) nos campos correspondentes.
- Selecione o formato de entrada no menu suspenso.
- Selecione o formato de saída desejado no menu suspenso.
- Clique no botão “Converter”.
- A sequência convertida será exibida na área de saída.
- Clique no botão “Download” para salvar a sequência convertida em um arquivo. A extensão do arquivo será determinada automaticamente com base no formato de saída selecionado.
Formatos Suportados
Este conversor suporta os seguintes formatos de sequência:
- FASTA: Um formato simples baseado em texto que representa sequências de nucleotídeos ou aminoácidos. Uma sequência no formato FASTA começa com uma linha de descrição, seguida por linhas de dados da sequência. A linha de descrição deve começar com o símbolo de maior (”>”).
- EMBL: Um formato abrangente para armazenar dados de sequências de nucleotídeos. Um arquivo no formato EMBL pode conter múltiplas sequências, cada uma com anotações detalhadas. Os dados da sequência são precedidos pelas linhas ID, AC, DE e SQ, e a sequência em si é frequentemente dividida em linhas de 60 caracteres. A sequência termina com ”//”.
- GCG: Um formato usado pelo pacote de software Genetics Computer Group (GCG). Um arquivo no formato GCG geralmente contém uma única sequência com anotações. O início da sequência é marcado por uma linha terminando com dois pontos (”..”).
- GenBank: Um formato amplamente usado para armazenar dados de sequências de nucleotídeos e aminoácidos. Semelhante ao EMBL, os arquivos GenBank podem conter múltiplas sequências com anotações. As sequências começam após a palavra-chave “ORIGIN” e terminam com ”//”.
- IG/Stanford: Um formato usado pelo software Integrated Genetics (IG). Arquivos no formato IG podem conter múltiplas sequências, cada uma com comentários (linhas começando com ”;”), uma linha de nome e a sequência em si, terminada por “1” (linear) ou “2” (circular).
- Simples/Cru: Um formato simples contendo apenas os caracteres da sequência (caracteres IUPAC e espaços). Nenhum cabeçalho ou anotação está incluído. Um arquivo de sequência simples pode conter apenas uma sequência.
- Pretty: A sequência é formatada para legibilidade, tipicamente adicionando espaços a cada 10 caracteres.
Nota: Este conversor fornece conversões básicas de formato. Para manipulação ou análise mais avançada de dados de sequência, ferramentas especializadas de bioinformática são recomendadas. A formatação de alguns formatos (como GCG) pode exigir ajustes adicionais dependendo de requisitos específicos de software. Checksums e outros metadados podem não ser totalmente precisos. Sempre verifique a saída, especialmente para aplicações críticas. A detecção do formato de entrada é básica e pode não identificar corretamente todas as variações de um formato. É melhor selecionar explicitamente o formato de entrada.