Skip to content

Article image
序列格式转换器

使用此多功能转换器在不同的生物信息学格式之间转换您的 DNA 或氨基酸序列。

如何使用

  1. 在输入区域中输入您的 DNA 或氨基酸序列。
  2. 在相应的输入字段中输入序列名称、描述和登录号(如果适用)。
  3. 从下拉菜单中选择输入格式。
  4. 从下拉菜单中选择所需的输出格式。
  5. 单击“转换”按钮。
  6. 转换后的序列将显示在输出区域中。
  7. 单击“下载”按钮将转换后的序列保存到文件中。文件扩展名将根据所选的输出格式自动确定。

支持的格式

此转换器支持以下序列格式:

  • **FASTA:**一种表示核苷酸或氨基酸序列的简单文本格式。FASTA 格式的序列以单行描述开头,后跟序列数据行。描述行必须以大于号(“>”)符号开头。
  • **EMBL:**一种用于存储核苷酸序列数据的综合格式。EMBL 格式文件可以包含多个序列,每个序列都有详细注释。序列数据前面是 ID、AC、DE 和 SQ 行,序列本身通常分成 60 个字符的行。序列以“//”结尾。
  • **GCG:**遗传学计算机组 (GCG) 软件包使用的格式。GCG 格式文件通常包含带有注释的单个序列。序列的开始由以两个点(“..”)字符结尾的行标记。
  • **GenBank:**一种广泛用于存储核苷酸和氨基酸序列数据的格式。与 EMBL 类似,GenBank 文件可以包含多个带有注释的序列。序列以“ORIGIN”关键字开始,以“//”结尾。
  • **IG/Stanford:**综合遗传学 (IG) 软件使用的格式。IG 格式文件可以包含多个序列,每个序列都有注释(以“;”开头的行)、名称行和序列本身,以“1”(线性)或“2”(循环)结尾。
  • **Plain/Raw:**一种仅包含序列字符(IUPAC 字符和空格)的简单格式。不包含任何标题或注释。纯序列文件可能只包含一个序列。
  • **Pretty:**序列经过格式化以提高可读性,通常每 10 个字符添加一个空格。

**注意:**此转换器提供基本的格式转换。对于更高级的序列数据操作或分析,建议使用专门的生物信息学工具。某些格式(如 GCG)的格式可能需要根据特定软件要求进一步调整。校验和和其他元数据可能不完全准确。务必仔细检查输出,尤其是对于关键应用程序。输入格式检测是基本的,可能无法正确识别格式的所有变体。最好明确选择输入格式。