不同的数据库采用不同的数据记录格式,但所采用的注释信息内容基本一致。由于加入了大量的注释信息,以上以GenBank为代表介绍的三大核酸数据库、UniProt蛋白数据库的数据格式较复杂,为了分析方便,出现了较为简单的F AST A格式,以方便各种分析软件对序列进行处理。F AST A格式的序列要求以“ > ”开头,接一段对序列的描述文字,再接以文本形式表述的具体的序列如“ A AGT A GC ”(针对核酸序列)或“ MFSLL Y ”(针对蛋白序列)等。因此,在需检索蛋白或基因在不同数据库中的交叉信息时, ......