特定物种(或组织)的EST序列代表了随机取样地各种转录产物mRNA,因此可能会有多个EST代表同一个转录产物。通过EST数据聚类分析,可以将代表同一个转录产物的EST序列归为一类,然后使用序列拼接程序装配成更长的、更高质量的序列,同时也减少了EST的冗余。经聚类和装配得到的唯一序列(unique sequence),代表了对所研究的物种(组织)在某一特定时间所表达的基因的随机采样的结果。为了寻找EST序列或基因序列在其他物种中的同源序列,可以通过序列比对的方法,利用序列比对工具如BLAST,在相应物种的数 ......