文本挖掘是指应用计算机算法和程序对自然语言进行分析和处理,是生物信息学领域中常用的技术之一。文本挖掘的方法多种多样,包括基因/蛋白质功能预测在内的数据挖掘均属于文本挖掘范畴,而这里的文本挖掘主要指文献挖掘方法,是从共线文献上反映研究之间的关联强度的数据挖掘技术方法。这10个基因包括4个抑癌基因(p53、BRCA1、BRCA2和TSC1)、2个癌基因(ERBB2和BCL2)、1个P糖蛋白关联基因(AFP)、1个凋亡关联基因(PTPRC)和2个其他基因(CEACAM5和MUC16),据文献报道。文本挖掘的应用 ......