数据挖掘与传统医学统计学的区别在于,后者是由用户驱动的,由研究人员事先确定一些假设,并用医学统计学方法去验证这些假设。例如,研究人员对高血压的危险因素进行研究,如若事先假设了影响高血压的危险因素,则可以用医学统计学以各种方式验证或反验证各种关于其危险因素的假设。而数据挖掘则可用来发现可能影响高血压的危险因素,还可能会发现一种与传统理论模型相异的模式,需要研究人员进行进一步验证。数据挖掘能处理数据量增长迅速的情况。 ......