实施数据挖掘的前提和基础是拥有大量、真实的数据。用于挖掘的数据集通常有两种:数据仓库和数据库。目前,基于数据仓库的数据挖掘被人们看好,它主要有三点优势:1 ﹒数据挖掘必须要对数据进行抽取、清洗、转换和装载,该过程很耗时,而数据放入数据仓库时都做过上述工作,使用数据仓库就能避免挖掘时每次对数据进行操作。由于数据挖掘项目投入巨大,与需求关联极强,这种风险在数据挖掘项目中表现的尤为明显,必须按照软件工程的方法进行开发,做到需求描述清楚、理解正确才能使项目有基本保证,盲目的数据挖掘很难成功。运用目前的数据挖掘理论 ......