在前面提到过的神经系统网络实例中,很明显,在一组训练数据中产生并表现良好的方法,当运用另一组数据时可能不会表现得很好。因此,就需要数据“确认”(测试装置)来评价在现实生活中,分类器将会表现得怎样。计算机强化的统计方法,比如交叉确认、折刀切割法或引导法,都是有效的和被推荐的评价方法,这些方法能够克服小样本数据固有的一些局限性,都是以重复抽样理论为基础,并且具有所有标本都可用于训练和测试的优势。以重复抽样理论为基础的确认方法模仿了从未被观察群体中重复抽样的理论过程。除非被观察的群体就是有代表性的,否则概括生成 ......