权威医学专著速查系统

三、数据泛化

数据泛化的方法较多,常用且比较有效的方法有数据立方体、面向属性的归纳等。事实表组成数据立方体中度量值,维度组成数据立方体维度,也是进一步泛化数据立方体的依据。紧凑型数据立方体,如condensed cube和quotient cube,利用元组共享原理只实例化数据立方体视图中的某些元组,对稀疏数据(实际应用中,多数都是稀疏数据)形成的数据立方体有很高的压缩比,不需要实时计算,但响应时间比较长。然而,若属性泛化过高,则概念会过于泛化,若属性泛化过低,则概念会泛化不足。通常,运用各种统计图表,如交叉表、饼状图 ......

——《卫生统计方法与应用进展 第2卷》
书名:《卫生统计方法与应用进展 第2卷》
栏目:卫生统计方法与应用进展 第2卷 > 第九章 数据挖掘技术及其应用 > 第二节 概念描述
作者:饶克勤
参编:
页码:230-232
版本:1
出版社:人民卫生出版社
出版时间:2007-12-01
© 2015-2019 天山医学院 XiaBBY#VIP.QQ.COM