微软BI开拓者

首页 » 数据仓库专区 » ETCL设计 » 关于构建数据仓库时的几个疑问?
ok8209 - 2008-3-4 22:12:00
例:
D1维度表(有100条记录)
D2维度表(有10万条件记录)
D3维度表(有8万条记录,类型2渐变维度)
F1事实表(3000万条记录,增量更新)

总结了如下几个问题:

1、关于维度表和事实表的主、外键的困惑,在“开发调试>载入历史数据>正式运行”三个环节中,分别是如何使用的?是否从开始就全部建立并启用主外键约束,还是在正式运行时才启用呢?

2、D2表的数据量很大,除了代理键的唯一聚簇索引外,我是否有必要建立其它非聚簇索引?

3、D3表属于“类型2渐变维度”,请问该如何建立相关索引?和D2表有区别吗?

4、对于F1事实表,实际使用时需要建立哪些索引?是否经常在对应维度表的外键列上建立单列索引?会用到“唯一”、“聚簇”形式的多列组合索引吗?

5、F1事实表通常有没有建立主键的必要?

工作之余看了一些资料,越看越糊涂,请有实战经验的老师指导一直,万分感谢。
tiandehui - 2008-4-6 21:41:00
顶一下。。。望高人指点。。。
zxhx - 2008-4-8 14:43:00
对于“F1事实表通常有没有建立主键的必要?”:
建立主键对于多维数据集的处理效率会更高一些,这些Kimball都有说法,至于直接从数据仓库出报表,更需要一个主键了。
zxhx - 2008-4-8 14:51:00
对于问题4:这里建索引的原则与常见的数据库建索引原则并没有两样。
对于问题3:渐变维处理似乎不需要建索引,但要指定键,所以感觉可以认为是系统自动索引,不知道是否真实如此,哪位熟悉渐变维组件内部原理的达人希望能解答一下。
对于问题2:建不建索引看需求,如果从cube出东西,貌似没必要。直接从dw出,则要看用到哪些。
1
查看完整版本: 关于构建数据仓库时的几个疑问?