> 文章列表 > 数据仓库与数据建模理论

数据仓库与数据建模理论

数据仓库与数据建模理论

数据仓库的特性:
面向主题 按主题分类
集成 将分散在各个数据库的数据集中到一起
稳定 非实时,一般只做查询
变化 记录历史,反映最近一段时间的变化

数仓分层的意义之一是1.问题定位简化,每层只处理一个简单的问题;

2.中间结果数据,增加复用,减少冗余

3.真实数据与统计数据的解耦

范式建模可以降低数据一致性维护的难度
第一范式:原子性

第二范式:不能有部分函数依赖(部分依赖于主键

第三范式:不能有传递函数依赖

事实表主要有两类字段:一类是事实度量,一类是纬度外键

范式建模的基础上进行一定的冗余,也就是星型模型,雪花模型就是在星型的基础上对维表进行范式,但也不可能变成完全的范式(完全的范式就是关系模型)