科创网 关注科创领域的新机会

数据集市和数据仓库的区别和联系

5.说明数据集市与数据仓库的区别与联系,并说明两种数据集市结构的不同之处 

数据集市与数据仓库的主要区别在于范围、主题、数据源、数据粒度、数据结构、历史数据的保留程度以及完成所需的时间等方面

1. 范围:数据仓库是企业级的,能为整个企业各个部门的运作提供决策支持,而数据集市则是部门级的,一般只能为某个局部范围内的管理人员服务。

2. 主题:数据仓库处理整个组织范围内的多个主题域,而数据集市面向单一主题域,如销售、财务、市场等。

3. 数据源:数据仓库需要集成很多操作系统源系统中的数据,而数据集市的数据源可以是操作系统(独立数据集市),也可以是企业级数据仓库(从属数据集市)。

4. 数据粒度:数据仓库存储整个企业内非常详细的数据,而数据集市数据详细程度低一些,包含概要和综合数据多一些。

5. 数据结构:数据仓库通常是规范化结构(3NF),而数据集市一般采用星型模型,雪花模型,或两者混合。

6. 历史数据的保留程度:数据仓库保留全部历史数据,而数据集市较少保留历史数据。

7. 完成所需的时间:由于数据集市的复杂度和需要处理的数据都小于数据仓库,因此更容易建立与维护。

版权说明:文章均为账号作者发布,不代表本网站观点与立场,如有侵权请联系我们删除