数据仓库和数据挖掘是两个比较大的概念,在国外已经非常成熟,在国内随着前几年企业数据的累计、ERP的成熟,数据仓库和数据挖掘开始起步。 数据挖掘研究院
如何建立数据仓库和数据挖掘是个不断值得探讨和优化的问题,不仅仅在技术上,在商业应用上也是如此。随着新的技术和观念的不断引入,传统的数据仓库技术方法有了很大的改变,基于数据仓库的应用也有了新的发展。每个企业的数据仓库根据企业特点不同,可以采用非常灵活的选型方法进行选型设计、实施。本文根据一些比较新的技术特点,谈谈数据仓库和数据挖掘的架构。
从成熟的数据仓库架构入手来看,建立EDW(Enterprise Data Warehouse)是个比较好的选择。EDW是企业数据仓库,对整个企业数据有一个完整的不冗余的保留关键历史变化信息的唯一视图。基于EDW可以建立不同主题的数据集市Data Mart,数据集市不同的企业有不同的要求,基本上可以分用户主题,业务流主题,产品主题等等,在EDW的基础上可以有非常多的主题应用,如何建立EDW 是个比较重要的问题。

