Sybase的IWS等。 这些行业数据仓库解决方案是众多业务专家和数据仓库技术专家合作开发,并经过大量实践检验的完整的解决方案,汲取了多年来众多数据仓库项目的成功经验和失 败教训,是智慧的结晶。采用这些成熟的解决方案,将使企业从一个很高的起点开始,以最短的时间、最低的成本和最小的风险构建数据仓库,使企业赢得最大的投 资回报。 数据挖掘工具
标准化建设要先行
数 据仓库建设,标准化要先行。标准化,对数据仓库来说,最重要是指标标准化。目前,在国内的保险公司内,“数出多门”的现象仍大量存在。公司的各个部门从自 己的职责出发,给同样的指标赋予了不同的统计口径,例如保费收入指标,销售部门多倾向于按签单日期统计,而财务部更多是按实收日期统计等,这样往往引起管 理上的歧义,影响数据的使用。标准化就是要消除这种歧义,消除同一指标在不同系统、不同部门之间的不一致性,在企业范围内建立统一一致的数据,一个指标只 能有一种解释,一个核算口径。 数据挖掘论坛
中国保监会已于2006年启动了行业标准化建设,并于2006年年底颁布了《保险术语》标准,并将于2007年下半年颁布标准化的业务、财务指标集,在建设数据仓库时,要充分利用并严格执行这些标准。 数据挖掘实验室
要坚持对数据质量的改进
数据质量是数据的生命,只有高质量的数据才能发挥出数据的价值,低质量的数据会使管理者做出错误的决策,正如谚语所说:“Garbage in, Garbage out” (进去的是垃圾,出来的也是垃圾)。现阶段,保险行业的数据质量不够理想。造成数据质量不高的原因有很多,例如业务流程不规范、核心业务系统技术缺陷、人 为操作疏忽、数据补录、手工数据未上机、核算口径不统一等。这些低质量的数据不能真实的反映业务情况,严重影响系统的推广使用。 数据挖掘实验室
对 此需要优先开发用于数据质量控制的模块,根据数据探察规则发现数据质量问题,对数据质量的偏离程度进行估算和展示,对超过预订范围的予以警示,由此促进在 流程、规范等各个方面的改进,逐步提升数据质量。数据仓库应与核心业务系统等生产型系统形成良性的互动,一方面核心业务系统等生产型系统是数据仓库的数据 源,另一方面,数据仓库暴露出的数据质量问题应能反馈到生产型系统中去,促进生产型系统流程的改进,提升数据质量。数据质量的提升是一个长期的过程,应贯 穿数据仓库系统建设的始终。 数据挖掘论坛
整体规划,分步实施
|