|
首页>数据挖掘知识>数据挖掘应用企业> |
数据归档成存储新热点 |
|
Visited times , Welcome to Data Mining Forum & Data Mining Expert |
|
|
数据量的爆炸性增长,让我们不得不更加关心存储。这也造成了目前谈论“数据挖掘”、“知识管理”等话题更容易引起共鸣。现在所说的存储,并非是简单的 “存”和“储”的含义,不是把数据放在角落里就万事大吉的。更重要的是,我们要通过这些数据,进一步产生价值,提升企业业务能力,增加效益。这时候,“存 储”就演变成了更多的其他含义。比如“备份”、“归档”、“数据保护”、“数据挖掘”等等。那么在这些“存储”的替代名词之中,目前哪个是业界谈论最多的 呢?“数据归档”当属其一。为什么这么说?是有充足理由的。 备份归档 即分散又统一 存储网络工业协会(SNIA)是如何解释数据归档的呢?SNIA在《网络存储双语词典》中的解释是——Archive(归档)是指数据集合的一致性拷贝,通常用以长期持久地保存事务或者应用状态记录。一般情况下,归档通常用以审计和分析的目的,而不是用于应用恢复的目的。 上面的解释太术语了,不好理解,那么我们可以用备份和归档作一下对比,因为备份是很多人容易理解的名词。备份和归档都是数据存储的应用形式,只是应用目的不同。 先来看看备份,其实就是对数据进行复制,是为了确保在出现数据丢失或系统灾难时将复制的数据恢复回来。因此备份关注的是业务信息的变化和更新,是短期的存储行为,并且经常被覆盖。比如银行每天要备份交易记录。 根据备份的解释再来看归档就很好理解了。归档是针对“海量数据”的应用,是对数据进行有计划的迁移。当数据停止改变或不被频繁使用时,通过归档把它们转移到别的地方,让出主存储空间,并且使之处于日常的备份窗口之外,既节约了空间,又提升了备份的效率。 那么根据上面的解释,如果再简化来说,那就是“Ctrl+C”和“Ctrl+X”的区别,备份是复制,归档是剪切。当然,这只是为了方便理解的比喻,其实里面的玄机还是很多的。 备份和归档虽有区别但又互相联系。只要涉及到数据归档必然会有数据备份的需求,并且两者都是对存储设备进行操作,因此它们完全可以基于同一技术体系来实 现。所以我们看现在的主流存储厂商推出的都是“数据管理软件”,既能备份,又可以归档,大有“分而合之”之意。目前,备份和归档常常放在一起考虑,统称 BURA (BackUp, Restore, Archive)。两者相似之处都是用复制来保护重要数据不被损坏或丢失。常见的BURA解决方案是D2D2T,就是Backup Disk to Disk, then to Tape。这样满足了对备份速度的要求,也满足了对大容量长保存时间的归档要求,平衡了各方面的需求。 数据挖掘实验室 厂商推出的软件既然如此,那么企业对数据归档与备份的需求也是分不开的。对企业而言,备份和归档具有两种不同但互补的功能:备份用于快速复制和恢复,以减 少故障、人员错误或灾难带来的影响;归档则用于对数据进行有效的管理、保留和长期的访问与检索。企业可以将归档和备份结合起来用,以达到优化成本、改进存 储基础设施的整体效力,使备份能够在有效的归档解决方案下变得更有效率,而归档也可以利用备份基础设施满足数据保护需要。 需求飙升 容量左右应用 随着数据量的爆炸性增长,归档的需求明显增多。IDC在发布《2007年第三季度全球存储软件市场收入》时,其存储软件分析师Michael Margossian曾说到:“整个市场受到归档和数据保护与恢复软件市场强劲需求的推动。企业对备份软件的需求似乎有所降温,对归档软件的需求逐渐抬 头。” 那么对于企业来说,在当前的市场竞争环境中,需要增加数据分析能力以提升竞争力非用“归档”不可。比如我们查询每月电话费,目前只能查到6个月之内的费 用。而一年前的话费呢?并非电信部门将此数据删除了,只是没有让其显示给用户。这些更久远的数据是被“归档”了,但是又可以供电信部门随时查看。当电信部 门需要分析话费,进而推出新业务时,就会从归档数据中调出这些“年代久远”的数据来。国内一家制造领域大型企业CIO的感触也十分“直白”。他认为,“让 数据赚钱,比让数据省钱来的更加有价值。”这也表明了,数据归档比备份来说,更容易帮助企业提升竞争力。
|
| 上一页12 3 下一页 |
|
|
|
[数据挖掘专家]
[数据挖掘研究院]
[数据挖掘论坛]
[数据挖掘实验室]
|
上一篇:How to mine Gold in that Mountain of Web Data
下一篇:数据挖掘技术在舞弊审计中的应用
|
|
|
|