RSS
热门关键字:  数据挖掘  数据仓库  商业智能  人工智能  搜索引擎

IBM DB2 9新闻发布会:圆桌论坛纪实一

来源: 作者:unkonwn 时间:2004-12-18 点击:

六位在数据库领域里面的专家来一起共同对XML,对数据库的发展历史,以及对DB2 9的特性进行深入和全面的探讨,让我们有请中科院数学与系统研究员周龙骧教授,陈宏教授,中国金融电子架构师朱杰先生,还有郑妙勤女士,王云先生,还有王敏女士,还有IBM大中华区商业智能总监吴丕德先生主持

吴丕德: 大家下午好,现在我们进行一个圆桌论坛,我们刚才从领导们的谈话里面,听到刘经理介绍了XML,我相信媒体界的朋友,因为不做IT业可能不是很了解,现在请各位专家发表一下大家的看法,首先请周教授用简单扼要的语言谈谈什么是XML,为什么现在大家都在谈,为什么数据库都要支持XML。

周教授:这个是几个词组的缩写,我们知道语言是交流的工具,人和人之间是自然语言交流,人和计算机,计算机和计算机也要通过一种语言进行交流和理解,我们过去知道的几种语言,就是把计算的东西交给计算机进行计算,计算机就能够理解这种语言。我们现在的XML语言是一种新型的语言,它为什么现在变得大家都很关心和需要它,一个重要的原因就是现在我们已经进入了因特网的时代,这个时代人和人之间,企业和企业之间的交流是非常的频繁的,在这个交流当中,就需要有一个语言载体进行描述。XML语言正好是符合这样的要求,但是这个语言,这几年发展得非常快,前身是STXML语言,比这个语言要复杂得多,如果一个语言太复杂也不行,大家不能接受,现在一个简化的版本就是XML,正好符合现在时代的潮流和需求。

它特别适合于描述我们常见的一些现象,我们知道我们常见的现象,最直观的就是树型的结构,比如我国,中华人民共和国下面有各个省,省下面还有省会,就是这样的结构,这个结构如果用关系来描述的话,就不容易表述出来一层一层的结构,但是用XML语言就非常的方便,就是中国下面分开29个省,再有省会和县市,就非常的方便了,如果用这样的语言在计算机之间进行交流和传输就非常的容易,这就是符合新潮流,因特网时代的语言。

吴丕德:下面问王云院士,现在很多厂商都在提出他们的数据库都支持XML,包括我们IBM都支持XML。能否从你的观点谈一下IBM和其他厂商有什么不一样,纯XML“纯”的角度怎样来了解。

王云:要讲纯PURE有很多解释方法,如果用浪漫的方法解释,中国字很有意思,有很多纯,今天我们发布会是DB2 9,这个DB2 9是什么意思,我们9可以是数字的9,也可以说DB2 版本是一瓶好酒,要经过很长时间酝酿培殖出来,真正使酒发出香味的是酒很香醇扑鼻,就是酒很醇。什么是XML,就是在DB2 里面发挥香醇味道的就是XML,这个就是纯XML。这个是比较搞笑的,什么是PUREXML,我们不仅在IBM,我们有一个早期的一个提供,在数据库的层次提供一个XML功能,我们叫做XML EXTENDER,我们说在关系型数据库。我们在五六年前,是我们当年在IBM的DB2 里面,就是郑妙勤带队做出来的,第一个版本支持的做出来的,这样的一个技术,除了IBM在做,我们在数据库其他行业也用同样的技术来做这个事情。做这个事情怎么好有一比,就是说层次型的数据库,刚周教授讲的是树状结构一样,一层一层,上面一层叫做父亲也好,母亲也好,下面有很多子女,像中华人民共和国下面有很多省、市和乡镇,是父亲和母亲的关系,是一个树状结构,树就是要爬,要爬上爬下的。这样的树状结构,我们怎样存起来,要用第二个方式来回答你,什么是存数据库,怎么是储存一个数据库。

我们说集就是结合在一起,离就是分开来,我们用一个复杂的数据结构,不仅要爬来爬去,我们还要知道怎样存起来,现在要用关系型数据库进行提升的时候,要做一个集,就是用一个大对象,大框框把东西放在一起。离就是分成很多小的,分散来存。在处理XML的时候集也不好,离也不好,集在一起,每一次要处理的时候,看到的是一大堆东西,如果分得很散,要接来接去。IBM基于四十年前开发出来的层次型的数据库,我们用了非常经济有效的方式,处理若即若离的庞大的树状的结构,不仅可以打散分开来做,这个方式是我们把当年我们做IMS的树层结构的经验做更高的优化,再从另一个角度解释PURE,需要爬上爬下,怎样用一个更加经济有效的方法处理,不是用传统的关系型的方式串在一起,这就是说女士的裙子一样,有长的有短的,长的短的都需要,不能混为一谈。这个是把一个复杂的结构结合起来,就是说什么是纯数据库,就是说IBM当年处理树状的结构,用四十年的经验做了一个优化,经过多年酝酿而出来的好酒,一个醇香的酒。这个是IBM从基本的角度来解决XML的存储和应用问题的方案。

吴丕德:谢谢王云,他跟我是20年的朋友,我们都是做技术的,我个人给各位讲一下,我在IBM做了这么多年的工作,王云是我认为的第一把交椅,因为我非常的了解他,我知道他讲的都是真的,绝对没有一点吹牛的概念。包括私人的信息都是真的。谢谢。

下面问人民大学的陈教授,请您从您的角度谈谈数据库的概念

陈宏:这个数据的存储和管理已经是不可回避的问题了,现在解决方案主要是两种,一种是纯XML,还有“内T”XML。是一个量身定做的数据库,可以利用数据库的特征,比如自描述性和结构,这个是很好的方法,但是是一个挑战性的问题,因为是新的数据模型,它的模型是什么样,他的存储怎样存,数据管理等一套问题需要解决。因为关系系统很成熟,可以用成熟的技术,很多应用是放在关系里面,这样做可以继承现在有的数据,可以和现有的应用做集成,但是现在这个方法,XML的数据存储是两种,一般是这几种都提供,一种是一大堆项目,以文件的方式来村,一种是转成关系表的方式来存,不管哪种,存储和查询,都会经过很多复杂的转换,这种转换必然会影响到应用的效率,这是一个平瓶颈的问题。今天听DB2 9的讲解,给我感觉IBM可以比较好的融合了XML的数据管理,我想DB2 9的推出是否可以说能够更方便XML的数据管理,能够提高这种基于XML数据的效率呢?

王云:我们做存储的时候,我们不把XML转换成关系型,我们是根据数据模型做的,我们和NOTE的关系,就是父亲到儿子的关系,我们用各种不同的方式。

郑妙勤:一个数据库无论哪个数据库,你自己管理一个数据库就可以了,我觉得这个是一个创新的意见。

吴丕德:我们感觉到DB2 9的发布,已经开始了在市场上面的这种活动,我们现在就开始了这个交流,从学术界和技术本身的角度,听了几位专家的谈话,我们想听听用户的角度,应用的角度来谈一下,我们请到了朱杰先生,是中国金融电子化公司的资深的技术架构师,从您的角度看看,您使用XML已经相当一段时间了,从XML的角度谈,你碰到什么问题。你知道了这些技术能够在什么地方应用,或者给你提供有帮助的地方?

朱杰:在金融行业的标准被越来越广泛的使用,金融行业之间,金融行业和其他行业之间进行数据交换的时候,都采用XML格式进行数据的交换,就像几年前我相信做应用开发的人都知道,我们在做系统架构的时候,经常会考虑是不是要采用J2EE。XML的标准也是一样的,今天我们不会讨论数据交换是不是需要什么,我们数据库平台不同的应用部门进行数据的交换。另外它有很好的扩展性,我的数据变化的时候,我们只进行一个调整就可以了,我相信在金融行业里面,随着各个系统之间的数据共享的需要越来越迫切,XML的标准一定会越来越广泛的使用,这是对目前同行业标准的一个概括。

另外一个具体的情况,就是我们进行数据处理的时候碰到什么样的困难。我觉得传统的做应用开发的时候,经常从三个角度考虑问题,首先我们会用XML进行数据的交换,其次我们做系统开发的时候从开发对象的思想,面向服务的思想,第三种进行数据存储的时候,我相信很多系统开发商会用关系型数据存储,在这三个角度考虑问题的时候,我们在数据获取的时候,我们要把数据进行转换,转换成对象数据,因为我们是银行对象的数据。第二种还要转换成关系型的数据,因此我们在做传统数据开发的时候要进行两次转换最终进行存储。但是数据可以存进去,数据还要被我们使用,使用数据的时候我们还是要进行两次转换,把关系型转换成对象数据,再转换成我们要使用的数据,这样我们使用数据转换的时候是非常麻烦的,大部分时间浪费在数据转换上,现在有一些很好的技术进行数据的存储和访问了,但是这些也是非常繁锁的,因此我们说简化数据存储的过程是非常重要的。

我使用的DB2 9版本,它在简化数据存储方面还是非常好的,非常大的减少了我们的工作量。

吴丕德:IBM我们进行四十年的信息管理工作,经历了层次型、关系型一直到今天,在座各位经历了30年,都是跟数据管理有关的工作,请大家谈一下自己的看法。

郑妙勤:我们在网上看到IBM员工,有一个49年,有一个47年,我们是经过了47年,我现在还是29年都是蛮容幸的,我们有一位同事已经做了41年,我讲一个印象深刻的事情。我1977年就是做DB2的开发的,1983年做的,1980天已经做完了。和我们很多客户一起来弄的,我们第一个客户是ATNT,美国一个很大的电信公司,他用我们DB2 ,他以前的应用都是ABO的语言,你们都不知道ABO是什么语言的,他们说他们从来都没有想过应用很方便的方法,他们以前所有的设计都不能与应用分开的,他们用了DB2 之后,觉得这个非常的快,他们非常的高兴。我也很高兴,因为第一个产品人家用了9个小时,都没有卖就上市了,还是很开心的。

吴丕德:谢谢您。她跟我们分享了早期DB2 开发的经验,下面请王敏女士谈谈个人在最新的DB2 版本开发的经验,王敏是IBM在纽约华生研究中心的人员,参与了DB2 9的研发。

王敏:我讲一下我在DB2 9是年轻一员,我在研究中心已经七年,做真正的产品开发是第一次,我是02年底,03年负责这个工作,做其中优化的部分。我做博士论文的时候,DB2 都是四十年创新的结晶,作为一个研究人员有一个观念,创新的结晶都是从研究出现,从研究转换成产品需要时空的距离,这个距离有多长,从我的经年看往往很长,有的时候是永远不会发生,永远是一个研究结果,永远不会转换成产品,因为有种种的原因,有这样的观念,参加了DB2 9的研发团队,有一件事改变了我的观念。

他们做随机取样的方法,我的一个导师也有这样的想法,我读他了文章之后,觉得这个文章很好,喜欢他风格才找的他。我想把的想法实现出来,放到DB2 9当中,我想多长时间可以实现好,好在我谈这个想法的时候,跟我们团队的人说我要把这个想法实现,他们说你为什么要实现这个算法,说他们早就有,后来我查的时候,我的导师拿到PHD的时候,做教授的时候,IBM给了他一个扶植年轻教授的奖学金,他拿到这个其中一个工作就是叫水库算法的,他出现不久下面就拿过来了,我只是拿过来用一下就好了,我非常的兴奋,那个写代码的年代和发表文章的年代没有很久。这就是说,只要我们每个人有一个做产品的超前的观念,很多研究的结果是可以很快的转换到产品服务领域的。

吴丕德:IBM的人讲了很多精彩的故事,我们再次把谈话的话题回到我们客人的方面,请教周教授,从你的角度谈谈您什么时候接触IBM,对IBM的数据库和信息管理的一些看法。

周教授:从我个人来说还是对IBM有非常好的印象的,因为IBM的百年老店,一直是创新的前沿,而且在眼光方面比较远大,最基本的研究也关心,也投资了。和计算机不搭边的低温超导也搞了,就是说她有很长远的眼光。我和IBM接触还是比较早的,在34年前,我刚刚搞软件,那时候中国还在搞文化大革命,信息是很少的,我原来是搞数学的,后来搞理论物理,那个时候改行搞软件,开始搞编程语言,在中国自己设计发明了一种语言,我们72年的时候买了一台国产的计算机,内存只有几十K,但是价钱非常的贵。

那个时候得到了资料是照相照下来的,是IBM刚刚搞出来的语言,我那个时候,就是在72年的时候把这个语言翻译出来,在华北一个杂志上发表了。后来又写了一本书,就是怎样理解这个语言,这是从程序设计语言来说和IBM的接触。

后来76年改行搞数据库,我自己设计开发了一个层次型数据库,那可能是中国第一个了。那时候还不知道IBM有IMS,那个时候是70年代比较早的,后来我开发的数据库都是关系型的了。

吴丕德:我97年到中国就认识了周教授,非常的敬佩您,请教您很多问题,我之前也做过一些语言开发的经历,原来周教授也有这样的经历。下面把同样的问题请教陈教授,你对IBM技术上面有一些什么样的看法?

陈宏:我想IBM从60年代的第一个数据库产品,层次数据库IMS,到70年代EFCODD关系数据库的提出。还有关于DB2 市场的方面,

周教授:我们现在会开很多数据库方面的会议,第一届是在黄山开的,另外一个重要的内容就是我们中国的数据库界元老,撒老师就是报告EFCODD的文章。

数据挖掘研究院

IPTV:关注IPTV;报道技术;应用;方案
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?