综上所述,下一代搜索引擎的发展趋势将是智能化的、个性化的。
根据上述分析,我们来看一看目前关于搜索工具的一些观点,回答一些疑问。有一种观点认为“垂直搜索”或者叫做“专业搜索”是未来搜索引擎的发展趋势。这是相对于那些什么都做的通用搜索引擎而言的。对于通用搜索引擎,无论是信息采集、还是信息的更新都是巨大的挑战,将搜索引擎限定在某个领域,有利于做深做精。因此,从经营模式上,有其价值,就象图书馆也有专业的图书馆一样。但是,从技术上讲,并没有多大的新意。
有一种观点认为,下一代搜索引擎应能处理深层网页(DEEP WEB)。所谓深层搜索是指搜索那些放在数据库中的信息。目前的搜索引擎主要处理普通的网页(称为浅层网页),对于深层网页的信息难以搜索,而据说这样的信息是普通网页的500倍。显然,如何能够将搜索引擎的触角深入到数据库里去,是下一代搜索引擎所关心的。但是,这里的技术关键是如何获得数据库中的全部信息,这个技术是信息获取中的一部分,并不能代表下一代搜索引擎的本质。
还有一种观点认为,下一代搜索引擎必须是跨媒体的,也就是说用户通过统一的界面和单一的提问,就能够获得以各种媒体形式存在的语义相似的结果。无疑,这是我们所提到的良好的个性化信息体验中所需要的功能。但是,这一功能的获得,也需要分解成对数据对象的语义标注和个性化的信息展示这两个方面。因此,可以说是包括在我们上面的分析框架中的。 数据挖掘研究院
在本文成文过程中多次与实验室的杨敏和赵峰同学进行了讨论,他们贡献了一些很好的想法和素材,在此表示感谢。(作者:杜小勇/中国人民大学信息学院)

