RSS
热门关键字:  数据挖掘  人工智能  数据仓库  搜索引擎  数据挖掘导论

互联网搜索的未来

来源: 作者:unkonwn 时间:2004-11-21 点击:

点击放大 数据挖掘研究院


Andrei认为互联网的搜索发展可以分成四个阶段。第一个阶段是1994年到1997年,当时的搜索引擎都采用的是传统信息检索方法,只使用网页自身带有的文字信息(例如:词出现的频率,网页内容的语言等),比较典型的搜索引擎包括Altavista、Excite、Lycos等。1998年后,进入第二个阶段,搜索引擎开始大量采用网页之外的信息,包括各种超链分析算法、用户点击的跟踪和链接文字(Anchor Text)的应用等,该阶段搜索引擎代表是Google和Inktomi。目前我们正处在第三个阶段,搜索引擎开始关注用户查询词背后的需求,而不再是查询词本身,这包括语义的分析,相关内容的整合,对用户的查询提供更多帮助(例如:友好的界面、拼写纠错、相关搜索、搜索提示等)。2000年,在《互联网搜索的分类》这篇论文中,Andrei在分析后把人们上网搜索的需求分成三类:对信息的需求(例如:找新闻、找评论、找帖子等)、对导航的需求(找某个特定网站)和对交易的需求(例如:下载软件、在线购物、订机票等)。第三代搜索引擎必须根据用户的需求,进行结果的优化,比较典型的例子是雅虎快捷展现(Yahoo Shortcuts)。例如:搜索“北京 天气”时,除相关网页搜索结果外,还会显示当前北京的天气情况。 数据挖掘实验室

点击放大 数据挖掘研究院


第三代搜索引擎大量利用与时空相关的Context信息,如:地理位置、查询历史、个人档案等。通过对这些相关信息的利用,可帮助筛选出不合适的结果,结果的排序可以更加个性化。随着Context信息的不断发展,Andrei认为到第四代搜索引擎后,用户的搜索将不在需要他们输入查询词,而是搜索引擎可以根据用户的行为和Context信息,主动进行信息的推送(Information Supply)。

上一篇:没有了
下一篇:Writing a web crawler
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
匿名?