google的算法是否真的很快?

今天在用google的时候突然间想到了一个问题,google是不是真的有那么快的搜索速度,或者,它利用了一些我们可能没想到的手段来“欺骗”我们。我现在所能想到是的,由于我们访问网页的限制(每页只能看十个搜索结果),google是否每次只在一个服务器中(听说google用了几千个服务器)搜索我们想要的东西,把这些搜索得到的结果送到我们的服务器上(也就是我们的网页上显示了搜索结果的第一页),而当我们选择了第二页的时候,它再在服务器中继续搜索(可能还是在原来的那个服务器中搜索,也可能是在另一台上搜索了,这要看原来的服务器是否已经搜索完毕)。我这样想,并不是没有什么根据。我们可以看一下,每次得到的搜索结果的个数,都写明是约有多少个,如果真的是在提交搜索请求的时候就把所有可能的网页都搜索出来了,那肯定不可能是大约的数目了。而且,从实现的角度来想(也许我的思想有点幼稚吧),搜索一些常用词得到的结果是很大的,如果把这些结果都记录下来,那么,对于单一的用户来说是可能的,但如果对于成千上万的人来同时访问(和同时搜索),就算有几千台高性能服务器,我想效率也是不高的。或者有人会问,如果搜索的结果只有几个,可以在一页中显示出来,那么这该怎么解释。我认为,对于这一情况,google是有自己的一套做法的。我个人的认为是,google可能认为如果在一台服务器中只有几个命中的记录,那么在其它服务器中的命中记录应该也会只有几个(很多的概率是很小的,除非服务器是分语言来存储记录的,如果是这样做,反而会更好,可以根据搜索词的语言来指定要访问哪些服务器),因此,它只把在一台服务器上得到的命中记录返回给用户,并且指出,可能还有一些其它的符合条件的记录(这个大家应该用看过吧)。如果google真的是这样做的,那我们就不难理解为什么它的搜索速度会这么快了------一个用户同一时刻只会用到一个服务器(大部分情况下)。

数据挖掘论坛


我忘记在哪里看到有人说google是6000多台服务器连起来的,那么,我想,google的访问量还不至于多到每秒6000次吧。这样,在同一时刻把不同的用户分配到不同的机器上去,速度想慢点也难了。
以上这些只是我突然间想到的东西,如果有不同的意见可以讨论一下,不要骂我幼稚就行了。呵呵

[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:九连环答案(程序另文贴出)
下一篇:让我们重视程序运行效率
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • Internet控制信息协议(ICMP)
  • 微软公司软件开发模式简介
  • http1.1
  • TCP协议规范(中文版)
  • linux端口列表
  • 语音识别进入IVR系统
  • Api函数列表——与文件相关
  • RVP:存在和即时消息传送协议(3)
  • Win32环境下动态链接库(DLL)编程原理
  • PPPInternet协议控制协议(中文版)
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • Internet控制信息协议(ICMP)
  • 中文RFC文档远程COM选项(四)
  • Api函数列表——与文件相关
  • RVP:存在和即时消息传送协议(3)
  • 微软公司软件开发模式简介
  • MMXInstructions
  • TCP协议规范(中文版)
  • PPPInternet协议控制协议(中文版)
  • 语音识别进入IVR系统
  • http1.1
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静