高级搜索
|
实验室
网站地图
|
About
数据挖掘
数据挖掘厂商与产品
数据挖掘论坛
相关研究方向
书籍代码下载
人工智能
编程技术
电脑常识
互联网资源
智能模糊搜索
仅搜索标题
热门关键字:
数据挖掘
数据仓库
人工智能
数据挖掘导论
搜索引擎
首页
>
人工智能
>
搜索引擎技术与新闻
>
数据之美 百度GOOGLE统计的秘密
Visited times , Welcome to
Data Mining Forum
&
Data Mining Expert
3年以前,一个统计分析领域的专家曾经告诉笔者,GOOGLE和百度,在技术上足够做到分析你是一个男人还是一个女的,当时听起来感觉几乎不可能的事情。
07年在搜索引擎研究领域出现过一张并不是很清晰的Google和百度的鼠标点击热图(如下),图的出处未知,让笔者很是惊讶,从图中可以看出 Google和百度用户行为的显著区别,也可以看出在这两个搜索引擎中排名网站的流量分配的大概情况。甚至,笔者联想到如果统计了用户鼠标行为的轨迹分 析,足够分析访问百度和Google用户群体的人口统计学方面的信息,比如:访客的性别、年纪等等。笔者所在的公司一直致力于数据挖掘课题的研究,深知如 果一定程度上对用户鼠标行为进行分析的话,只要找到准确的算法,是可以很明显的分辨出男性和女性在浏览同一个网页时所表现出的不同的习惯特征。这是所有基 于数据行为做识别的人的共识。
百度和GOOGLE在互联网上,具备绝对的优势,他们甚至可以统计和分析用户的鼠标行为特点(如上图)。对于普通的站长,很明显,这些前沿的统计数据 几乎无法从传统统计器中获得,捕捉到用户在某网页上的点击事件也许并不是一个很难的事情,但是如果是要获得用户的鼠标点击热区以及鼠标在页面上滑动的轨 迹,就不是件容易的事情了,尤其是对用户鼠标滑动轨迹的分析,这个更不是一般的统计系统可以做到的,这些滑动轨迹几乎是一个天文数据,分析这些需要极其强 大的计算能力,并非国内一个个人统计系统计算能力可以达到的。
数据挖掘工具
目前国内的统计市场,新的入伙人有百度、雅虎,还有一个一直在中国统计器市场名不见声响的GOOGLE,这些巨无霸也都试图瓜分这个市场,他们的意图 很明显,建立一个服务于自己的体系,同时利用庞大的个人站点获取大量的用户行为特征。传统的个人网站统计,目前也是三分天下。但是笔者无意中看到的一张 图,让笔者不得不再次审视这个似乎已经各自为政,三分天下的统计领域。
下图是笔者无意中获得的一张用户行为分析图,竟然是国内某家并不知名的小个人站点上的数据,笔者在这个小小的美女图片站上发现了一行陌生的统计代码, 这个代码的链接很明显的反应出另一个似乎也是统计类的站点,但是很郁闷的是,笔者顺着这个链接,并没有找到这个站点的任何资料,似乎这个站点刻意的隐藏了 自己。出于本身的职业习惯,后来笔者找到了这个小站站长的QQ,后来在和这个美女图片的个人站长交流中才知道,中国科学院下面的一个庞大的技术团队正在试 图将他们手上的数据分析技术平民化,他们测试使用的域名正是这行统计代码中的域名。后来,征得该站长的同意,笔者将一些该站数据截图显示如下:
访客性别分布、访客年纪分布、访客人均收入分析、访客鼠标热区图:
数据挖掘交友
上一页
1
2
下一页
[
数据挖掘专家
]
[
数据挖掘研究院
]
[
数据挖掘论坛
]
[
数据挖掘实验室
]
上一篇:
Google趋势功能更新
下一篇:
如何做好一个垂直的搜索引擎
最新评论
共有 0 位网友发表了评论 ,
查看所有评论
发表评论
( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航
数据挖掘论坛导航
数据挖掘工具
数据挖掘论坛
DataCruncher
-
Cognos
MineSet
-
MathSoft
Intelligent Miner
-
GainSmarts
Sqlserver
-
SAS
-
Clementine
CART
-
Weka
-
WizSoft
NeuroShell
-
ModelQuest
data mining tools
-
Darwin
数据挖掘交友
数据挖掘博客
数据挖掘工具
数据挖掘资源
数据挖掘技术算法
数据挖掘相关期刊、会议
研究院联盟合作专区
数据挖掘基础与相关技术
数据挖掘厂商与就业
数据挖掘研究者乐园
知名厂商数据挖掘工具资料
国内数据挖掘实验室
Foreign Data Mining Lab
热点关注
Mercator: A Scalable, Extensible Web Cra
什么是垂直搜索引擎(之二)
Writing a web crawler
互联网搜索的未来
国家版权局版权司副司长许超:关于搜索引擎
百度数分钟内闪电裁员 企业软件事业部遭抛
我对垂直搜索引擎的几点认识
Google Patent Filings by the Dozen
Manageability - Open Source Web Crawlers
微软卡位第三代搜索技术 认为Google将很快
论坛最新话题
Foundations of Statistical Natural Langu
Game Theory meet Data Mining: A Recent P
System Building: How does it help or hin
数据挖掘与Clementine培训
新手报到
求 SASEM 客户流失预测分析
数据挖掘工程师/搜索研究院—北京——无线
数据挖掘入门介绍(如何着手数据挖掘)
Information Overload Survey Results
The INEX 2005 Workshop on Element Retrie
相关资讯
谷歌宣布进军可替代能源 计划投资4.4万亿美
搜索大战成Web 2.0操作系统之争
7月美国搜索市场环比增长2% 雅虎微软成输家
网页面向搜索引擎的搜索引擎优化
史上最具技术创新的10大搜索引擎
Google如何预测下一届美国总统
微软1亿美元收购语义搜索引擎Powerset
很黄很暴力:人肉搜索引擎
OpenSocial只不过是Google公关骗局
数据之美 百度GOOGLE统计的秘密
数据挖掘实验室资料
数据挖掘博客地址
数据挖掘实验室网站地址
Prepare for Medicare audits by using dat
注册成为SAS用户与爱好者俱乐部会员
水南梅
明日烟
新人报道
下载
厦门服务器托管,450元/月—0592-5177319 高
买空间送域名--0592-5177319 高静