关键词的选择是搜索的最关键


搜索引擎我已经讲过了,google,百度等是精品,也许大家都不难选择,但同一个引擎,不同人会搜索出不同结果,而且甚至差别很大。尤其体现在那些具有专业性质的东西中,其中的奥秘是什么?    关键词!这是唯一的秘密!关键词要求“精”“准”“具有代表性”。具有代表性,则保证相关页面尽量少被漏搜,而精与准要求保证搜索的东西有用,要少,便于阅读。我谈一下我自己的体会。    例如搜索一篇文章,是英文的,但不是免费的。那么首先了解这篇文章可能会出现在哪些地方? 1 该杂志网站内,搜索出的成功率几乎为0,因为需要收费,因而这应该将这方面排除出去! 2 该作者的个人主页上。因为老外的版权意识很强。一篇文章是出版社和作者共同拥有版权,因而该作者有权将它放到个人主页上,这是一个搜索重点! 3 某些专业网站、医药公司等为了收录一些全文文献以吸引人,那么这篇文章可能被收录,这也是需考虑的方面之一。 4 数据库中。专业数据库文献,这是最大重点。 下面便根据以上特点,针对性进行处理。 1 如何找到某一非免费数据库文献? 最好的方法是得到password! 于是采用google。那么密码会出现哪些地方呢?这又需进一步分析: (1)各大学的图书馆内。不过一般欧美人意识强,密码不易得到,而中日韩、及拉美的国家密码易于公布,这是搜索重点,正如国内的清华的东西,永远不要想,如elsevier,有IP限制的。但其它学校,尤其是一些小学校则往往公开密码。那么图书馆内一般会出现什么关键词?电子资源(e-source)、library、free、trial、database(有时可用某一具体数据库名称),这是我发现的一些通用关键词。在搜索时可适当加用。 (2)个人帐号。一般多保存在一些新闻组中(个人透漏)、个人不慎公开的地方,尤其是ftp!往往是某些人用来保存个人帐号的地方,但搜索一般应用paswd,或password,readme,notice,而不用其它词,但readme不具有特征性,应排除。但它必有关键user name password,以及杂志的全名!而不会出现sign in, forget, forgot!这类忘记密码或提示性的词。 通过这两种方法,即一是在新闻组中搜索、二是在普通搜索,三是ftp搜索,可用lycos的ftp搜索引擎,你会惊奇的。具有关键词不必讲了吧。要加入user name password database free,排除sign in forget forgot(采用减号)找图书馆中的密码(注意google语言一定要设置成多语言)。ftp则用paswd等试试。 2 那么如何找到个人主页和公司中的文章呢? 这主要用于搜索某一篇文章,而不搜索杂志的密码。 分析如下:这些文章一般都用PDF格式,这是关键!同时将这篇文章名称中的关键字列出(总共不必超过10个)。然而必须排除这篇文章被其它文章引用的情况!如何排除?我目前还没有高招! 具体格式如下:关键字(最好5个) filetype:PDF 瞧,如何? 3 还有一种方法,我试了一下,还可以有时能成功,即利用google强大的探索功能,为我们找某篇文章! 方法输入一个或两个关键词,然后在google中搜索其站点,及PDF文件,具体格式如下: 如在Nature 中找有关neuron文章,方法如下: neuron site:www.nature.com filetype:PDF,能找到不少。这种方法还不成熟。
[数据挖掘专家] [数据挖掘研究院] [数据挖掘论坛] [数据挖掘实验室]
上一篇:关键词的选择是搜索的最关键
下一篇:关键词的运用技巧
最新评论共有 0 位网友发表了评论 , 查看所有评论
发表评论( 不能超过250字,需审核,请自觉遵守互联网相关政策法规。 )
匿名?
数据挖掘网站导航 数据挖掘论坛导航
  • 数据挖掘工具
  • 数据挖掘论坛
  • DataCruncher - Cognos
  • MineSet - MathSoft
  • Intelligent Miner - GainSmarts
  • Sqlserver - SAS - Clementine
  • CART - Weka - WizSoft
  • NeuroShell - ModelQuest
  • data mining tools - Darwin
  • 数据挖掘交友
  • 数据挖掘博客
  • 数据挖掘工具
  • 数据挖掘资源
  • 数据挖掘技术算法
  • 数据挖掘相关期刊、会议
  • 研究院联盟合作专区
  • 数据挖掘基础与相关技术
  • 数据挖掘厂商与就业
  • 数据挖掘研究者乐园
  • 知名厂商数据挖掘工具资料
  • 国内数据挖掘实验室
  • Foreign Data Mining Lab
  • 热点关注
  • Mercator: A Scalable, Extensible Web Cra
  • 什么是垂直搜索引擎(之二)
  • Writing a web crawler
  • 互联网搜索的未来
  • 国家版权局版权司副司长许超:关于搜索引擎
  • 百度数分钟内闪电裁员 企业软件事业部遭抛
  • 我对垂直搜索引擎的几点认识
  • Google Patent Filings by the Dozen
  • Manageability - Open Source Web Crawlers
  • 微软卡位第三代搜索技术 认为Google将很快
  • 论坛最新话题
  • Foundations of Statistical Natural Langu
  • Game Theory meet Data Mining: A Recent P
  • System Building: How does it help or hin
  • 数据挖掘与Clementine培训
  • 新手报到
  • 求 SASEM 客户流失预测分析
  • 数据挖掘工程师/搜索研究院—北京——无线
  • 数据挖掘入门介绍(如何着手数据挖掘)
  • Information Overload Survey Results
  • The INEX 2005 Workshop on Element Retrie
  • 相关资讯
  • 谷歌宣布进军可替代能源 计划投资4.4万亿美
  • 搜索大战成Web 2.0操作系统之争
  • 7月美国搜索市场环比增长2% 雅虎微软成输家
  • 网页面向搜索引擎的搜索引擎优化
  • 史上最具技术创新的10大搜索引擎
  • Google如何预测下一届美国总统
  • 微软1亿美元收购语义搜索引擎Powerset
  • 很黄很暴力:人肉搜索引擎
  • OpenSocial只不过是Google公关骗局
  • 数据之美 百度GOOGLE统计的秘密
  • 数据挖掘实验室资料
  • 数据挖掘博客地址
  • 数据挖掘实验室网站地址
  • Prepare for Medicare audits by using dat
  • 注册成为SAS用户与爱好者俱乐部会员
  • 水南梅
  • 明日烟
  • 新人报道
  • 下载
  • 厦门服务器托管,450元/月—0592-5177319 高
  • 买空间送域名--0592-5177319 高静