搜索引擎的历史

  1991年,XWAIS版本提供了一个有着友好界面的信息搜索系统,但这个系统要求很特殊的文件格式。而在同一年还出现了另外一个信息搜索系统,这是我们所称之为的GOPHER。

  而最早的真正意义上的搜索引擎是Lycos,创建于1994年的春天,当时Michael Mauldin将John Leavitt的spider程序接入到其索引程序中。Yahoo!也是在当年成立的。而NCSA Mosaic出现在1993年,Netscape出现在1994年。

  今天搜索引擎的核心是网络导航服务,搜索引擎是一个网络门户,他们提供新闻,在线图书馆,词典,以及其它网络资源,他们提供了不仅仅是网站搜索的服务,他们的涉及面越来越广,也越来越有用。比如,Yahoo!注重的是网站分类归总服务,而如Alta Vista,Excite等则注重提供庞大的搜索数据库。一些网络导航服务并不提供搜索功能,他们侧重的是其它服务,但不论如何,搜索引擎为我们的网络生活带来了极大的便利,而且是免费服务,不是吗?

  也许不是,曾有传言指一些搜索引擎会出卖用户的个人信息。你是不是曾有这样的经历,在使用了一个搜索引擎后,会突然收到一些莫名其妙的电子邮件广告,当时你可能会认为这只是一个偶然事件。但另外一种可能是,这些广告主可能向搜索引擎支付了一定的费用而获得了你的个人资料。因为几乎每个搜索引擎都要求你在登录时提供电子邮件地址,如果这些传言是真的,那的确认人不快,不过,我们还是继续充分地使用搜索引擎的网络导航服务罢。


搜索引擎特征列表

  搜索引擎数量众多,我们在使用时,怎样进行选择取舍呢?当然,我想你一般都有较习惯使用的搜索引擎,如果你想试试其它的搜索引擎,希望下面的列表分析能帮助你选择最适合你的搜索引擎。

我应该使用哪个搜索引擎?什么时候?怎样使用?
Lycos 对搜索条件不确定时 best test results for broad search terms
" " 想找到某人的电子邮件地址时 People Finder.
Magellan 有太多的搜索关键词时 best available results summaries.
" " 需要了解交互式的新闻或今天头条新闻的具体内容时 news with links to related sites.
OpenText 只想查找网页标题时或执行较复杂的搜索命令时 title search specification, best advanced search interface.
Alta Vista 查找图片时 image:search_word syntax.
" " 想要查找链接到你的网页的外部链接时 +link:your_site -url:your_site syntax.
Yahoo! 需要查找最好的国内、国际新闻时 Reuters world headlines.
" " 查找一部字典或其它辅助性资源时 Dictionaries or Reference Libraries.

有用的搜索功能

查寻图片 (Alta Vista)

  你肯定曾使用过这个功能,如果你想查找图片(如string)的标题,请按如下命令格式进行搜索:

image:title_string

  搜寻链接到你网站上的外部链接 (Alta Vista)
Alta Vista称其可以搜寻链接到你网站上的所有外部链接,搜索命令是:+link:http://mysite.com/ 或者简单一点的:-host:mysite

哪个是最好的搜索引擎?

  (关键是你怎样使用它,而不是它的数据库有多大。)

  我在选择使用哪个搜索引擎时,判断的根据是哪个搜索引擎提供最有质量的搜索结果。现在几乎所有搜索引擎都具有很好的硬件条件及连接速度,在进行搜索任务及返回结果时都能迅速完成。但现在主要的问题是在进行关键字搜索时,我们常为一些虽然很近似但实际上却与我们的要求相去甚远,成功的搜索引擎就是能提供符合我们要求的搜索结果。

  根据官方的测试评估,Lycos 是最好的搜索引擎。但它并未涉及到问题的核心,就是上面的表格中所列的,每个搜索引擎都有其独特的一面和有优势的一面。针对不同的搜索要求,我会选择不同的搜索引擎。比如,只有Alta Vista才提供图片搜索功能,因此对于设计人员来说,它无疑是最好的搜索引擎。不要局限于使用一两种搜索引擎,根据你的搜索要求在不同的搜索引擎进行操作,这才是最明智的作法。


搜索引擎与大写字母

  你是不是总是担心着网页的文字的大写情况,特别是在涉及到meta标签时。因为有些搜索引擎的确对搜索条件很“敏感”,比如你查"Entertainment"的时候,它返回的结果就可能不包括与"entertainment"有关的网页。

  我们都不想失去访问者,因此有的人就对meta标签中的关键字大小写绞尽脑汁,比如对于“娱乐”这个词,他们会在标签里这样罗列:

  entertainment, Entertainment, ENTERTAINMENT

  对他们的细心我们是很赞赏的,但问题是搜索引擎会将这几个词视为重复关键词的作弊行为,特别是对于短语,问题就更大了,举例来讲,"golf courses"的大小写变化就有7种形式:

golf courses, Golf courses, Golf Courses, golf Courses,
GOLF COURSES, GOLF courses, golf COURSES

  搜索引擎会认为你重复了7次关键词,你要登录它便没指望了。

  没辙了?其实很简单,不要去理会大小写的问题,一来是根据人们的搜索习惯;二来也只有两个主要的搜索引擎才对大小写特别敏感。

人们的搜索习惯

  以下是一个搜索引擎统计的数据,统计了人们在进行搜索时使用大小时的情况:

关键词 总数
%
name 1,011
82%
Name 128 10%
NAME 86 7%
"name" 8 0.6%
NAme 3 0.2%
nAME 2 0.2%
合计 1,238
100%

  现在还担心大小写的问题吗?最坏的情况也不过是你损失18%的流量。而一般来讲,不理会大写不会对你的网站访问量带来什么影响,相反,如果你刻意的完善大小写,就可能会冒被搜索引擎视为作弊的危险,得不偿失,不是吗?

  上面是对人们搜索单个词的大小写统计,下面我们再来看看词组的统计情况:

关键词 总数 %
golf courses 233 84%
GOLF COURSES 15 5%
Golf Courses 13 5%
Golf courses 8 3%
"golf courses" 6 2%
golf Courses 1 0.4%
合计 276  

  大多数人还是直接使用小写,一般来讲,对于所有的词汇,直接使用小写进行搜索的人占全部搜索人群的85%到90%。

  搜索条件敏感度列表

  下表列出了主要的搜索引擎对搜索条件(大小写)的敏感程度。

Type AltaVista Go Northern Light HotBot
是否敏感 Yes Yes Mixed
/Title
Mixed
全部小写 all all all all
全部大写 exact exact all all
大小写混合 exact exact exact exact
首字母大写 exact exact exact all
句首字母大写 exact exact exact all
不敏感的是:
AOL Search, Excite, Google, Lycos, WebCrawler

检查URL的登录情况

  某些搜索引擎很容易地就确认你的网页的登录情况,但另外一些可能就相当困难,下面介绍在主要的搜索引擎中检查网页的登录情况的一些好方法:

Go (Infoseek)

  在Go中查询URL很简单,只须在搜索框中如下键入即可:

  url:go2searchengine.com

  如果要查找具体的某个网页时,请输入完整的URL,如:go2searchengine.com/aboutus.htm

注意最好不要加前缀www。

HotBot

  在HotBot中查询URL也很简单,只须在搜索框中如下键入即可:

  domain:go2searchengine.com

  如果你要看网站里的其它网页的登录情况,只需点击查询的结果下的 "See results from this site only"链接即可。

AltaVista

  AltaVista中的查询方法基本与HotBot一致,只是要注意它的查询命令是host: ,而要查看其它网页登录情况的文字链接是:"More pages from this site"。如图所示:

  如果你要查询某个具体网页的登录情况,查询的命令与GO中的一样(url:) 。

Excite

  Excite中的查询方法要复杂一点,最好的方法是在搜索框中直接输入URL,不要加前缀http://,如下所示:

www.go2searchengine.com/aboutus.html

Lycos

  Lycos提供了查询URL的服务:

  http://www.lycos.com/addasite.html

  但不幸的是,Lycos只确认那些它的spider索引过的网页,这个索引与搜索引擎里的网页索引不是一个概念,所以要查你的网页到底在Lycos里有没有登录,你可以这样查询,如

  go2searchengine.com

  如果没有发现,你可以再试一下这一种方法:

  go2searchengine

WebCrawler

  跟Lycos一样,当你输入你的URL查询时,返回的数据可能根本不是你的网页,因此你可以输入一些关键词进行查询。


  每个搜索引擎都有其优点,也有着不足。你应根据你的搜索要求,充分发挥各类搜索引擎及各种搜索功能的作用。 可以肯定的是,有着最庞大索引数据库的搜索引擎并不是最好的搜索引擎。要很好的使用搜索引擎,你要先开动脑筋,选择最恰当的关键词或搜索条件,小心拼写方面的错误,运用各种各样的搜索命令,如titles, images, links等。