搜索引擎的发展史

2024-05-13 16:24

1. 搜索引擎的发展史


搜索引擎的发展史

2. 搜索引擎发展史的介绍

随着现代社会互联网的迅速发展,能够接触到互联网的人越来越多。而这些网民需要寻找什么东西的时候,只需要轻轻一点,打开一个百度或者谷歌等,往搜索框里面输入自己需要找的东西,再按回车键,便可以查到千千万万个结果,而为网民所广泛使用的这个工具,就是搜索引擎。那么,搜索引擎是如何发展起来的呢?今天,就为大家探究一下搜索引擎的发展史。

3. 搜索引擎的发展史

互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。   

1990年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出Archie。当时,万维网(World Wide Web)还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,Archie被公认为现代搜索引擎的鼻祖。
以上文字来源于网络。
在国内我们一般认为搜索引擎的鼻祖是yahoo。
同时中国搜索的陈沛被认为是中国搜索引擎的先驱。

搜索引擎的发展史

4. 搜索引擎技术发展史

从搜索引擎所采取的技术来说,可以将搜索引擎技术的发展分为4个时代:分类目录、文本检索、链接分析和用户中心。
  
 这个时代也可以称为“导航时代”,Yahoo和hao123是这个时代的代表。通过人工收集整理,把各类别的高质量网站或者网页分门别类罗列,用户可以根据分级目录来查找高质量的网站。这种方式是纯人工的方式,并未采取什么高深的技术手段。
  
 采取分类目录的方式,一般被收录的网站质量都较高,但是这种方式可扩展性不强,绝大部分网站不能被收录。
  
 文本检索的一代采用经典的信息检索模型,比如布尔模型、向量空间模型或者概率模型,来计算用户查询关键词和网页文本内容的相关程度。网页之间有丰富的链接关系,而这一代搜索引擎并未使用这些信息。早期的很多搜索引擎比如Alta Vista、Excite等大都采取这种模式。
  
 相比分类目录,这种方式可以收录大部分网页,并能够按照网页内容和用户查询的匹配程度进行排序。但是总体而言,搜索结果质量不是很好。
  
 这一代的搜索引擎充分利用了网页之间的链接关系,并深入挖掘和利用了网页链接所代表的含义。通常而言,网页链接代表的一种推荐关系,所以通过链接分析可以在海量内容中找出重要的网页。这种重要性本质上是对网页流行程度的一种衡量,因为被推荐次数多的网页其实代表了其具有流行性。搜索引擎通过结合网页流行性和内容相似性来改善搜索质量。
  
 Google率先提出并使用PageRank链接分析技术,并大获成功,这同时也引进了学术界和其他商业搜索引擎的关注。后来学术界陆续推出了很多改进的链接分析算法。目前几乎所有的商业搜索引擎都采取了链接分析技术。
  
 采用链接分析能够有效改善搜索质量,但是这种搜索引擎并未考虑用户的个性化要求,所以只要输入的查询请求相同,所有用户都会获得相同的搜索结果。另外,很多网站拥有者为了获得更高的搜索排名,针对链接分析算法提出了不少链接作弊方案,这样导致搜索结果质量变差。
  
 目前的搜索引擎大都可以归为第三代,即以理解用户需求为核心。不同用户即使输入同一个查询关键词,但其目的也有可能不一样。比如同样输入“苹果”作为查询词,一个追捧iPhone的时尚青年和一个果农的目的会有相当大的差距。即使是同一个用户,输入相同的查询词,也会因为所在的时间和场合不同,需求有所变化。而目前搜索引擎大都致力于解决如下问题,如何能够理解用户发出的某个很短小的查询词背后包含的真正需求,所以这一代搜索引擎称之为以用户为中心的一代。
  
 为了能够获取用户的真实需求,目前搜索引擎大都做了很多技术方面的尝试。比如利用用户发送查询词时的时间和地理位置信息,利用用户过去发出的查询词及相应的点击记录、历史信息等技术手段,来试图理解用户此时此刻的真正需求。

5. 中文搜索引擎的搜索引擎发展史

90年初当时万维网(World Wide Web)还未出现,为了查询散布在各个分散的主机中的文件,曾有过Archie, Gopher等搜索工具,随着互联网的迅速发展,基于HTTP访问的web技术的迅速普及,他们就不再能适应用户的需要。在1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线,它还支持Gopher和Telnet搜索。同年4月,Yahoo目录诞生,随着访问量和收录链接数的增长,开始支持简单的数据库查询。这就是我们说的早期的,目录导航系统,他们的缺点网站收录/更新都是要考人工维护,所以在信息量剧增的条件下,就不是非常受用了。1994年7月,Lycos推出了基于robot的数据发现技术,并支持搜索结果相关性排序,并且他第一个开始在搜索结果中使用了网页自动摘要。Infoseek也是同时期的一个重要代表,他们是搜索引擎史上一个重要的进步。1995年,一种新的搜索引擎工具出现了——元搜索引擎,第一个元搜索引擎是华盛顿大学的学生开发的Metacrawler。用户只需提交一次搜索请求,由元搜索引擎负责转换处理後提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理後再返回给用户。1995年12月才登场亮相的AltaVista推出了大量的创新功能使它迅速到达当时搜索引擎的顶峰,它第一个支持自然语言搜索的搜索引擎,具备了基于网页内容分析,智能处理的能力,第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等), 同时AltaVista还支持搜索新闻群组(Newsgroups),搜索图片等具有划时代意义的功能。 同时期还有inktomi,HotBot等搜索引擎。1997年8月Northernlight 公司正式推出搜索引擎,它第一个支持对搜索结果进行简单的自动分类,也是当时拥有最大数据库的搜索引擎之一。1998年10月,Google诞生。它是目前最流行的搜索引擎之一,具备很多独特而且优秀的功能,并且在界面等实现了革命性创新。1999年5月,Fast(Alltheweb)公司发布了自己的搜索引擎AllTheWeb,它的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。它曾经是最流行的搜索引擎之一,後在2003年2月被Overture收购。在中文搜索引擎领域,1996年8月成立的搜狐公司是最早参与作网络信息分类导航的网站,曾一度有“出门找地图,上网找搜狐的”美誉。由于其人工分类提交的局限性,随着网络信息的暴增,逐渐被基于robot自动抓取智能分类的新一代信息技术取代。台湾中正大学吴升教授所领导的GAIS实验室1998年1月创立了Openfind中文搜索引擎,是最早开发的中文智能搜索引擎,采用GAIS实验室推出多元排序(PolyRankTM)核心技术,截止2002年6月,宣布累计抓取网页35亿,开始进入英文搜索领域。北大天网是教育网最流行的搜索引擎,它由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务, 2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。中文搜索由超链分析专利发明人、前Infoseek资深工程师李彦宏和好友徐勇2000年1月创建,目前支持网页信息检索,图片,Flash,音乐等多媒体信息的检索。并且在中文领域第一个开始使用ppc经营模式。2002年开始进入搜索引擎市场的中搜是由慧聪国际主持开发的,是搜索领域的後起之秀。目前处于起步阶段,技术没有特别见长的优势。

中文搜索引擎的搜索引擎发展史

6. 中文搜索引擎的发展历史

 
  1996年8月成立的搜狐公司是最早参与作网络信息分类导航的网站,1998年2月,搜狐推出分类目录搜索引擎.是当年Yahoo!的中国版.2000年7月12日,搜狐公司在美国纳斯达克挂牌上市(NASDAQ:SOHU),之后努力在门户方向发展。
  1997年6月创立的网易,也推出全中文搜索引擎目录,但并不是主服务。
  之后经过几次升级先后使用Google.baidu的后台搜索技术,但是网易还是拥有目前中文唯一的开放式目录体系ODP,2000月6月,网易在美国纳斯达克股票市场挂牌交易(NASDAQ:NTES)。
  1997年10月29日北大天网正式在CERNET(教育科研网)上提供服务, 由北大计算机系网络与分布式系统研究室开发,有强大的ftp搜索功能。
   
  1998年1月,台湾中正大学吴升教授所领导的GAIS实验室创立了Openfind中文搜索引擎,是最早开发的中文智能搜索引擎,采用GAIS实验室推出多元排序(PolyRankTM)核心技术.
  1999年2月2日,新浪网开始推出新一代中文搜索引擎“新浪搜索”(SinaSearch)测试版,并于10月9日,推出了高级搜索,网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。
  2000年4月,新浪网在美国NASDAQ上市(NASDAQ:SINA)。
  2000年11月1日,新浪又正式推出国内第一家综合搜索引擎,即1此搜索可对多个数据库发出请求,在关键词的查询反馈结果中,同一页面上包含目录、网站、新闻标题、新闻全文、频道内容、网页、商品信息、消费场所、中文网址、沪深行情、软件、游戏等各类信息的综合搜索结果,可选择自主切换。
  1999年9月,雅虎中国网站(yahoo)正式开通,继承了雅虎全球的分类目录搜索的基因,为中国互联网用户提供了强大的搜索功能。
  1999年5月,hao123网之家成立,遵循简单,直接分类模式,成为万千网民上网必备利器.04年8月被百度收购.
  1999年底成立于美国硅谷百度(Baidu,Inc)以超链分析技术为基础,推出新一代中文搜索引擎,2003年11月,百度推出全新基于社区化搜索概念的搜索产品贴吧;2005年8月5日,百度赴美上市成功。
  2000年9月12日,Google也开始启用中文搜索服务。
  之后中文版的各种软件和功能在快速升级中.
  2002年9月25日,由中国网、慧聪国际等共同打造的中国搜索联盟,为门户提供搜索技术,03年8月推出搜索门户,命名为中国搜索.
  2004年6月雅虎推出全新“一搜”,这是雅虎十年历史上首个专业搜索网站。
  它与其网络实名、雅虎门户搜索一起构成了中国搜索市场上的“雅虎搜索系”。
  说名雅虎在非常注重中文市场,也很注重技术本土化。
  2004年8月3日搜狐公司推出的完全自主技术开发的搜狗(sogou)互动式中文搜索引擎。
  以给予多个主题的“搜索提示”,帮助用户查询过程中,有效的人机交互,引导用户更快速准确定位自己所关注的内容,用户快速找到相关搜索结果。
  2005年6月30日,新浪搜索引擎推出“爱问”(iAsk)专门搜索平台,这是1款新浪自主研发的搜索产品。
  中文搜索发展到今天的地步,无论从产业角度还是从产品角度来看,都还有差距,看看国际搜索巨头们的前半年的收购轨迹, 也许你就会发现,搜索无定型,不要说搜索引擎就是要能搜索,他也可以是互动的如百度贴吧,也可以使资源的如图片搜索mp3搜索,发展史就是迎合用户需求不断的完善和扩张史.
  Google, 3月份收购Urchin 网站信息分析公司, 5月份,收购手机社交网Dodgeball,
  Yahoo!, 收购Konfabulator桌面软件,参股alibaba. 
  某些时间参考了搜索引擎十年有多少故事,如果想看看这些网站当年都是什么样子可以到web.archive去察看,当年的搜狐SOHOO,网易ease,新浪前身SRSNet等他们的域名都是跟现在不1样的.
  PS,只是以大企业为标杆简单记录下,如要严格考证其实这中间也有N多花絮,诸如北极星,search163的分类目录,goyoyo的搜索,chinaren的智能搜索孙悟空等。
  参考:中文搜索引擎史记 
  ://loverty/2005/08/blog-post_14.
   

7. 搜索引擎历史

 一、简述:"搜索引擎发展历史"   搜索引擎的发展史 1990年以前,没有任何人能搜索互联网。
   所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。
  Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
   由于Archie深受欢迎,受其启发,Nevada System puting Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
   Robot(机器人)一词对编程者有特殊的意义。puter Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。
  由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。
  刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。 与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。
  ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。 随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的Spider程序工作原理作了些改进。
  其设想是,既然所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。
  JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。
   Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。
  (注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile) 1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Tel搜索。
   1994年4月,Stanford University的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo(Jerry Yang Alerts a Use group to the Yahoo Database ,1996年的Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。
  因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Wanderer只抓取URL,但URL信息含量太小,很多信息难以单靠URL说清楚,搜索效率很低。
  Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。(注:Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务;2002年10月9日,Yahoo放弃自己的网站目录默认搜索,改为默认Google的搜索结果,成为一个真正的搜索引擎。
  并于2002年12月23日收购inktomi,于2003年7月14日收购包括Fast和Altavista在内的Overture) 1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。
  WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(注:后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile) Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。
  Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的。
  二、简述:"搜索引擎发展历史"   1990年以前,没有任何人能搜索互联网。
  所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。 虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。
   Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。
   由于Archie深受欢迎,受其启发,Nevada System puting Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
   扩展资料 搜索引擎的作用 搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的 一个有效工具”。 高效的站内检索可以让用户快速准确地找到目标信息,从而更有效地促进产品/服务的销售,而且通过对网站访问者搜索行为的深度分析,对于进一步制定更为有效的网络营销策略具有重要价值。
   1、从网络营销的环境看,搜索引擎营销的环境发展为网络营销的推动起到举足轻重的作用; 2、从效果营销看,很多公司之所以可以应用网络营销是利用了搜索引擎营销; 3、就完整型电子商务概念组成部分来看,网络营销是其中最重要的组成部分,是向终端客户传递信息的重要环节。 参考资料来源:百度百科-搜索引擎。
  三、请讲一下搜索引擎的历史   搜索引擎的发展历史 1990年,加拿大麦吉尔大学(University of McGill)计算机学院的师生开发出Archie。
  当时,万维网(World Wide Web)还没有出现,人们通过FTP来共享交流资源。Archie能定期搜集并分析FTP服务器上的文件名信息,提供查找分别在各个FTP主机中的文件。
  用户必须输入精确的文件名进行搜索,Archie告诉用户哪个FTP服务器能下载该文件。虽然Archie搜集的信息资源不是网页(HTML文件),但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。
  所以,Archie被公认为现代搜索引擎的鼻祖。 Robot(机器人)一词对编程者有特殊的意义。
  puter Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider程序。
  1993年Matthew Gray开发了 World Wide Web Wanderer,这是第一个利用HTML网页之间的链接关系来检测万维网规模的“机器人(Robot)”程序。开始,它仅仅用来统计互联网上的服务器数量,后来也能够捕获网址(URL)。
   1994年4月,斯坦福大学(Stanford University)的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。
  因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。雅虎于2002年12月23日收购inktomi,2003年7月14日收购包括Fast和Altavista在内的Overture,2003年11月,Yahoo全资收购3721公司。
   1994年初,华盛顿大学(University of Washington )的学生Brian Pinkerton开始了他的小项目WebCrawler。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。
  WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。 1994年7月,卡内基·梅隆大学(Carnegie Mellon University) 的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。
  除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。 1994年底,Infoseek正式亮相。
  其友善的界面,大量的附加功能,使之和Lycos一样成为搜索引擎的重要代表。 1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。
  用户只需提交一次搜索请求,由元搜索引擎负责转换处理,提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。
   1995年12月,DEC的正式发布AltaVista。AltaVista是第一个支持自然语言搜索的搜索引擎,第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。
  用户可以用AltaVista搜索新闻组(Newsgroups)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。
  AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。
  它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。
  1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。1995年9月26日,加州伯克利分校助教Eric Brewer、博士生Paul Gauthier创立了Inktomi,1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。
  声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。
   1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop ,它有出色的Current News、7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。
   1998年10月之前,Google只是斯坦福大学(Stanford University)的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了google的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。
  1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。
  Google以网页级别(Pagerank)为基础,判断网页的重要性,使得搜索结果的相关性大大增强。Google公司的奇客(Geek)文。
  四、搜索引擎发展历程   1990年:第一个互联网上的搜索引擎Archie出现,用于搜索FTP服务器上的文件。
  1993年:6月,第一个Web搜索引擎World Wide Web Wandere出现,它只用来收集网址。10月,第二个Web搜索引擎ALIWEB出现。开始索引标题标签等信息。
  1994年:1月,早起最重要的搜索引擎之一Infoseek创立。(百度创始人李彦宏就是其核心工程师之一)
  4月,雅虎Yahoo!创立。同月,第一个全文搜索引擎(索引文件全部内容)WebCrawler推出。
  6月,Lycos创立。迅速成为最受欢迎的搜索引擎之一。
  1995年:4月,雅虎Yahoo!正式成立。
  12月,Infoseek成为网景浏览器的默认搜索引擎。同月,Alta Vista创立,迅速成为搜索引擎发展中最受欢迎的,堪称当时的谷歌Glloge。
  1996年:4月,雅虎Yahoo!上市。
  1997年:4月,Ask Jeeves上线,唯一一个至今仍真实存在并有一定市场份额的早起搜索引擎。
  1998年:9月,谷歌Google正式成立。
  1999年:6月,曾经流行一时的搜索引擎Infoseek消失。
  2000年:1月18日:百度成立。
  7月,雅虎Yahoo!使用谷歌Google搜索数据。
  2001年:10月,百度作为搜索引擎正式上线。
  2002年:3月,谷歌Google Ad 推出PPC形式,也就是按点击付费。
  2003年:7月,雅虎Yahoo!将除了谷歌Google之外的几乎所有主流搜索技术收归旗下。2004年:8月,谷歌Google上市。
  2005年:8月,百度上市。
  2006年:9月,MSN网络品牌全部改为Live、并做了大量推广,Google仍然占最大地位。
  2007年:3月,谷歌Google开始提供类似网站联盟的按转化付费的广告形式。
  2009年:6月,微软Live Search 改名为必应(Bing)
  7月29,雅虎Yahoo!被自己亲手培养的Google谷歌彻底打败在搜索引擎战场。
  2010年:8月,Yahoo!雅虎开始使用必应Bing搜索数据。
  2011年:2月,Google谷歌推出Panda更新,旨在减少搜索结果中低质量页面。对seo优化业绩影响深远。
  2010年8月,NetMarketShare 统计数据,全球搜索引擎市场份额中谷歌Google占据.73,占世界绝对领先地位,百度由于中国搜索用户数量庞大,搜索量排在第三位。但是国外使用百度者很少。
  五、搜索引擎发展史有哪些   互联网历史:搜索引擎发展史(本文转自于:《新浪科技 @科技时代》) 1990年以前,没有任何人能搜索互联网。
   所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。当时World Wide Web还未出现。
  Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。 Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告 你的网络游戏联盟 新浪点点通个性 *** sDIY 海纳百川 候车亭媒体 轻松填问卷开心拿大奖 诉用户哪一个FTP地址可以下载该文件。
   由于Archie深受欢迎,受其启发,Nevada System puting Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
   由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。
  刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。 与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。
  ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。 1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。
   1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是Excite。
  后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile 1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Tel搜索。
   1994年4月,Stanford两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。
  因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。搜索效率明显提高。
  (Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务) 1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。
  WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile) Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。
  Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。
  除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务) Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。
  起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。
  Infoseek友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。
  (注:Infoseek后来曾以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果) 1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索。
   

搜索引擎历史

8. 第三代搜索引擎的发展历史

2011年10月19日,中搜正式推出开放的第三代搜索引擎平台,搜索结果满足全面、准确、智能、互动、美观的CIVIA搜索标准,在这一平台之上,实现各类跨行业、跨地区、跨信息类别、跨展现形式的搜索服务的整合。中搜第三代搜索引擎平台是全球第一款搜索技术与人类智慧结合、专业知识和搜索技术融合的开放式搜索平台。通过在各行业中选取优秀的合作伙伴进行深度合作,使专业知识和搜索技术有机地融合起来,根据用户需求,为用户提供更加全面、精准、可编辑的搜索结果。中搜的第三代搜索引擎平台所提供的搜索结果不再是一个简单的信息呈列,结果本身就能成为一个互动平台,通过微件应用,结果页面的丰富表现手段也将呈现不一样的视觉冲击力和表现力。同时也提出全新的搜索标准,即全面、准确、智能、互动、美观的CIVIA五大标准,满足此标准的搜索内容才能成为第三代搜索引擎平台的内容之一。