科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网网络频道搜索引擎风雨十年的传奇之路

搜索引擎风雨十年的传奇之路

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

伴随着互联网的崛起和兴衰,搜索引擎也经历了十年风风雨雨,它是如何成为互联网未来一个重要的增长点呢?又是谁得到了这互联网的“第四桶金”的呢?

作者:陈博 来源:中国电脑教育报 2008年7月16日

关键字: 搜索引擎 网络管理 网络管理软件

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共3页)

  当时的Google提供了最便捷的网上信息查询方法,通过对30多亿网页进行整理,可为世界各地的用户提供适合的搜索结果,而且搜索时间通常不到半秒。

  Google并非只使用关键词或代理的搜索技术,它将自身建立在高级的PageRank(网页级别)技术基础之上。这项技术可以将最重要的搜索结果首先呈现给用户。网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含5亿个变量和20多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。当从网页A链到网页B时,Google 就认为“网页A投了网页B一票”。

  此外,Google还对投票的网页进行分析,根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外,Google还要分析投票的网页。

  Google 是由英文单词“googol”变化而来。“googol”是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词,表示1后边带有100个零的数字。Google 使用这个词代表公司想征服网上无穷无尽资料的雄心。

  “重要”的网页所投出的票就会有更高的权重,并且有助于提高其他网页的“重要性”。重要的、高质量的网页会获得较高的网页级别。Google 在排列其搜索结果时,都会考虑每个网页的级别。

  当然,如果不能满足您的查询要求,网页级别再高对您来说也毫无意义。因此,Google 将网页级别与完善的文本匹配技术结合在一起,为您找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容进行全面检查,从而确定该网页是否满足您的查询要求。

  Google目前被公认为全球最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间返回相关的搜索结果。在访问Google主页时,您可以使用多种语言查找信息、查看新闻标题、搜索超过几十亿幅的图片,并能够细读全球最大的Usenet消息存档,其中提供的帖子也超过几十亿个,时间最早可以追溯到1981年。

  在使用界面方面Google也有自己的优势,用户不必特意访问Google主页,也可以访问所有这些信息。使用Google工具栏可以从网上任何一个位置进行Google搜索。即使身边没有计算机,您也可以通过WAP和i-mode手机等无线平台使用。

  Google的实用性及便利性赢得了众多用户的青睐,它几乎完全是在用户的交口称颂下成为全球最知名的品牌之一。作为一个企业,Google通过提供广告服务来获取收入,使广告客户能够刊登与特定网页内容相关的、重要而有经济实效的在线广告。这不仅为您提供了实用的广告信息,同时也给刊登广告的广告客户带来了好处。

  与前面介绍的Google做法不同,雅虎由于在用户和资金方面优势明显,它在收购和OEM合作策略上特别下工夫。它不仅通过收购或间接收购了Inktomi、Overture、AltaVista等大的搜索引擎技术公司,获得全方面的技术优势的同时,也获得了更多的用户群,并且通过OEM合作伙伴的选择,控制上游技术竞争对手的发展。因此,当雅虎推出它的新的搜索技术后,没有人对它未来的光明前途产生怀疑。

  据了解,在互联网重回技术为王的今天,搜索技术将是改变传统互联网浏览和商务习惯最重要的力量。搜索业务已成为互联网业最令人艳羡的黄金业务,据雅虎公布的财政报告显示,2004年营收为35.75亿美元,比去年的16.25亿美元增长了120%。净利润为8.4亿美元,每股摊薄收益0.58美元。

  雅虎净利润为5.26亿美元,每股摊薄收益0.36美元。而在其中,搜索业务已成为其增长最快主业之一,其中在线业务中的三分之一以及全部线下业务的收入都来自搜索。

  YST是雅虎自从去年以来在收购Inktomi、Overture、Alta Vista和Fast四家国际知名搜索服务厂商之后,经过数百名工程师一年的开发打磨,在2004年2月正式推出,成为国际领先的搜索引擎平台。虽然正式亮相还不足两月之后,YST业就已经成为在全球范围内使用量最大二家搜索引擎之一。根据2004年3月份的一项统计数据显示,雅虎搜索的市场份额已上升至43%,直逼王者地位。对此杨致远表示,搜索市场的争夺是一场马拉松,现在断言谁执牛耳还为时尚早,我们有信心最终胜出。

  爱问搜索

  新浪搜索引擎“爱问”采用了目前最为领先的智慧型互动搜索技术,将给原先算法致胜的网络搜索市场带来前所未有的挑战。它以一个独有的互动问答平台弥补了传统算法技术在搜索界面上智慧性和互动性的先天不足。

  Inktomi搜索

  Inktomi搜索不向终端用户开放,只对专业的网站提供搜索引擎服务。2003年被Overture收购。在2004年Yahoo开发自己全新的搜索引擎技术之前,Inktomi还是全球第二大搜索引擎,其搜索结果被著名网站采用。

  Lycos搜索

  Lycos西班牙公司,全称为Terry Lycos,是全世界最早的搜索引擎之一。但是目前,Lycos已放弃自己开发的搜索技术,而主要搜索结果来自于Alltheweb。另外,其竞价排名结果来自于Google的右侧广告。 ?

  MSN搜索

  属于微软公司的MSN提供的Hotmail和MSN Message极受欢迎。但MSN没有自己的搜索引擎,一直采用其他搜索引擎的结果。有消息显示,MSN正在开发一种叫做“MSN Bot”的自己的搜索引擎。

  Netscape搜索

  Netscape即网景公司,Netscape最初被广大用户认知是因为它的Netscape浏览器。但网景公司研发的浏览器现在几乎完全被微软的Internet Explorer浏览器逐出市场。Netscape搜索结果全部来自于Google 提供。

  2000中文引擎开始崛起

  虽然技术上并没有太多的改变,搜索引擎在各地的本地化还是遇到了很多的问题。从第二代搜索引擎开始,特别是技术成熟的后期,人们逐渐对搜索引擎的本地化和人性化的应用进行了更深入的讲究。

  搜索引擎是个非常复杂的事情,互联网的用户需求也相当之复杂。而随着网络信息对普通人生活的影响,人们越来越需要它,它的搜索速度、搜索内容、文件类型、准确性等等都超出了单纯技术的范围,人们的“本土化”和“生活化”越来越受到关注和重视。

  其实,搜索引擎的进化过程,就是一个时时满足海量信息时代人们对有效信息需求的过程。将来搜索引擎的发展方向,一定是向着更人性化的方向发展。

  现在的搜索引擎,从某种意义上说,还是一些文化素质比较高的人的工具。在中国,人们利用搜索引擎的水平还不高,他们迫切需要这样的一个工具:简单实用、不需要学习如何使用就可以帮助人们改善自己的生活质量。哪些公司能够尽快的找到答案,就可能迅速走向成功。在这方面百度公司就是一个成功的案例。

  百度(Baidu.com,Inc)于1999年底成立于美国硅谷,它的创建者是资深信息检索技术专家,超链分析专利的惟一持有人——百度总裁李彦宏及其好友——在硅谷有多年商界成功经验的百度执行副总裁徐勇博士。2000年,百度回国发展超链分析技术,这是新一代搜索引擎的关键技术,已为世界各大搜索引擎普遍采用。

  2003年11月17日 百度推出全新搜索功能,此次升级后的搜索引擎具备开放共享的功能;2003年6月8日 在中国电脑教育报举办的万人公开评测中,百度战胜Google,标志着成为形乃阉魇谐∩系牡谝唬?005年8月6日 百度赴美上市成功。

  百度以超过亿计的中文网页,全球独有的“超链分析”技术,亚秒级的迅捷速度,庞大的服务器群,接受来自全球各个国家的中文搜索请求。每一年,通过对数十亿次搜索的响应,数千万的网民从百度分享到最纯粹的搜索体验,徜徉信息之海。目前百度是全球最优秀的中文信息检索与传递技术供应商。

  此外,百度的市场推广的成功作用也是值得借鉴,在2002年,中国所有提供搜索引擎的门户网站中,超过80%以上都由百度提供搜索引擎技术支持,当时的客户包括新浪、腾讯、263、21cn、上海热线、广州视窗、新华网等。因此,在当时有众多的用户都在使用百度的搜索,为其尽快适应中国国情提供一条便捷的渠道。

  此外,在技术方面,百度也是很有特点的。百度搜索引擎由四部分组成:蜘蛛程序、监控程序、索引数据库、检索程序。门户网站只需将用户查询内容和一些相关参数传递到百度搜索引擎服务器上,后台程序就会自动工作并将最终结果返回给网站。

  百度搜索引擎使用了高性能的网络“蜘蛛”程序自动的在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。百度在中国各地和美国均设有服务器,搜索范围涵盖了几乎所有的华语地区以及北美、欧洲的部分站点,因此,百度搜索引擎拥有目前世界上最大的中文信息库。此外,百度还有以下三点特有的技术和应用优势:

  1. 采用全球独有的超链分析技术,百度总裁李彦宏就是超链分析专利的惟一持有人。在学术界,一篇论文被引用得越多就说明其越好,学术价值就越高。超链分析就是通过分析链接网站的多少来评价被链接的网站质量,这保证了用户在百度搜索时,越受用户欢迎的内容排名越靠前。

  2. 百度在中文互联网拥有天然优势,支持搜索1.3亿中文网页,是世界上最大的中文搜索引擎。并且,百度每天都在增加几十万新网页,对重要中文网页实现每天更新,用户通过百度搜索引擎可以搜索到世界上最新最全的中文信息。百度在中国各地分布的服务器,能直接从最近的服务器上,把所搜索信息返回给当地用户,使用户享受极快的搜索传输速度。

  3. 为中文用户度身定做:百度深刻理解中文用户搜索习惯,开发出关键词自动提示:用户输入拼音,就能获得中文关键词正确提示。百度还开发出中文搜索自动纠错;如果用户误输入错别字,可以自动给出正确关键词提示。

  百度快照是另一个广受用户欢迎的特色功能,解决了用户上网访问经常遇到死链接的问题:百度搜索引擎已先预览各网站,拍下网页的快照,为用户贮存大量应急网页。即使用户不能链接上所需网站时,百度为用户暂存的网页也可救急。而且通过百度快照寻找资料往往要比常规方法的速度快得多。

  此外,百度还有其他多项体贴普通用户的功能,包括相关搜索、中文人名识别、简繁体中文自动转换、网页预览等。百度已增加了专业的MP3搜索、Flash搜索、新闻搜索、信息快递搜索,并正在快速发展用户喜欢的搜索功能。百度搜索引擎,将发展为最全面的搜索引擎,为所有中文用户打开互联网之门。

  当然作为国际老大的Google,中文化也是绝对不肯放弃的。而Google在策略上也不示弱,通过收购百度的部分股份,开始进军国内搜索市场。随后Google又专门为使用简体中文的用户推出五种新的快捷搜索功能等举措,加强对中文搜索的投入力度,把市场触角直接伸到了中国。

  2000年9月12日,Google也开始启用中文搜寻服务;2004年6月21日,Google推出新的快捷搜索方式,它能方便中文用户访问更多信息;2004年9月9日,Google推出简体中文新闻搜索服务;2005年3月7日,Google桌面搜索中文版推出;2005年5月25日,Google推出“桌面搜索1.0”中文版,所有这些步骤都充分体现了Google本地化的决心和信心。

  与Google的想法类似,雅虎在激烈的中国搜索市场竞争中也希望快速取胜,因此也加紧推行了本地化的市场战略。2003年底,雅虎首先出手收购了占实名搜索90%市场份额的3721公司,迈出其开拓中国搜索市场的第一步,其后,又于2004年6月推出全新搜索品牌——“一搜”,这是雅虎十年历史上首个专业搜索网站。它与其网络实名、雅虎门户搜索一起构成了中国搜索市场上的“雅虎搜索系”。

  此外,雅虎在技术上也非常注重本土化,在2003年底,就由雅虎中国派出技术团队前往美国进行YST的培训和本地化开发,2004年3月便将YST技术几乎与全球同步落户中国。

  其次,在市场推广上,雅虎在数年前就建立了雅虎中国公司,在收购3721公司的同时也将其本土化成功模式一并收入囊中。雅虎借助3721公司强大的渠道体系,迅速取得了本地化的渠道资源优势,通过这资源的移植,雅虎中国在本地化销售渠道方面的优势也得到了迅速的提升。

  互联网调查公司iResearch日前发布的《2004中国搜索引擎研究报告》显示,2004年中国搜索引擎市场中,百度、雅虎、Google分别以36.29%、22.72%、21.22%的用户占有率占据着国内搜索引擎市场的前三位,形成了国内搜索市场的“第一阵营”。紧随其后,新浪、搜狐、网易、Tom、中国搜索、中华网等国内厂商形成了“第二阵营”。

  相比之下,虽然“第二阵营”中各厂商的单项表现总体偏低,但他们在单项指标上的竞争却非常激烈,尤其是新浪、搜狐、网易在门户搜索流量的份额非常接近。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章