搜索引擎是互联网上最先商业化的一个应用服务,它对于帮助网民快速寻找到所需要的信息非常关键。
搜索引擎起源于传统的信息全文检索理论,即计算机程序通过扫描每一篇文章中的每一个词,建立以词为单位的排序文件,检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出现的概率,对包含这些检索词的文章进行排序,最后输出排序的结果。因特网搜索引擎除了需要有全文检索系统之外,还要有所谓的“蜘蛛”(SPIDER)系统,即能够从互联网上自动收集网页的数据搜集系统。蜘蛛将搜集所得的网页内容交给索引和检索系统处理,就形成了我们常见的因特网搜索引擎系统。
因特网搜索引擎是一个全自动的软件服务,并且非常容易在搜索结果网页中插入具有很高针对性的广告,CPM最高可达70美元;所以一旦投入运转,其收益与成本的比率远高于一般的网站内容服务。根据中国环联网信息中心(CNNIC)2000年1月的统计结果,在中国网民中,搜索是排在电子邮件之后的第二大互联网应用。 |