搜索引擎
搜索引擎是一种软件系统,它从万维网收集信息,并将其呈现给正在寻找特定信息的使用者。
搜索引擎执行以下流程
- 网络爬虫:通过浏览网页上的超链接来搜索网站,包括网站内部和网站之间。网站所有者可以通过在名为
robots.txt
的文件中定义“robots exclusion”(机器人排除)信息,来排除搜索引擎的网络爬虫(或蜘蛛)访问网站的某些区域。 - 索引:将关键字和其他信息与已爬取的特定网页相关联。这使得用户能够尽可能快地找到相关网页。
- 搜索:根据由关键词和其他命令组成的查询,查找相关的网页。搜索引擎找到与查询匹配的网页的URL,并根据其相关性对它们进行排名。然后,它按排名顺序将结果呈现给用户。
最受欢迎的搜索引擎是谷歌。其他顶级搜索引擎包括雅虎、必应、百度和美国在线。