本帖最后由 pollux 于 2011-5-14 15:09 编辑
(当你被我的标题吸引到的时候,我非常愉快,这意味着,你进来可能会给我一些金币和专业度评分,使我可以早日用上光年日志分析软件vip版。)
在http://www.gnbase.com/thread-1949-1.html这个帖子里,发现有人跟我一样对iis下面目录大小写导致的抓取问题非常头疼,不过我是曾经很头疼,而这位兄弟还在头疼。通过robots文件可以解决这个大小写抓取的问题。所以我写下这篇文章,告诉大家一些搜索引擎官方可能未必告诉我们的你的关于robots的潜规则。 在所有meta标签中,专门有一类是指导机器人如何处理抓取后的页面,如何追踪页面上的链接的。描述这种信息的meta标签被称为robotsmeta标签(robots meta tag),它就是本文的主角。
Robots文件是我们与搜索引擎对话的最重要渠道。
为什么meta信息有这么多种类,我们却从来没有在网页上看到过它们呢?因为meta标签的内容在浏览器上是不显示的。绝大部分的meta信息是写给搜索引擎看的,用于帮助搜索引擎判断页面的价值、重要性。 作为网页设计者和搜索引擎交流的一个重要渠道,各种meta标签提供了从不同角度描述页面的基础信息,而机器人在访问网页时也会首先读取这个部分。 关于robots基础阅读: http://www.baidu.com/search/robots.html http://www.robotstxt.org/robotstxt.html http://www.google.com/support/webmasters/bin/answer.py?Hl=cn&answer=156449 Ps,顺便说一句,robots文件nofollow的确是收录利器。无图无真相,
《剩下的接下文》 |