什么是robots.txt文件?
搜索引擎机器人通过链接抵达互联网上的每个网页,并抓取网页信 息。搜索引擎机器人在访问一个网站时,会首先检查该网站的根目录下是否有一个叫做robots.txt的纯文本文件。当我们的网站有一些内容不想被搜索引 擎收录,我们可以通过设置robots.txt文件告知搜索引擎机器人。
如果网站上没有禁止搜索引擎收录的内容,则不用设置robots.txt文件,或设置为空。
从SEO的角度,robots.txt文件是一定要设置的,原因:
- 网站上经常存在这种情况:不同的链接指向相似的网页内容。这不符合SEO上讲的“网页内容互异性原则”。采用robots.txt文件可以屏蔽掉次要的链接。
- 网站改版或URL重写优化时原来不符合搜索引擎友好的链接需要全部屏蔽掉。采用robots.txt文件删除旧的链接符合搜索引擎友好。
- 一些没有关键词的页面,比如本站的这个页面http://www.szhutong.com/About/,屏蔽掉更好。
- 一般情况下,站内的搜索结果页面屏蔽掉更好。
如果将你的网站比喻成一本书的话,那么robots.txt 文件就像是你这般书的目录。它会告诉搜索引擎,你的网站那些是对读者没用的东西,搜索引擎收录了这些页面也没有什么用,或者网站的作者根本就不想要搜索引擎知道有这些页面。rotots.txt文件在网站搜索引擎优化里面是很重要的,专业的网站建设公司(比如深圳市互通在线科技有限公司)都会告诉客户这些应该注意的地方。