主机参考_WordPress技巧分享_优化WordPress站点的Robots.txt文件协议

Wordpress7年前 (2019)发布 SUYEONE

9.8K 0 0

了解WordPress网站的robots.txt文件对于优化seo至关重要，但许多新手对此并不熟悉。本文旨在解释robots.txt文件的作用及其在WordPress中的应用。

“Robots Exclusion Protocol”，即机器人协议，允许网站管理员指示搜索引擎哪些页面可以被索引，哪些应被排除在外。当搜索引擎的爬虫访问网站时，它会首先查找根目录下的robots.txt文件。如果没有找到，它将默认索引所有页面，并可能产生404错误日志，增加服务器负载，所以创建一个robots.txt文件是必要的。

WordPress网站默认的robots.txt文件位于”http://您的域名/robots.txt”，内容如下：
“`
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
“`
这禁止了对后台区域的访问。

然而，为了更全面的优化，我们可以创建一个自定义的robots.txt文件，包含以下内容：
“`
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /*/comment-page-*
Disallow: /*?replytocom=*
Disallow: /category/*/page/
Disallow: /tag/*/page/
Disallow: /*/trackback
Disallow: /feed
Disallow: /*/feed
Disallow: /comments/feed
Disallow: /?s=*
Disallow: /*/?s=*
Disallow: /*?*
Disallow: /attachment/
“`
这些指令的意义如下：

1. `/wp-admin/`, `/wp-content/` 和 `/wp-includes/` 阻止搜索引擎索引后台文件和敏感数据。
2. `/*/comment-page-*` 和 `/*?replytocom=*` 防止评论分页和回复链接被索引。
3. `/category/*/page/` 和 `/tag/*/page/` 禁止分类和标签页的分页被搜索引擎抓取。
4. `/*/trackback` 避免trackback垃圾信息被收录。
5. `/feed`, `/*/feed` 和 `/comments/feed` 确保订阅链接（feed）不被搜索引擎处理，它们专为订阅者设计。
6. `/?s=*` 和 `/*/?s=*` 阻止站内搜索结果被索引。
7. `/*?*` 禁止抓取动态URL以提高网站性能。
8. `/attachment/` 防止无意义的附件页面（如图片）被搜索引擎收录。

编写robots.txt文件的方法多种多样，以上是一个基本示例，希望对你优化WordPress网站的SEO有所帮助。