主机参考_WordPress技巧分享_优化WordPress站点的Robots.txt文件协议

Wordpress5年前 (2019)发布 SUYEONE
860 0 0

了解WordPress网站robots.txt文件对于优化seo至关重要,但许多新手对此并不熟悉。本文旨在解释robots.txt文件的作用及其在WordPress中的应用。

“Robots Exclusion Protocol”,即机器人协议,允许网站管理员指示搜索引擎哪些页面可以被索引,哪些应被排除在外。当搜索引擎的爬虫访问网站时,它会首先查找根目录下的robots.txt文件。如果没有找到,它将默认索引所有页面,并可能产生404错误日志,增加服务器负载,所以创建一个robots.txt文件是必要的。

WordPress网站默认的robots.txt文件位于”http://您的域名/robots.txt”,内容如下:
“`
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
“`
这禁止了对后台区域的访问。

然而,为了更全面的优化,我们可以创建一个自定义的robots.txt文件,包含以下内容:
“`
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /*/comment-page-*
Disallow: /*?replytocom=*
Disallow: /category/*/page/
Disallow: /tag/*/page/
Disallow: /*/trackback
Disallow: /feed
Disallow: /*/feed
Disallow: /comments/feed
Disallow: /?s=*
Disallow: /*/?s=*
Disallow: /*?*
Disallow: /attachment/
“`
这些指令的意义如下:

1. `/wp-admin/`, `/wp-content/` 和 `/wp-includes/` 阻止搜索引擎索引后台文件和敏感数据。
2. `/*/comment-page-*` 和 `/*?replytocom=*` 防止评论分页和回复链接被索引。
3. `/category/*/page/` 和 `/tag/*/page/` 禁止分类和标签页的分页被搜索引擎抓取。
4. `/*/trackback` 避免trackback垃圾信息被收录。
5. `/feed`, `/*/feed` 和 `/comments/feed` 确保订阅链接(feed)不被搜索引擎处理,它们专为订阅者设计。
6. `/?s=*` 和 `/*/?s=*` 阻止站内搜索结果被索引。
7. `/*?*` 禁止抓取动态URL以提高网站性能。
8. `/attachment/` 防止无意义的附件页面(如图片)被搜索引擎收录。

编写robots.txt文件的方法多种多样,以上是一个基本示例,希望对你优化WordPress网站的SEO有所帮助。

© 版权声明

相关文章

暂无评论

暂无评论...
☺一键登录开启个人书签等功能!