WordPress网站优化之快速处理失效链接

由于网站的更新,改版导致过去搜索引擎收录的很多地址已经永久失效了。但是根据Nginx日志分析还是能看到各大搜索引擎还不断有爬取旧地址的行为,同时还有不少通过之前链接访问过来的。这样就会导致日志中出现大量的404,这样会影响搜索引擎及用户体验。

对于已经永久失产的链接可以直接在Nginx上处理返回410 加速清理,并配合robots.txt文件来屏蔽,减少不必要的爬取。

一、怎么对robots.txt文件的修改

可以直接修改文件,或者利用插件等工具来辅助,不用直接在服务器上敲命令了。

下面我把收集到的主流、常用、能直接改 robots.txt 的 WP 插件全部列清楚,包括:全能 SEO 插件(最常用)+ 纯 robots 专用插件(轻量),并说明各自怎么用、优缺点,你一看就知道大概率用哪一个。


1、全能 SEO 类(90% 的人都是用这些改 robots.txt)

Yoast SEO(最常见,你极大概率用过)

  • 后台路径:SEO → 工具 → 文件编辑器 → robots.txt
  • 直接写:plaintextDisallow: /旧目录/ Disallow: /废弃文件夹/
  • 优点:免费可用、最稳定、自动加 sitemap
  • 缺点:功能多、略重

Rank Math SEO(现在很火,很多人从 Yoast 转过来)

  • 后台路径:Rank Math → 通用设置 → robots.txt → 开启自定义
  • 自带语法检查、爬虫模拟测试,不容易写错。
  • 优点:免费版功能很强、界面干净、轻量
  • 缺点:中文适配一般

All in One SEO(AIOSEO,老牌,国内也常用)

  • 路径:AIOSEO → 工具 → robots.txt 编辑器
  • 直接输入规则即可。
  • 优点:中文好、稳定、老站常用
  • 缺点:免费版功能不如 Rank Math

2、纯 robots.txt 专用插件(轻量、只干一件事)

适合:不想装大 SEO 插件、只想简单改 robots.txt

Virtual Robots.txt(最老牌纯 robots 插件)

  • 直接在后台设置里编辑虚拟 robots.txt
  • 不生成物理文件,靠 WP 输出
  • 优点:超轻量、5 万 + 安装、简单
  • 缺点:功能少,不能测试爬虫

Admin Robots.txt Editor(简单稳定)

  • 后台:设置 → Robots-txt
  • 自动生成默认规则,可重置
  • 优点:极简、稳定、支持多站点
  • 缺点:更新频率一般

Robots.txt Quick Editor(轻量快速)

  • 在设置里加一个 robots.txt 编辑框
  • 兼容 Yoast、AIOSEO
  • 优点:小巧、权限控制严格
  • 缺点:界面简陋

Robots.txt Rewrite(可视化勾选)

  • 可以勾选式设置 Disallow 目录,不用手写
  • 自动检测物理 robots.txt
  • 优点:新手友好、可拖拽排序
  • 缺点:国内用得少

我是使用了Yoast SEO,直接在后台——>找到Yoast SEO——>工具——>点击文件编辑器即可对robots.txt文件进行修改了。

使用Yoast SEO 对robots.txt文件修改

屏蔽失效目录的「标准写法」

规则格式

Disallow: /目录名/
  • 必须带前后斜杠/old-dir/
  • 不要写完整 URL:只写相对路径
  • 子目录自动继承:屏蔽 /old//old/a//old/b/ 全被屏蔽

常见失效目录示例

Disallow: /2018/
Disallow: /2019/
Disallow: /old-theme/
Disallow: /old-plugin/
Disallow: /demo/
Disallow: /test/
Disallow: /backup/
Disallow: /temp/
Disallow: /deleted-posts/

二、修改Nginx配置对永久失效的返回410

  • 少量 404 正常,搜索引擎会自动处理
  • 大量 404 会浪费抓取配额,搜索引擎把时间花在死链上,新页面反而抓不到
  • 持续返回 404 的 URL,搜索引擎最终会从索引删除,这个过程可能要几周到几个月

1.如果只是转移了,可以使用301 告诉搜索引擎”永久搬家了”,会把权重转移到新地址。

2. 彻底没了的页面 → 返回 410 Gone

410 比 404 更明确,告诉搜索引擎”这个内容永久删除了”,删除索引更快:

编辑nginx配置文件,添加以下代码,根据自己情况修改

# 彻底不存在的旧路径
location ~ ^/html/ {
    return 410;
}

保存后,记得执行nginx -t 测试一下配置是否正确。

最后重载一下Nginx配置即可生效,接下来日志记录将会减少很多这些失效链接的爬取记录。

本文首发于 58Linux技术博客,专注Ubuntu桌面使用、Linux服务器运维与网站搭建实战。
       本系列的一部分

WordPress建站

Post 9 of 9

发表评论

粤ICP备10052831号 | © 2026 58Linux 技术笔记. All Rights Reserved. | 联系我们 | 关于本站
本站内容开放共享,仅供学习交流 | 专注 Ubuntu & Linux 实战教程
Built with GeneratePress