不乱于心,不困于情。
不畏将来,不念过往。如此,安好。

什么是软404错误以及如何解决

技术性SEO的步骤之一是查找并修复404错误。404软错误可能非常令人困惑,因为在许多情况下,尚不清楚问题是什么,这使故障排除和修复过程变得繁琐。

在本问中,将了解有关软404错误的所有信息,包括它们的含义,如何查找以及如何修复它们。

什么是软404错误?

当无法找到用户请求的页面或页面无效并且服务器不返回正确的HTTP错误代码(未找到404或410)而是返回HTTP状态代码200 OK(成功)时,就会出现软404错误。

简而言之,这意味着当页面无效时,服务器将返回200 OK代码,告诉他们该页面有效,而不是为搜索引擎提供正确的错误代码以使它们忽略它。

结果,搜索引擎会继续抓取这些页面并在搜索结果中列出它们。

让我们看看导致软404错误的最常见原因是什么。

通常在以下情况下发生软404错误:

页面没有内容或内容很少。这使Google 认为该页面应返回404/410代码而不是200 OK代码。例如,空标签页不显示任何内容。

爬行存在暂时性问题。当Google尝试抓取该页面时,某些页面资源(CSS,JS)无法加载,因此该页面不包含任何内容,这使Google认为它应该是404。

Google将该页面错误地标记为“似乎是404”,而该页面没有任何问题。

为什么修复软404错误这么重要

查找和修复软404错误非常重要,因为:

这是一个坏习惯

页面应返回正确的HTTP状态代码。如果页面丢失,无效或不存在,则应返回404/410(未找到)或301(已移动)而不是200(成功代码)。

这是糟糕的用户体验

您不希望用户单击搜索引擎结果中的链接,然后进入您网站上没有内容或内容很少,对用户没有价值的页面。

您的抓取预算被浪费了

搜索引擎是要花时间来爬网您的重要页面,而不是花时间来爬网和索引404软页面。

HTTP状态码的作用是什么?

如果您对HTTP状态代码是什么以及它们的作用感到困惑,那么您所需要知道的是,这是一种帮助爬虫了解其获取页面的请求是成功,失败还是其他目的的一种方法。

每次搜索引擎搜寻器访问网页时,他们首先检查的是HTTP状态代码。HTTP响应代码是一个三位数的数字,告诉搜索引擎页面是否有效(代码200),未找到(404/410)或已移动(301)。

状态代码包含在页面标题中,并且仅对爬网程序可见,对用户不可见。

 

404 Not Found和404错误有什么区别?

404未找到错误和软404错误之间的区别在于,在404未找到错误的情况下,未找到该页面,并且返回的HTTP状态代码是404或410(正确对应于not found)。

在出现软404错误的情况下,找不到页面,但是该页面返回200成功代码,而不是返回HTTP状态代码404,这是令人误解的。

简而言之,对于这两种情况,页面响应代码都应该为404,但对于软404错误则不是这种情况。

另一个主要区别是404页面没有被搜索引擎索引,它们不会出现在搜索结果中,但是软404页面被搜索引擎索引了,它们可能出现在搜索结果中。

 

404错误和SEO

404错误会影响您的SEO和排名潜力吗?这要视情况而定。

在有效的情况下,正常和预期的页面为404。例如,当产品不再可用时,您可以向用户显示404页面,以使客户知道该特定产品已永久售罄。

另一个示例是您要从搜索结果中完全删除页面时。通过返回404状态代码,您可以告诉搜索引擎该页面已被永久删除。

对于软404错误,这比较棘手,因为在某些情况下该页面有效,但Google认为该页面无效,并且某些情况下该页面无效,并且您的服务器返回200 OK。

在这种情况下,最好调查错误原因并加以修复。

根据一般经验,您应该避免在网站上出现404错误,以优化抓取预算,避免混淆搜索引擎并为用户提供良好的体验。

 

如何找到软404错误?

查找404错误(找不到404错误和软404错误)的最可靠方法是通过Google搜索控制台,尤其是覆盖率报告和URL检查工具。

如果您尚未这样做,那么第一步是在谷歌搜素控制台索引你的网站。这将使你能够使用许多功能来改善SEO。

覆盖率报告

  • 登录到Google搜索控制台
  • 接下来,单击INDEX下的COVERAGE以查看COVERAGE REPORT。

使用谷歌搜索控制台的覆盖率报告查找软404错误

确保选择了“错误”选项卡,然后查找以下各项:

  • 提交的URL似乎是软404
  • 软404
  • 找不到(404)

单击错误描述以获取有关受影响页面的更多详细信息。

URL检查工具

查找HTTP状态响应代码的另一种方法是使用URL检查工具。

使用URL检查工具查找404错误

在“ URL检查”工具中输入URL,然后单击确定。单击查看草稿页,然后单击更多信息。将看到HTTP响应,如上面的屏幕快照所示。

 

提交的URL似乎是软404

“提交的URL似乎是软404”和“软404”错误代码之间有什么区别?

在网页被Google标记为软404之前,首先将其标记为“提交的URL似乎是软404”。

这样做是因为有时软404错误是暂时的,因此在Google做出最终决定之前,它将首先将页面标记为“似乎是软404”,如果问题仍然存在,则将其标记为软404。

如果在“错误”标签中将某个页面标记为“提交的URL”似乎是一个软404,则意味着如果该页面恢复在线状态,则Google将重试对该页面进行爬网并更改其状态。

当页面在EXCLUDED选项卡中的SOFT 404下显示时,意味着Google不再尝试为该页面建立索引,因为找不到该页面或因为使用NOINDEX页面指令对其进行了索引删除。

排除报告中的Soft 404错误

如何修复404错误

要摆脱软404错误,可以使用以下五个解决方案之一:

  • 检查页面是否确实是软404或错误警报
  • 配置您的服务器以返回正确的找不到错误代码(404/410)
  • 改善页面并请求索引
  • 使用301重定向来重定向页面
  • 将网页保留在您的网站上,但从搜索引擎中将其取消索引

 

检查页面是否确实是软404或错误警报

有时Google Search Console可能会错误地将页面标记为软404,因此第一步是检查情况是否如此。

  • 在覆盖率报告中单击“提交的URL似乎是软404”,以查看受影响页面的列表。
  • 将鼠标移到URL上,然后单击“在新选项卡中打开”按钮。

如果这是您网站的有效页面,并且您希望该页面显示在搜索结果中,请单击“验证修复”按钮。

点击“验证修复”,让Google知道404软错误已修复。

此操作将迫使Google重新抓取页面并更改其状态代码。此过程可能需要几天的时间,系统会通过电子邮件将结果通知您。

 

检查页面并测试实时URL

另一种方法是将鼠标移到URL上,然后选择INSPECT URL。这将为您提供有关页面的更多信息以及“请求索引”选项。

在执行此操作之前,您可以单击“实时测试URL”按钮来强制Google刷新报告。

在许多情况下,您可能会发现该页面正常,并且无需采取进一步措施。

 

配置您的服务器以返回正确的找不到错误代码(404/410)

如果页面确实不可用或无效,则应将网站配置为返回正确的HTTP响应代码(404或410),然后使用URL Inspection工具的REQUEST INDEXING按钮将页面重新提交给Google。

配置您的站点以返回无效页面的404代码的最简单方法是删除页面。通过删除页面,当未找到请求的URL时,HTTP服务器将显示404页面。

提示:拥有一个自定义的404页面非常重要,该页面为用户提供了他们下一步可以做什么的选项。404页面可以包含指向您的主页和最受欢迎页面的链接,甚至可以包含一个搜索框,以帮助用户找到所需的内容。

 

改善页面并请求索引

如果页面可用,但Google坚持认为该页面为软404,则可以改善页面的内容,然后通过“请求索引”按钮或通过“验证修复”将页面重新提交给Google。

通常,当页面的内容很少并且Google希望将其从索引中删除时,就会发生上述情况。

通过添加更多内容,您可以向搜索引擎显示该页面具有价值,并且404错误将消失。

 

使用301重定向来重定向页面

解决软404错误的另一种方法是将受影响的页面重定向到有效页面。这是通过在.htaccess文件中添加301重定向来完成的,它告诉搜索引擎页面已移至新位置。

它是这样的:

Redirect 301 /soft-404-page https://example.com/new-page-URL

添加301重定向时,您需要确保两个页面的内容相似。

最佳SEO做法要求在内容相似的页面上使用301重定向。不要重定向到不相似内容的页面,最好删除该页面并将其设置为返回404。

 

将网页保留在您的网站上,但从搜索引擎中将其取消索引

另一种选择是将页面保留在您的网站上,但在标头中添加noindex指令,以指示搜索引擎不要为特定页面编制索引。

您可以使用通过手动添加<meta name=”robots” content=”noindex,follow”/> 页面标题来实现。

执行此操作时,Google将不再在“错误”报告下显示该页面,但可以在“软404”部分下的“已排除”报告中看到它们。

赞(1)
未经允许不得转载:seo优化_前端开发_渗透技术 » 什么是软404错误以及如何解决