孤立页面和SEO：什么是孤立页面？如何找到它们？

您的网页是否具有排名和自然搜索流量潜力，但网站结构中缺少这些页面？还是故意不在您的网站结构中但Google仍在找到它们的页面？

答案可能是肯定的。至少，它适用于大多数网站！

这些被称为孤立页面，然后将好的页面重新附加到您的网站结构中，使您可以发挥它们的全部潜力（阻止搜索引擎蜘蛛与低价值页面一样！）。

那么，孤立页面到底是什么？

孤立页面是未链接到您网站上任何地方的页面。由于没有链接，因此网站访问者和网站爬网程序也找不到它们。

那么，如何找到孤立页面？

需要同时使用网站搜寻器和日志文件分析工具。使用网站搜寻器和日志文件分析工具查找孤立页面

如果网站搜寻器帮助您在站点结构中查找页面，则日志文件分析工具可以帮助您查找不在站点结构中的孤立页面。

我们谈论了很多您不知道Google存在的网站结构中的页面。这些是搜索引擎无法访问或无法访问的页面，在下面的图中用蓝色圆圈表示– Botify找到的页面（您可以从网站爬网中知道），而Google却没有（您可以从日志文件中了解）。

该图的另一侧（红色圆圈）表示Google找到的页面，但您的网站抓取工具没有找到，因为它们未链接到您网站上的任何地方。这些是您的孤立页面。

因此，Google遗漏的页面和孤立的页面是就像是一枚硬币的两个面，您需要访问网站的完整爬网和服务器日志文件才能找到它们。

图1–孤立页面和SEO：什么是孤立页面？如何找到它们？–seo优化_前端开发_渗透技术

图2–孤立页面和SEO：什么是孤立页面？如何找到它们？–seo优化_前端开发_渗透技术

为什么孤立页面对SEO不利？

孤立页面导致两个主要的SEO问题：

排名低和访问量低：即使孤立页面包含大量内容，但它们在SERP中的排名通常也不高，也无法获得大量的自然搜索流量。

浪费抓取资源：低价值的孤立页面（例如重复页面）可能会从您的重要页面上浪费抓取资源预算。

当孤立页面占Google在您网站上浏览的页面的很大一部分时，例如下面的示例中超过70％的页面，您就可以很好地了解问题的严重性。

图3–孤立页面和SEO：什么是孤立页面？如何找到它们？–seo优化_前端开发_渗透技术

图4–孤立页面和SEO：什么是孤立页面？如何找到它们？–seo优化_前端开发_渗透技术

如何修复孤立页面？

有两种孤立页面：

通常不需要关注的预料之内孤立页面

但是可能要关注的意外的孤立页面

修复孤立页面的方法取决于它们的类型。因此，当我们看到大量的孤立页面时，要做的第一件事就是检查以及是否需要它们。

预期的孤立页面：通常不会引起关注

一旦您运行网站爬网并将其与服务器日志文件进行比较，以查找Google正在查找但不在您的网站结构中的页面，则可以单击“由Google查找”以获取所有孤立页面的列表。

其中许多孤立页面将来自：

1.您的站点上当前不存在页面，但另一个站点正在链接到。通常，先获得指向页面的外部链接，然后将其删除或重定向。由于旧链接仍存在于其他网站上，因此Google仍会找到它。

解决方法：由于您无法控制其他网站上的链接，因此修复此类型的孤立页面的唯一方法是与网站所有者联系，并要求他们将页面更新到正确的新位置。

2.返回非200 状态代码的页面。即使在您的网站上进行了更正后，Google仍可能会选择抓取返回诸如4xx状态代码之类的页面。

解决方法： Google最终将停止抓取这些内容。没有什么可担心的。

3.过期的页面。这在具有大量短寿命页面的网站上很常见，例如，分类很快就会过期。

如何解决：我们应该只担心由Google发现的过期页面（如果它们长期处于孤立状态）的问题。否则，孤立页面的数量仅暗示网站的页面旋转速率，应视为值得深思的内容。

意外的孤立页面：可能引起关注的原因

1.过期的页面仍在返回内容。一些网站只是停止链接到过期的内容（例如从目录中删除的产品），而无法返回状态码（例如HTTP 404或410）以表明该内容不再存在。因此，旧页面仍然可用。

解决方法：除了删除指向过期内容的链接外，您还应确保使用正确的状态码更新过期页面。如果内容不再可用，请确保对其进行404或410。

2.先前站点迁移中遗漏的页面：这些页面没有被重定向，因此旧内容可能仍然可用。

解决方法：如果新网站上有类似内容，则应将这些旧网址重定向到。如果没有，则这些旧/遗漏的页面应返回404或410状态代码。

3.生成站点地图时发生语法错误：这些站点地图会创建错误的URL，这些URL仍会返回内容并创建重复的URL，或者返回HTTP错误。

如何解决：如果您发现由语法错误创建的错误URL，请和技术联系，共同制定解决方案。

4.生成规范标记时出现语法错误：这些标记会创建错误的URL。这些URL可能提供200个OK状态代码或错误代码。

如何解决：如果您发现由语法错误创建的错误URL，请和技术联系，共同制定解决方案。

5.在您的网站结构中未链接的高质量，重要页面：某些网站使用仅在满足一个或多个条件时才链接的导航页面（内容列表，例如类别页面或内部搜索结果页面）。例如，仅当列表不为空或达到最小项目数时，子类别才会出现在菜单中。无论是否出现自动化错误，在很多情况下我们都可能忽略链接到高价值页面。

解决方法：正确的方法是根据业务标准确定页面何时不再成为自然流量的目标，何时停止，将其彻底删除：删除链接并返回HTTP 404或410。在此之前，它应始终链接到网站上的某个位置。

图5–孤立页面和SEO：什么是孤立页面？如何找到它们？–seo优化_前端开发_渗透技术

页面过期后，它可以创建孤立页面。有时，这是正常现象并且是预期的。在其他情况下，这是不正常的，需要采取措施进行修复。

过期内容的预期和意外的孤立页面之间的区别在于HTTP状态代码。在这两种情况下，网页都是在Google抓取网页时链接到网站上的，而当Botify抓取工具浏览网站时，网页就不再链接了。然后，一旦内容过期，正常的孤立页面说它消失了（返回HTTP 404或410），而异常的页面仍然存在（返回HTTP 200）。

以下是发现日志分析差异的方法：

正常的孤立页面： HTTP 404页面的数量将稳定增长，HTTP 200的数量将相对稳定。

异常的孤立页面： HTTP 200的数量将随着时间的推移而不断增长。

那么，接下来呢？我们如何知道我们正在查看的孤立页面类型，以便我们知道要采取什么措施？

要分析日志！

如何分析您的孤立页面

让我们回到我们的示例（该网站的网页中有70％以上是孤立的）。在网站上，Google大约抓取了80万个孤立页面，比网站上浏览的30万个页面要多。

利用我们的网站抓取数据，我们还可以了解Google如何抓取孤立页面与网站结构中的页面之间的区别。从下面的示例中可以看到，按页面类型的分布与Google在网站结构中的分布有很大不同。

图6–孤立页面和SEO：什么是孤立页面？如何找到它们？–seo优化_前端开发_渗透技术