不乱于心,不困于情。
不畏将来,不念过往。如此,安好。

孤立页面和SEO:什么是孤立页面?如何找到它们?

您的网页是否具有排名和自然搜索流量潜力,但网站结构中缺少这些页面?还是故意不在您的网站结构中但Google仍在找到它们的页面?

答案可能是肯定的。至少,它适用于大多数网站!

这些被称为孤立页面,然后将好的页面重新附加到您的网站结构中,使您可以发挥它们的全部潜力(阻止搜索引擎蜘蛛与低价值页面一样!)。

 

那么,孤立页面到底是什么?

孤立页面是未链接到您网站上任何地方的页面。由于没有链接,因此网站访问者和网站爬网程序也找不到它们。

 

那么,如何找到孤立页面?

需要同时使用网站搜寻器和日志文件分析工具。使用网站搜寻器和日志文件分析工具查找孤立页面

如果网站搜寻器帮助您在站点结构中查找页面,则日志文件分析工具可以帮助您查找不在站点结构中的孤立页面。

我们谈论了很多您不知道Google存在的网站结构中的页面。这些是搜索引擎无法访问或无法访问的页面,在下面的图中用蓝色圆圈表示– Botify找到的页面(您可以从网站爬网中知道),而Google却没有(您可以从日志文件中了解)。

该图的另一侧(红色圆圈)表示Google找到的页面,但您的网站抓取工具没有找到,因为它们未链接到您网站上的任何地方。这些是您的孤立页面。

因此,Google遗漏的页面和孤立的页面是就像是一枚硬币的两个面,您需要访问网站的完整爬网和服务器日志文件才能找到它们。

为什么孤立页面对SEO不利?

孤立页面导致两个主要的SEO问题:

排名低和访问量低:即使孤立页面包含大量内容,但它们在SERP中的排名通常也不高,也无法获得大量的自然搜索流量。

浪费抓取资源:低价值的孤立页面(例如重复页面)可能会从您的重要页面上浪费抓取资源预算。

当孤立页面占Google在您网站上浏览的页面的很大一部分时,例如下面的示例中超过70%的页面,您就可以很好地了解问题的严重性。

如何修复孤立页面?

有两种孤立页面:

通常不需要关注的预料之内孤立页面

但是可能要关注的意外的孤立页面

修复孤立页面的方法取决于它们的类型。因此,当我们看到大量的孤立页面时,要做的第一件事就是检查以及是否需要它们。

预期的孤立页面:通常不会引起关注

一旦您运行网站爬网并将其与服务器日志文件进行比较,以查找Google正在查找但不在您的网站结构中的页面,则可以单击“由Google查找”以获取所有孤立页面的列表。

 

其中许多孤立页面将来自:

1.您的站点上当前不存在页面,但另一个站点正在链接到。通常,先获得指向页面的外部链接,然后将其删除或重定向。由于旧链接仍存在于其他网站上,因此Google仍会找到它。

解决方法:由于您无法控制其他网站上的链接,因此修复此类型的孤立页面的唯一方法是与网站所有者联系,并要求他们将页面更新到正确的新位置。

2.返回非200 状态代码的页面。即使在您的网站上进行了更正后,Google仍可能会选择抓取返回诸如4xx状态代码之类的页面。

解决方法: Google最终将停止抓取这些内容。没有什么可担心的。

3.过期的页面。这在具有大量短寿命页面的网站上很常见,例如,分类很快就会过期。

 

如何解决:我们应该只担心由Google发现的过期页面(如果它们长期处于孤立状态)的问题。否则,孤立页面的数量仅暗示网站的页面旋转速率,应视为值得深思的内容。

 

意外的孤立页面:可能引起关注的原因

1.过期的页面仍在返回内容。一些网站只是停止链接到过期的内容(例如从目录中删除的产品),而无法返回状态码(例如HTTP 404或410)以表明该内容不再存在。因此,旧页面仍然可用。

解决方法:除了删除指向过期内容的链接外,您还应确保使用正确的状态码更新过期页面。如果内容不再可用,请确保对其进行404或410。

2.先前站点迁移中遗漏的页面:这些页面没有被重定向,因此旧内容可能仍然可用。

解决方法:如果新网站上有类似内容,则应将这些旧网址重定向到。如果没有,则这些旧/遗漏的页面应返回404或410状态代码。

3.生成站点地图时发生语法错误:这些站点地图会创建错误的URL,这些URL仍会返回内容并创建重复的URL,或者返回HTTP错误。

如何解决:如果您发现由语法错误创建的错误URL,请和技术联系,共同制定解决方案。

4.生成规范标记时出现语法错误:这些标记会创建错误的URL。这些URL可能提供200个OK状态代码或错误代码。

如何解决:如果您发现由语法错误创建的错误URL,请和技术联系,共同制定解决方案。

5.在您的网站结构中未链接的高质量,重要页面:某些网站使用仅在满足一个或多个条件时才链接的导航页面(内容列表,例如类别页面或内部搜索结果页面)。例如,仅当列表不为空或达到最小项目数时,子类别才会出现在菜单中。无论是否出现自动化错误,在很多情况下我们都可能忽略链接到高价值页面。

解决方法:正确的方法是根据业务标准确定页面何时不再成为自然流量的目标,何时停止,将其彻底删除:删除链接并返回HTTP 404或410。在此之前,它应始终链接到网站上的某个位置。

页面过期后,它可以创建孤立页面。有时,这是正常现象并且是预期的。在其他情况下,这是不正常的,需要采取措施进行修复。

过期内容的预期和意外的孤立页面之间的区别在于HTTP状态代码。在这两种情况下,网页都是在Google抓取网页时链接到网站上的,而当Botify抓取工具浏览网站时,网页就不再链接了。然后,一旦内容过期,正常的孤立页面说它消失了(返回HTTP 404或410),而异常的页面仍然存在(返回HTTP 200)。

 

以下是发现日志分析差异的方法:

正常的孤立页面: HTTP 404页面的数量将稳定增长,HTTP 200的数量将相对稳定。

异常的孤立页面: HTTP 200的数量将随着时间的推移而不断增长。

那么,接下来呢?我们如何知道我们正在查看的孤立页面类型,以便我们知道要采取什么措施?

 

要分析日志!

如何分析您的孤立页面

让我们回到我们的示例(该网站的网页中有70%以上是孤立的)。在网站上,Google大约抓取了80万个孤立页面,比网站上浏览的30万个页面要多。

利用我们的网站抓取数据,我们还可以了解Google如何抓取孤立页面与网站结构中的页面之间的区别。从下面的示例中可以看到,按页面类型的分布与Google在网站结构中的分布有很大不同。

 

快速浏览LogAnalyzer的每日历史记录图可知,重定向了代表上图中61%的孤立页面的绿色页面:

历史记录图按状态码显示了该类别页面上Google的每日抓取量。页面几乎总是返回HTTP 301状态代码(永久重定向),以橙色显示为例。

此图还告诉我们哪些类型的孤立页面是活动的(即在分析的30天时间内,通过自然搜索产生了至少一次访问),并将其与网站结构中的活动页面进行了比较。如您所见,与网站结构中的页面相比,获得自然流量的孤立页面要少得多。

而且,也许甚至更重要的是,该报告指出了这是如何转化为整体有机访问的。在此网站上,只有5%的自然访问是由孤立页面产生的,这意味着该网站的自然访问中有95%来自网站结构中的页面,即使网站中只有30%的总页面也是在结构中。

在此示例中,在网站上(在结构中)产生79%的自然流量的页面类型,在孤立页面上也产生7%的流量。而且,在孤立页面上产生最多访问量的两类页面实际上是“其他”页面类型的大类,由于其在网站上的数量很少,因此未进行更精确的分类(上面的图将所有低于1%的值合并在一起,但报告可以显示更详细的信息)。

 

赞(0) 打赏
未经允许不得转载:seo优化_前端开发_渗透技术 » 孤立页面和SEO:什么是孤立页面?如何找到它们?

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏