首页 » 我们的 LDA 结果与 Google排名的相关性

我们的 LDA 结果与 Google排名的相关性

顺便说一句 – 在 LDA 向量空间模型中,主题不会具有像“狗”和“猫”这样的精确标签关联,而是像“围绕狗主题的向量”这样的东西。

遗憾的是,我无法真正想象这一步之后的具体过程,因为它依赖于将上述简单模型扩展至数千或数百万个主题,每个主题都有其自身的维度(任何尝试过的人都知道,在博客文章中绘制超过三维的维度非常困难)。使用此结构,该模型可以计算任何单词或词组与其创建的主题之间的相似度。您可以阅读斯坦福大学的《信息检索导论》一文,其中有专门关于向量空间模型的章节,了解更多相关信息。

在过去的十个月里

Ben(在其他 SEOmoz 团队成员的 电报数据库 帮助下)基于相对简单的 LDA 实现构建了一个主题建模系统。虽然这项工作本身就颇具挑战性,但我们或许并非第一个专注于 SEO 的机构这样做,但可能是第一个将其公开发布的机构。

当我们最初开始这项研究时,我们并不知道LDA/主题建模会对搜索引擎产生什么样的影响。因此,研究完成后,我们非常兴奋(甚至欣喜若狂)地看到了以下结果:

 

Google.com 排名与各项单一指标之间的相关性

(图中垂直的蓝色条表示标准误差,由于样本量较大,所以标准误差相对较低)
使用我们在 SMX Advanced 上发布 Google 与 Bing 相 沙特化对劳动力的影响 关性/排名数据时所采用的相同过程(我们在此处发布了有关该过程的更多详细信息),我们展示了大多数 SEO 人员熟悉的一组指标与一些 LDA 结果的 Spearman 相关性,包括:

  • TF*IDF – 经典的词条权重公式,TF*IDF 比关键词密度等更原始的指标更准确地衡量关键词的使用情况。在本例中,我们只取出现在 Google 排名中的页面内容的 TF*IDF 分数。
  • 已关注 IP – 这是我们基于单链接的指标中相关性最高的指标,它显示了托管包含指向该 URL 的已关注链接的网站的唯一 IP 地址数量。正如我们过去所展示的,使用页面权威性

LDA 得分与排名的相关性令人难以置信

当然,它们并非完全相关,但 WhatsApp 数据库印度 考虑到 Google 排名算法的复杂性及其所涉及的众多因素,这种相关性也并非不可预期。然而,看到 LDA 得分呈现出如此显著的结果,我们不禁认真思考这其中是否存在因果关系(我们希望通过我们的排名模型进行更多研究,以尝试证明这种影响)。或许,好的链接更有可能通过主题模型或 Google 算法的其他方面指向更“相关”的页面,而我们目前尚不清楚这些页面会自然地偏向这些页面。

 

滚动至顶部