SEO 中的语义内容优化涉及评估语料库中的术语。确定文本中单词的相关性的方法之一是词频分析。词频(TF)只是著名的信息检索TF-IDF方法的一部分。另一部分是逆文档频率(IDF),让我们放大IDF。本周的文章解释了 IDF 的工作原理。我的目标是向您展示创建独特内容的重要性。当然,除了 SEO 之外,还有许多其他原因:声誉、知名度……
什么是逆文档频率(IDF)?
让我们举个例子:
在实践中,第一步是测量语料库(一组文档)中术语出现的频率。在这个例子中,我们看到“the”这个词出现在每个文档中,这没有提供任何信息来区分文档。
然而,“child”一词仅出现在 1,000 份文件中。显然,这个词为包含它的文档提供了区分元素。它是衡量一个术语的稀有程度的标准。
文档频率衡量相似性(文档在内容上有相似的术语的事实),这里我们更喜欢衡量稀有性。
公式如下:
别担心,这里有解释。对于每个术语,我们取语料库中的文档总数,然后除以包含该术语的文档数。这让我们可以衡量该术语的稀有程度。但是,我们不希望计算结果显示“child”这个词比“game”这个词重要 500 倍,因此我们对结果取以 10 为底的对数,以使该计算线性化。因此,从搜索引擎的角度来看,“儿童”比该语料库中的术语“游戏”相关度高 10 倍。
以下是这些术语的IDF 表:
您可以看到,最高分数是针对最稀有的术语。有趣的…
IDF 是做什么的?
“ IDF 作为唯一性的衡量标准”:从这个意义上讲,搜索引擎可以识别是什么使得给定的文档是独一无二的。对我来说,IDF 比术语出现的频率(关键字密度)提供的价值和信息要多得多。
让我们举个例子:
您想在搜索查询“户外游戏”时出现的 3600 万个网站中排名靠前吗?那么您就有数百万个竞争网站!根据您的内容质量,您在 Google 上针对该词条排名进入前 10 名的机会几乎为零。在这个竞争激烈的 SERP 中排名的唯一方法是研究其他排名因素,如链接建设、社交媒体等。
如果您是这个市场的新手,那么您就没有机会从竞争对手中脱颖而出!我的建议是寻找不同的替代方案:您应该使用附加术语来完成用户的请求。在我们的示例中,如果我们在“户外游戏创意”中添加“创意”一词,结果数量只有 340,000。承认吧,竞争力确实小了很多!
通过用生僻词语围绕你的主要主题,你终于有机会出现在 SERP 的第一页上。这就是为什么今天使用长尾关键词如此重要的原因!问自己正确的问题,回应搜索意图,你就会在网络上被看到!