
今天,我想和大家分享一些关于倒排索引的事情。为什么我们说倒数索引当用户搜索一个词时,返回的搜索结果页面按照倒排索引和一系列过滤算法进行排序。SEO不是刻苦追求的排名数吗
流行的说法是,搜索引擎的索引就像我们平时看书的目录。为了使人们更快地找到适合自己的东西,比如导航站,其实就是一个结构性很小的例子,在网上索引。
索引是搜索引擎的核心技术之一,因为在大量的网页中,如何更快、更准确地发现用户查询词的搜索意图
1。文档:我们看到的是网页形式的互联网页面,网页包含很多东西,比如:TXT、EXCEL、PDF和许多其他各种文档都已制成文档。
5。倒排索引:在由搜索引起的索引数据库中,它是一个带有单词的相应网页的存储形式。它可以快速地获得相关的文件根据文字。
事实上,倒排索引非常简单。现在我们将结合一些特征案例深入分析该算法。首先,我们可以理解一些基本的想法。
上面的图是对应于每个文档号的不同文档,例如对应于小明早餐的第一个文档、对应于小明早餐的第二个文档等等。
此外,由于英汉文化属性的不同,汉字之间没有英语单词这样的分隔符。索引首先将中文单词进行划分(在下面的示例中暂时不删除停止单词),从而将句子逐个转换成短语,如下图所示。
上面图片中的单词ID记录每个单词的数目。第二列是对应于数字的单词。第三列是包含该词的文档。
例如,单词号为1的小明被安排在倒排表1、2、4、5中,表明该单词包含在这些文档集合中。事实上,搜索引擎更加复杂。他们不仅记录了单词的文档数量,还记录了单词的频率(TF,这是什么意思)很多SEO从业者都在谈论关键词的密度。
在不讨论哪个公式计算更准确的情况下,我们发现,关键字的数目出现在公式中,而TF是单词出现在页面上的次数。
这个TF分析当搜索引擎计算搜索结果的排名时,查询词和文档库中的哪个文档更相关。
上面的图比较复杂。让我们来看看文档频率是包含这个词的多个文档,比如小明出现在四个文档中。吃饭出现在四个文档中,等等。倒排的列表是小明(1;1),1是文档1,中间的一个是出现在文档中的单词的频率。耳鼻喉。它是文档1中出现的单词的位置,即文档中的第一个单词。
实际应用中,更多的是在纸面上,最好通过实战来验证这个论点,看它对排名是否有帮助。现在让我们来看看。
主页,排名第三,上海鼎正小吃培训学校早期培训生煎包培训烧烤培训是全国最专业的…
主页,排名第四,上海早餐培训|重庆面条培训|山东杂粮饼培训|盐水培训|快餐培训...迷恋。
主页,排名第八,小吃培训,早期培训,上海面条培训,上海德智美食培训中心021-…
主页,排名第九,早餐店特许经营营养早餐特许经营特色早餐特许经营早餐店特许经营培训开业
分析表明:这10个网站的早期培训基本上都是以两个词语出现的,你觉得早餐和早餐是同义词吗一次,就是三次。在这里,我们提醒你不要建立关键字,而是保持自然的性质。
另外,根据前面的实验数据,标题最左边的单词权重最高。仅结合这两点,排名靠前的网站标题比其他网站标题要好。此外,在标题的最后,{免费食宿}是吸引用户点击的营销点,所以标题是技术和艺术的结合。
从以上两张图片可以看出,本网站从2017年12月11日起重为0,4天后重达1,或相对容易。为什么有些SEOER每天更新文章,但是网站排名不能做到呢一些合作伙伴说,如果他们不写文章,他们不知道每天该做什么。
在我看来,这并不是影响排名的重要因素,因为网站前信任可以节省很多以后的事情(PS:这是佛教SEO,让网站本身排名)。
通过上面的图片,我们发现早期培训一词始终是首个出现在网页上,非常稳定,因此通过算法对网站进行优化是非常可靠的。
搜索引擎是世界上最复杂的程序之一。有许多开放的算法。有兴趣的合作伙伴可以查看他们申请专利的搜索引擎公司的文档。它还涉及高等数学和其他知识。如果你能坚持观察它,并将其与实践相结合,那么你就可以优化它。网站不再需要猜测排名。