什么是网页相似度呢?

seo优化 2018-10-28 14:27www.168986.cn长沙seo优化

  什么是网页相似度呢?

  所谓网页相似度,简单的说就是两个网页的相似程度。这两个网页可以是同一个网站上的网页,也可以不是同一个网站上的网页,也既是其他网站上的网页。搜索引擎在收录网页的时候,通常会对两个网页进行比较,看看两个网页是否相似。所谓相似,就是说两个网页在页面内容的大部分都是相同的,这时候就可以认为两个网页是相似的。搜索引擎在比较两个网页的时候,是采用一定的算法来进行比较,搜索引擎通常会采用两种方法来进行比较:一种是根据网页摘要来比较,如果多个网页摘要的 md5 值一样,证明这些网页具有很高的相似度。另一种是根据网页出现的关键词,按照词频排序,可以取N个词频高的,如果其 md5 值一样,则可以认为这些网页有很高的相似度。谷歌搜索引擎给网页相似度设定的比例是60%,也就是说如果两个网页的相似度超过60%,那么被比较的网页不再被收录,如果相似度接近60%,那么被比较的网页可能也会被收录,但是搜索引擎给予的权重则比较低。这就是搜索引擎对待网页相似度的态度。由此可见,网页相似度对我们的网站的影响主要在于被比较的网页是否能够被收录,对其他方面则基本没什么影响。

Copyright © 2016-2025 www.168986.cn 狼蚁网络 版权所有 Power by