对所谓 “重复内容” Duplicated Content如何影响SEO优化很多时候被误解。有些人说会引致被搜索引擎惩罚。对何爲搜索引擎惩罚亦有很多误解。最近一个客户问海瑶seo :想在网页内利用 CSS设定不同的桌面和手机排版布局,有需要将同一段内容重复,会否因重复内容而被搜索引擎惩罚。
互联网上重复内容是常态
首先互联网的世界就是充责着很多很多的重复内容。有些针对重复内容研究说 20% – 30%左右。例如:
当某网页引用其他网站的内容时,不免会重复对方网页上的一些内容。
又例如:当 Donald Trump赢出成为美国总统,很多媒体都可能是直接抄袭引用官方的生平简介。
网店很多时候亦会出现重复内容,例如:相同的产品描述出现在该产品页和产品分类下的该产品页。只要 URL网址不同搜索引擎就看成不同的页面。
更普遍的例子是同一网站支援加密连线 HTTPS和非加密连线 HTTP ,由于 HTTP和 HTTPS被搜索引擎看作不同网址,所以亦可看作重复内容。
何为搜索引擎惩罚
搜索引擎是不会对有重复内容的网页惩罚处理。所谓惩罚是指搜索引擎公司将该页面从索引数据库中抽走,导致搜索用户不可能从任何搜索查询中找到该网页。再进一步,当整个网站被惩罚时搜索引擎公司会将该网站的全部网页从索引数据库中抽走,导致搜索用户不可能从任何搜索查询中找到该网站的任何网页。搜索引擎发现网页或网站涉及不当的人为操控搜索排名而将网页原应有的排名为下调亦一般被视作搜索引擎惩罚。
不惩罚不等于喜欢。搜索引擎不喜欢重复的网页内容。理由是:搜索引擎认为Query Deserves Diversity(QDD),应份给予搜索用户多样性的 SERP结果。重复的网页内容对搜索引擎来说是对搜索用户提出的查询给出的相同答案,只是网址不同,内容大致是相同。所以搜索引擎只会从相同答案中抽取最好的一个网址放入搜索排名结果页面,其他相同答案被筛走。而这个筛走结果常常被误解为搜索引擎惩罚。
一般只有当网站内容大量是一字一句抄袭其他网站而对用户毫无价值并且目标是操控SEO排名时,搜索引擎才会引入惩罚。
网站内重复内容
网站内重复内容更多情况是影响搜索排名的质量评分。搜索引擎亦会对搜索排名结果进行就质量进行过滤,这是以前 Panda更生做的工作,自 Panda 4.2?已经整合在搜索引擎的算法内。可视作为搜索引擎认为:Query Deserves Quality.所以如果将相同一段内容在同一网页上重复很多次,质量评分和用户体验都自然下降,不利搜索排名。
但先前的客户的提问又不同。理由是相同段落一个版本是给桌上计算机,一个是给手机。而当搜索引擎的索引机械人检索阁下的网站时,现在身份是扮作桌上计算机。但由于手机浏览量已经超过桌上计算机,不久将来索引机械人会是扮作手机。由放索引机械人身份只有一个,所以根本不会看到相同内容。
网站内重复内容最大的伤害是:如果是本身网站内的网页内容重复,你希望就目标关键字是用网页 A排名,而搜索引擎可能觉得重复内容网页 B更适合,并使用网页 B在 SERP结果。这就是cannibalization?问题。
其他网站抄袭内容
重复内容最大的伤害更多时候是其他网站抄袭你的内容而导致搜索引擎因为 QDD筛走你的原创内容而不是抄袭者的内容。本网志其中一些文章 (例如:”网站中文字体问题“)就被其他网站抄袭。你当然可以通过DMAC?请求 Google采取行动,例如:将抄袭者的网页从索引数据库中移走或者将抄袭者的网页资量大幅降分。
了解搜索引擎从一篮子相同内容但不同网址中以什麽条件筛选最好网页,可能有助你跳过冗长 DMAC上诉程序将抄袭者击败。其中一个条件当然是网站权威性。原创性不是搜索引擎的主要考虑,所以发布日期更先者不一定被筛选出来。理由搜索引擎认为后发布者可能对内容有所改进而值得被筛选出来。这是Query Deserves Freshness的概念。加入结构描述 schema可能有点帮助但亦非绝对。
来源:海瑶SEO(http://seo.cao4.net/)欢迎分享,谢谢。