O que é conteúdo duplicado para o Google e como evitá-lo

Um dos maiores erros para quem está querendo ganhar dinheiro com AdSense em um blog ou site, é copiar o conteúdo de outros sites e publicar sem tomar as devidas precauções técnicas. Além da questão ética e moral, de estar roubando o conteúdo dos outros, existe também uma razão técnica para não fazer isso.

Se você ainda não sabe o que é conteúdo duplicado para o Google, pode estar colocando o posicionamento do seu site nas páginas de respostas do buscador em risco.

Desde a revisão Panda, uma alteração do algoritmo de classificação de sites no Google, o conteúdo duplicado tem sido considerado um dos pecados mortais em termos de rankeamento de sites.

Por isso é importante que você saiba exatamente o que é conteúdo duplicado para orientar não só a produção de conteúdo, como também a própria estrutura do seu site ou do site onde você trabalha.

Por que o Google condena o conteúdo duplicado

É fácil entender este verdadeiro pavor que o Google tem pelo conteúdo duplicado. Como forma de garantir a qualidade das pesquisas feitas em seu buscador, o Google busca sempre apresentar em suas páginas de respostas, o conteúdo de maior relevância para seus usuários.

Se este usuário realiza uma busca, e os resultados são na verdade cópias de um mesmo conteúdo publicado anteriormente, é obvio que ele teria um grande problema com a qualidade destes resultados.

Dessa forma, o Google, em busca de qualidade de respostas nas SERPS, páginas de respostas, busca sempre exibir conteúdos que sejam exclusivos, podendo inclusive chegar ao ponto de punir severamente os sites que publicam conteúdos copiados de outros sites.

No caso dos afiliados do programa Google AdSense, a punição por conteúdo duplicado, pode chegar até mesmo ao encerramento da conta, uma vez que isso viola as diretrizes editoriais do programa, e portanto, é motivo para suspensão ou extinção a conta.

É por essa razão que é de suma importância saber o que é conteúdo duplicado para o Google, para que seu site não sofra uma penalização neste sentido. Sabendo o que é ou não considerado um caso de duplicidade de conteúdo, além de deixar seu site mais relevante, e melhor posicionado.

O que é conteúdo duplicado para o Google

Essa é uma outra discussão que se arrasta pela Internet e muitas vezes, por falta de conhecimento, algumas pessoas acabam confundindo citação com duplicidade de conteúdo e causando uma confusão ainda maior.

Basicamente, existem dois casos de duplicidade de conteúdo, que curiosamente recebe uma nomenclatura sutilmente diferente nas páginas de Diretrizes para Webmasters do Google. O primeiro caso é o Conteúdo Duplicado e o segundo é o Conteúdo Copiado.

No caso do Conteúdo Duplicado, em um grande número de vezes, na verdade, trata-se de problemas técnicos do próprio site ou falhas na hora da formatação do conteúdo. Abaixo listamos algumas destas situações:

  • Páginas iguais para diferentes versões – Alguns sites possuem páginas com o mesmo conteúdo, sendo uma delas para a visualização na web e outra para impressão. E ambas puderem ser lidas pelo Google, teremos aí um caso de conteúdo duplicado
  • Caminhos distintos para páginas iguais – Se o seu site tiver dois caminhos diferentes para páginas que no final apresentam o mesmo conteúdo, como no caso de blogs e sites em WordPress, com Categorias e Tags, sendo as duas idexáveis, teremos a duplicidade de conteúdo
  • Caminhos diferentes para a página inicial – Se o seu site trata da mesma forma o endereço seusite.com.br e seusite.com.br, teremos um caso clássico de conteúdo duplicado
  • Textos de outros sites – A publicação de textos inteiros ou fragmentos de textos sem a atribuição de link para a publicação original também é uma fonte comum de conteúdos duplicados

Como você pode ver, é importante saber o que é considerado como conteúdo duplicado para o Google, para poder evitar que situações, que a uma primeira vista, não passam de pequenos erros de estrutura ou formatação de conteúdo, não acabem por estragar o seu trabalho de otimização.

No vídeo abaixo, o engenheiro chefe de SEO do Google, Matt Cuts, faz algumas considerações sobre como o Google vê a questão da duplicidade de conteúdo.

O segundo caso, a Cópia de Conteúdo, é mais grave e infelizmente comum no Brasil. É a situação onde, deliberadamente o administrador do site copia o conteúdo publicado em outra fonte, sem os devidos créditos (menção e link para o artigo original) numa clara violação dos direitos autorais do seu criador.

Neste caso a punição do Google é bem mais severa e pode chegar até mesmo ao banimento do site nas páginas de respostas do buscador, o que equivale a pena de morte do site.

O que fazer para evitar ou corrigir a duplicidade de conteúdo

Agora que você já sabe o que é conteúdo duplicado, vamos ver o que você pode fazer para evita-lo ou corrigi-lo, caso o seu site tenha inadvertidamente incorrido neste erro.

A primeira providência para evitar o conteúdo duplicado passa pelo planejamento em SEO, para evitar que a estrutura do site acabe por gerar páginas duplicadas. Um bom analista de SEO sempre presta atenção a este detalhe quando elabora um projeto.

Se o site apresentar caminhos distintos para páginas iguais, por exemplo, basta marcar uma delas no a tag No Index e pronto, o Google não a indexará e isso não será considerado um caso de duplicidade de conteúdo.

Outra solução em alguns desses casos é usar o comando Redirect 301 para a página que irá agregar o conteúdo duplicado. Outra recomendação do Google é usar a Tag Canonical para indicar a página de referência para o conteúdo publicado.

Não se trata apenas de saber o que é conteúdo duplicado para o Google e desenvolver seu trabalho seguindo estas diretrizes. Muitas vezes trabalhamos em sites que estão gerando conteúdo duplicado e o gestor nem sabe. Cabe a você avisar para que isso não atrapalhe o seu trabalho.

É por isso que digo que o trabalho do redator e jornalista atualmente precisa ir muito além da simples criação de textos. É preciso entender como o Google classifica os sites, quais são suas diretrizes editoriais e outros parâmetro técnicos que influenciam no seu posicionamento nas páginas de respostas.

Agora que você já sabe o que é conteúdo duplicado para o Google, pense nestes parâmetros na hora de produzir, publicar e distribuir seu trabalho. Mantenha-se atualizado assinando nosso Boletim Informativo.

Por Alberto Valle, no site SEO Para Jornalistas

4.00 avg. rating (83% score) - 4 votes