Desmitificando la penalización por contenido duplicado

Contenido duplicado. Es un tema que tiene algo. No paramos de escribir acerca de ello, y la gente no para de preguntar sobre ello. En particular, todavía oigo a un montón de webmasters preocupándose por cuándo pueden tener una “penalización por contenido duplicado“.

Prohibido duplicar contenido.

Vamos a aclarar esto de una vez por todas, amigos: No existe algo como una “penalización por contenido duplicado“. Al menos, no de la manera que la mayoría de gente entiende cuando lo dicen.

Hay algunas penalizaciones que están relacionadas con la idea de tener el mismo contenido que otro sitio – por ejemplo, si estás extrayendo contenido de otros sitios y republicándolo (scraping), o si republicas contenido sin añadir ningún valor añadido. Estas tácticas están claramente perfiladas (y desaconsejadas) en nuestras directrices para Webmasters:

(Ten en cuenta que mientras que extraer contenidos de otros está desaconsejado, tener a otros robándote a ti es una historia diferente; mira esta entrada si estás preocupado acerca de que te roben contenido).

Pero la mayoría de los dueños de sitios que he escuchado preocuparse acerca de contenido duplicado no están hablando acerca de “scraping” o granjas de dominios; están hablando acerca de cosas como tener mútiples URLs en el mismo dominio que apuntan al mismo contenido. Como www.ejemplo.com/monopatines.asp?color=negro&marca=riedell y www.ejemplo.com/monopatines.asp?marca=riedell&color=negro. Tener este tipo de contenido duplicado en tu sitio puede afectar potencialmente al rendimiento de tu sitio, pero no provoca penalizaciones. De nuestro artículo contenido duplicado:

El contenido duplicado de un sitio no implica que deban tomarse medidas al respecto a menos que aparentemente el objetivo sea engañar y manipular los resultados de los motores de búsqueda. Si su sitio tiene problemas relacionados con contenido duplicado y no sigue nuestros consejos anteriores, conocemos muy bien la manera de elegir la versión adecuada para mostrarla en los resultados de la búsqueda.

Este tipo de duplicación no maliciosa es bastante común, especialmente desde que muchos CMSs no manejan esto bien de forma predeterminada. Así que cuando la gente dice que tener este tipo de contenido duplicado puede afectar a tu sitio, no es porque vayas a ser penalizado; es simplemente debido a la manera en que sitios web y motores de búsqueda funcionan.

La mayoría de motores de búsqueda luchan por cierto nivel de variedad; quieren mostrarte diez resultados diferentes en una página de resultados de búsqueda, no diez URLs que tienen el mismo contenido. A este fin, Google intenta filtrar aparte documentos duplicados para que la experiencia de los usuarios sea menos redundante. Puedes encontrar detalles en esta entrada del blog de Google Webmaster Central, que plantea:

  1. Cuando detectamos contenido duplicado, tal como a través de variaciones causadas por parámetros de URL, englobamos las URLs en un grupo.
  2. Seleccionamos la que pensamos que es la “mejor” URL para representar el grupo en los resultados de búsqueda.
  3. Entonces consolidamos las propiedades de las URLs en el grupo, tal como la popularidad del enlace, a la URL representativa.

Aquí está cómo podría esto afectarte como webmaster:

  • En el paso 2, la idea de Google de cuál es la “mejor” URL podría no ser la misma que la tuya. Si quieres tener control sobre cuando www.ejemplo.com/monopatines.asp?color=negro&marca=riedell o www.ejemplo.com/monopatines.asp?marca=riedell&color=negro se muestran en nuestros resultados de búsqueda, puede que quieras tomar la acción de mitigar tu duplicación. Una forma de decirnos qué URL prefieres es incluir la URL preferida en tu mapa del sitio.
  • En el paso 3, si no somos capaces de detectar todos los duplicados de una página en particular, no seremos capaces de consolidar todas sus propiedades. Esto puede diluir la fuerza de las señales de evaluación de ese contenido al dividirlas a través de múltiples URLs.
Logotipo de Google Webmaster Central

Logotipo de Google Webmaster Central

En la mayoría de los casos Google hace un buen trabajo al manejar este tipo de duplicación. No obstante, puede que también quieras considerar contenido que está siendo duplicado a través de dominios. En particular, decidir la construcción de un sitio cuyo propósito intrínsicamente implica la duplicación de contenido es algo sobre lo que deberías pensar dos veces si tu modelo de negocio va a depender del tráfico de las búsquedas, a menos que puedas añadir un montón de valor añadido para los usuarios. Por ejemplo, a veces tenemos noticias de afiliados de Amazon.com que están pasando un mal momento de posicionamiento por contenido que se origina únicamente desde Amazon. ¿Es esto porque Google quiere que paren de vender Everyone Poops?, no; es debido a ¿cómo demonios van a bajar el posicionamiento de Amazon si ellos están proporcionando exactamente el mismo listado?, Amazon tiene un montón de autoridad en en comercio electrónico (muy probablemente más que la que tiene un típico sitio afiliado de Amazon), y el usuario medio del buscador Google probablemente quiere la información original de Amazon, a menos que el sitio afiliado haya añadido una cantidad significante de valor añadido.

Por último, considerar el efecto que la duplicación puede tener en el ancho de banda de nuestro sitio. El contenido duplicado puede llevar a un indexado ineficiente: cuando el bot de Google descubre diez URLs en tu sitio, tiene que rastrear cada una de estas URLs antes de saber cuáles tienen el mismo contenido (y por lo tanto antes de que podamos agruparlas como se ha descrito anteriormente). Contra más tiempo y recursos emplea el bot de Google rastreando contenido duplicado a través de múltiples URLs, menos tiempo tiene para obtener el resto de tu contenido.

En resumen: Tener contenido duplicado puede afectar a tu sitio de varias maneras; pero a menos que hayas estado duplicando deliberadamente, es poco probable que una de esas maneras sea una penalización. Esto significa que:

  • Normalmente no necesitas enviar una petición de reconsideración cuando estás haciendo limpieza de contenido inocentemente duplicado.
  • Si eres un webmaster de conocimientos básicos a intermedios, probablemente no necesitas poner demasiado esfuerzo en preocuparte del contenido duplicado, ya que la mayoría de motores de búsqueda tienen formas de gestionarlo.
  • Puedes ayudar a tus compañeros webmaster ¡no perpetuando el mito de las penalizaciones por contenido duplicado!. Los remedios para el contenido duplicado están totalmente en tus manos. Aquí hay algunos buenos sitios donde comenzar.

NOTA: Este artículo es una traducción realizada por mí de Demystifying the “duplicate content penalty”, escrito por publicado en el blog oficial de Google Webmaster Central. (El resaltado en negrita de algunas frases lo he añadido yo).

Un pensamiento en “Desmitificando la penalización por contenido duplicado

Deja un comentario

Tu dirección de email no será publicada. Campos obligatorios marcados con *

Puedes usar estas etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">