Contenido Duplicado y URL canónica

/Contenido Duplicado y URL canónica
  • contenido duplicado

Contenido Duplicado y URL canónica

¿Hay contenido duplicado en mi sitio? Como aquí nuestro asunto se refiere a SEO, para responder a esta pregunta, es importante saber lo que Google considera contenido duplicado.
Tener diferentes páginas con el mismo contenido en el sitio es lógico que se trata de contenido duplicado, pero no es tan simple, porque a veces se hace automáticamente sin tener conocimiento, especialmente en el caso de aquellos que utilizan las sociedades de gestión (por ejemplo, wordpress) o tiene varios dominios apuntando al mismo sitio.

Vamos a profundizar un poco más en este tema y tratar de explicar por qué usted debe preocuparse por el contenido duplicado que puede estar en su sitio o fuera de él a través de referencias, o incluso otras páginas que hacen copias de su información (sí hay personas que no tienen creatividad o son demasiado perezosas – vamos a ser buenos y parar con los adjetivos por aquí).

Tenga en cuenta que hacer búsquedas en los sitios y escribir su propio sitio web es muy diferente del famoso copying and pasting.
Hemos hablado mucho en otros artículos, pero siempre es bueno recordar que Google pretende mostrar en su búsqueda de resultados Información relevante para sus usuarios. Esta es una de las principales misiones de la empresa Google.

¿Qué beneficio tendría una búsqueda en Google que muestra en los 10 primeros resultados páginas con exactamente el mismo contenido?
En estos casos adivina lo que sucede. Una bella penalización de Google y el descenso de las posiciones de las páginas con contenido duplicado.

Como sucede la duplicación de contenido

Existen motivos voluntarios e involuntarios para el surgimiento del contenido duplicado en su sitio, por ejemplo:

  • Páginas de impresión – su sitio tiene páginas con direcciones diferentes, pero con idéntico contenido de las páginas de visualización y de impresión, y las dos direcciones URL son indexados en Google;
  • Copia voluntaria de contenido – Varios sitios institucionales, en lugar de producir contenido propio para el sitio, copian contenido de otros sitios y crean páginas con este contenido;
  • Scrapers – Con el fin de generar rápidamente contenido para miles de páginas, rentabilizando la operación con publicidad Adsense, surgen los sitios Web con contenido copiado de otros sitios en Internet. Para eso, se utiliza de scrapers, robots (programas) que buscan y leen el contenido de miles de páginas hablando de un determinado tema en la web y crean automáticamente páginas sobre el tema juntando estos trozos de sitios copiados, con el fin de mejorar posiciones en las búsquedas y obtener ganancias con mucho Adsense ;
  • Temas similares – Algunos sitios tienen el mismo pie de página, el mismo texto institucional al final de todas las páginas, por ejemplo;
  • Por fin lo que más me intriga. Algunas personas están seguros de que teniendo más de un dominio con palabras clave diferentes apuntando al mismo sitio, tendrán algún tipo de ventaja sobre sitios que tienen un solo dominio, principalmente en los casos de sitios multilingües;
  • Otro caso es que usted tiene http://www.meusite.com.br e http://meusite.com.br, en cuenta que una URL tiene “www” al principio y el otro no, bueno, no se sorprenda, pero para Google, son dos direcciones diferentes.

Cómo identificar el contenido duplicado

  • Búsqueda Google – Copia una frase de tu página y haz una búsqueda en Google por este fragmento seleccionado entre comillas. Cuando usted utiliza comillas en búsquedas por frases, google busca sitios que contengan exactamente el contenido de la frase. Si no aparece ninguna copia sólo su página aparecerá con el contenido elegido, de lo contrario aparecerán otros sitios de otros dominios.
  • Copyscape -La herramienta CopyScape Está diseñada para buscar contenido duplicado de una página. Los profesores suelen utilizar esta herramienta para buscar plagio en trabajos de sus alumnos. Proporcione una URL y la herramienta buscará en Internet por páginas con fragmentos duplicados de su contenido, Informando el porcentaje de fragmentos idénticos y destacando los fragmentos similares. Tiene una versión gratuita y una paga, ofreciendo más resultados;

¿Por qué debo preocuparme por el contenido duplicado?

Si no desea perder posiciones en Google con penalizaciones por contenido duplicado debe prestar atención a este tema y elegir empresas de marketing digital que tengan conocimiento para monitorear contenido duplicado y sepa resolver este serio problema en su SEO.

AGS Agencia Web siempre desarrolla sus proyectos utilizando prácticas de SEO White Hat, en otras palabras siendo éticos  y utilizando las prácticas recomendadas por los Buscadores evitando problemas para nuestros clientes generando contenido de calidad y exclusivo. De esta manera, la probabilidad de tener problemas con el contenido duplicado es muy pequeña, pero estamos siempre de ojo.

El algoritmo de Google es lo suficientemente inteligente para identificar pequeñas fallas involuntarias de sitios de calidad. Sin embargo, hay señales de que Google empezó a ser menos complaciente con estos deslizamientos.

Por otro lado, el algoritmo de Google puede interpretar el contenido original y mostrarlo de esa forma por encima de las páginas copiadas. Para eso, uno de los factores utilizados por él es la fecha de indexación del contenido. Cuanto más antiguo, mayor es la probabilidad de que ese contenido sea el original. Para saber con certeza absoluta si su contenido se considera duplicado utilizamos una herramienta ofrecida por el propio google llamada “webmaster tools” que va más allá de buscar contenidos duplicados, pero explicar el webmaster tools no es el foco de este artículo. Hablamos sobre eso en otra ocasión.

Algunas soluciones y precauciones

  • Denunciamos – Si su contenido ha sido copiado, denunciamos el plagio en la herramienta Webmasters do Google reportando el sitio que nos copió como Spam. No se garantiza que Google tome una acción en relación con la denuncia, pero es el primer paso.
  • Google identifica automáticamente la duplicidad de contenido y toma actitudes automáticamente, así que trabaja a nuestro favor. No olvide que en la mayoría de los casos usted mismo es el creador de contenido duplicado en su sitio.
  • En los casos de plagio entramos en contacto con el propietario del sitio que copió nuestro contenido para tratar de resolver el problema, si usted tiene un abogado pedirle que haga contacto.
  • Utiliza Copyscape en tu sitio, y ver si sus propias páginas aparecen con contenido duplicado. Si hay contenido duplicado, pida a su Agencia de Marketing Digital que efectúe las acciones necesarias para corregir el problema.
  • Haga una búsqueda en Google de la siguiente manera – (site:url-de-su-site.com) y buscar páginas de contenido idéntico. Este tipo de búsqueda muestra sólo las páginas de la url buscada indexadas en Google.
  • Redirect 301 – Si su sitio tiene páginas duplicadas, del tipo la versión con y sin WWW, o incluso si cambió alguna url de un contenido que permanecerá en el sitio utilice redirecciones permanentes (301) de una versión a la otra. Con eso usted está diciendo a google cuando él accede a la url antigua, que ésta cambió definitivamente a otra.
  • Especialmente en los casos de uso WWW o no es igual, puesto que se utiliza sólo y siempre uno de ellos, nunca los dos. Su servidor web debe tratar las dos versiones como una sola, haciendo una redirección permanente (301) de una.

URL’s CANÓNICAS o Canonical URL

Este es un método más sencillo que el anterior, pero también muy eficiente. La utilización de Canonical Tag nos permite informar a Google de qué página tiene el contenido original, de donde se copió el contenido, así que elegimos un dominio para ser el principal (que será indexado) avisando a Google que los demás se trata de copias del primero.
Así, Google sabe que debe indexar uno y no otro URL o dominio. Así evitamos al cliente el riesgo de sufrir alguna penalización.
En los casos de WordPress el plugin YOAST además de otras funciones resuelve el problema (claro debe estar correctamente configurado para tal función).

Conclusión:

Monitorear y evitar de todos modos el contenido duplicado en su sitio.
¿Dudas? Entrar en contacto o dejar un comentario. Comparta su conocimiento.

Sobre el Autor:

Ingeniero de software, autodidacta aficcionado por programación web y marketing digital.

Uno Comentario

  1. Jose Geek 13 de septiembre de 2017 at 12:12 - Respuesta

    Me ha gustado este artículo, muchas gracias por compartirlo y sigue así.

Deja un comentario