SEO

¿Qué es el contenido duplicado (plagio) y su impacto en el SEO?

índice

¡Dale a Compartir¡

¿Qué es el contenido duplicado (plagio) y su impacto en el SEO?

Los problemas de contenido duplicado son comunes en SEO y pueden afectar negativamente sus esfuerzos de SEO y su clasificación en los resultados de Google y el tráfico en línea.

El contenido duplicado sería uno de los 5 problemas más comunes en SEO. A partir de esta observación, me parece importante abordar este tema para saber cuáles son las causas que pueden llevar a Google a considerar que el contenido está duplicado, con consecuencias nefastas en su labor de adquirir visibilidad y tráfico. La calidad del contenido en SEO comienza con textos únicos, dentro y fuera del sitio.

¿Qué es el contenido duplicado en SEO?

El contenido duplicado se refiere a texto que es muy similar o exactamente igual. El que aparece en Internet en varios lugares. Estas ubicaciones están definidas por direcciones de sitios web únicas (URL). Entonces, si el mismo contenido aparece en varias direcciones web, tiene contenido duplicado.

El contenido duplicado se puede encontrar en diferentes sitios, pero también dentro del mismo sitio. Se estima que el 25-30% de la web se compone de contenido duplicado. Agrega poco o ningún valor a sus visitantes. Por lo tanto, las URL con poco o ningún cuerpo también se consideran duplicadas.

Tiene varias desventajas:

  • Aporta poco o ningún valor añadido al motor de búsqueda, ni a sus visitantes;
  • Pueden dañar su trabajo de SEO;
  • Puede tener muchos orígenes intencionales o no intencionales.

¿Por qué Google lucha contra el contenido duplicado?

El primer objetivo de la empresa de Mountain View es ofrecer a sus usuarios una experiencia óptima en cuanto a la búsqueda de su motor. El segundo es ahorrar recursos centrándose en textos legítimos y únicos.

A partir de estas dos observaciones, es importante que el motor de búsqueda luche contra aquellos que no aportan ningún valor en particular. Google por tanto valora y premia el original. Es una excelente manera de aumentar el costo de SEO mientras se crea una mejor experiencia de usuario.

Cuando Googlebot visita su sitio, guarda el contenido en sus bases de datos. Se compara con otros en la base de datos. Si se encuentran coincidencias sustanciales, Google puede decidir que su contenido está duplicado. Él decidirá qué versión es la más confiable y la más digna de ser presentada a los usuarios de Internet.

La duplicación es un problema real cuando tiene varias versiones del mismo texto en su sitio. En estos casos, puede ser difícil elegir qué página mostrar.

¿Cuáles son los problemas con el SEO?

La duplicación puede tener repercusiones significativas en su SEO dependiendo de si es interno o externo. El contenido duplicado interno y externo plantea estas preocupaciones:

  • Presupuesto de rastreo no optimizado: Google limita sus visitas a su sitio para optimizar los recursos. Demasiado contenido duplicado puede desperdiciar ese presupuesto de rastreo e impedir la centralización de recursos de indexación en contenido único e importante.
  • Penalizaciones: las urls con muy poco contenido desarrollado pueden ser consideradas como duplicadas o demasiado similares y resultar en penalizaciones. Es importante evitar generar páginas automáticamente con textos pobres sin valor añadido
  • Dilución de enlaces:  al ofrecer diferentes URL para el mismo contenido, aumenta las posibilidades de recibir enlaces externos en varias páginas en lugar de centralizar los backlinks en una sola URL. Google tendrá dificultades para consolidar las métricas de enlaces, especialmente cuando otros sitios se vinculan a varias versiones.
  • Falta de control sobre el posicionamiento: cuando Google detecta urls duplicadas (título, descripciones, texto, etc.), generalmente favorece una página y puede mostrar otra diferente a la que quiere destacar.
  • Determinar quién es el original: cuando hay varias versiones disponibles, es difícil determinar qué versión mostrar en los resultados de búsqueda y quién es el autor original. Si se duplica en un sitio con mayor autoridad que el sitio copiado, la autoría puede atribuirse al sitio del copiador con mayor autoridad.

¿Existe una penalización por contenido duplicado?

La duplicación puede perjudicar su rendimiento de SEO, pero no generará ninguna penalización hasta que copie intencionalmente el sitio web de otra persona. Si es un propietario honesto de un sitio y se encuentra con problemas técnicos sin tratar de engañar a Google, no tiene que preocuparse por una sanción por parte de ellos. Si ha copiado intencionalmente grandes cantidades de contenido de otros sitios, se encuentra en una situación difícil.

¿Cuáles son las principales causas del contenido duplicado?

Estos problemas pueden tener muchos orígenes que son más o menos fáciles de identificar dependiendo de si es un especialista en SEO o no. Vamos a enumerar aquí los principales orígenes que provocan la duplicación de contenidos.

Robo y copia

Google no siempre es capaz de distinguir entre el original y la copia. Por ello, es importante estar atento a posibles copias de textos de los que podría ser víctima. Hay un cierto número de herramientas que permiten configurar verificar el plagio. La herramienta Copyscape es la más conocida.

Duplicación de un sitio a otro

Parte del contenido, como las fichas de productos proporcionadas por los fabricantes, generalmente se encuentra en una multitud de sitios de comercio electrónico. Por lo tanto, es importante en su estrategia de SEO utilizar textos únicos y relevantes para todas sus publicaciones.

Índices duplicados

Google considera que cada URL es única. Dependiendo de las técnicas de desarrollo web y del CMS utilizado, la página de inicio de un sitio puede ser accesible desde varias direcciones y por lo tanto presentar tantos contenidos duplicados como direcciones.

  • https://www.ejemplo.com/;
  • https://www.ejemplo.com/index.html;
  • https://www.ejemplo.com/index.php.

Ocurre dentro del mismo sitio cuando el mismo contenido es visible a través de varias URL diferentes.

Curación

Cuando el contenido se duplica deliberadamente en otras plataformas para aumentar su visibilidad, es importante establecer reglas para los editores con los que trabaja para que la redacción de contenido no se convierta en un problema de SEO para el contenido duplicado.

Idealmente, el editor debería usar la etiqueta canónica del artículo para indicar que su sitio es la fuente original del contenido. Otra opción es usar una etiqueta noindex en el contenido.

Parámetros e identificadores de sesión

Los sitios suelen utilizar parámetros para fines de filtrado o seguimiento de visitantes. De manera similar, las identificaciones de sesión se utilizan para rastrear a los visitantes, por ejemplo, para saber qué artículos colocaron en su carrito de compras. Estos parámetros o identificadores de sesión se añaden a la URL original sin modificar el contenido.

Parámetros de URL generados dinámicamente

A menudo se utilizan para almacenar cierta información del usuario (como ID de sesión) o para mostrar una versión ligeramente diferente de la misma página (como un ajuste de clasificación o filtrado realizado).

Estas páginas suelen contener contenido igual o muy similar que se considera duplicado. La mayoría de las veces, estas configuraciones dinámicas crean docenas de versiones diferentes. Estos problemas pueden generar grandes preocupaciones para los sitios de comercio electrónico con cientos o miles de referencias si esto se aplica a cada referencia.

Las versiones WWW y no WWW de un sitio

Mucha gente asume que www.ejemplo.com y ejemplo.com son lo mismo. Pero estas dos URL son completamente diferentes a los ojos de los motores de búsqueda. Permitir que cada página de un sitio se muestre en estas dos configuraciones da como resultado la duplicación de un sitio completo.

Este problema generalmente se resuelve implementando redireccionamientos 301 o especificando su dominio preferido en Search Console.

Las versiones HTTPS y HTTP de un sitio

Muchos sitios tienen versiones seguras (https) e inseguras (http). Al igual que con www y no-www, https://www.ejemplo.com/ y http://www.ejemplo.com/ no son lo mismo. Un sitio debe ser accesible a través de uno u otro. Idealmente, la versión preferida de un sitio sería segura (https), ya que Google ha indicado que tener un sitio seguro es un factor de clasificación positivo y ha anunciado que primero indexará las versiones seguras de las páginas.

Contenido pobre y similar

Cuando hablamos de duplicación, a menudo imaginamos contenido completamente idéntico. Sin embargo, elementos muy similares también caen dentro de la definición. Tales problemas pueden surgir con frecuencia con los sitios de comercio electrónico, con descripciones de productos similares que difieren solo en algunas especificaciones.

Taxonomías

Los blogs suelen ofrecer la posibilidad de agrupar artículos por temas y palabras clave a través de funciones de taxonomía. Esta característica debe usarse con tacto, ya que puede generar contenido duplicado muy fácilmente si el mismo contenido aparece con demasiada frecuencia en las páginas generadas para presentar cada categoría o palabra clave.

Migración de nombres de dominio

Cuando cambia su nombre de dominio, es importante informar el cambio y redirigir el contenido antiguo a los nuevos. La migración exitosa después de un cambio de nombre de dominio sin perder su trabajo de SEO no es complicada, pero requiere algunas operaciones específicas.

¿Cómo evitar problemas de contenido duplicado en su sitio?

Duplicación externa

Para combatir estas preocupaciones, es particularmente importante prestar atención a estos puntos:

  • No use contenido ya presente en Internet;
  • No los duplique en varios de sus sitios;
  • Asegúrese de que no sean utilizados por otras editoriales mediante plagio, ni siquiera parcial;
  • Cree textos originales y únicos y no busque la sencillez;
  • No duplique ni siquiera partes mínimas de sus textos;
  • Luche contra el plagio;
  • Utilice una herramienta de verificación como copyscape.

Duplicación interna

Corregir contenido duplicado interno de un sitio significa decirle a Google qué página es la que debe tener en cuenta y cuáles son copias.

301 redirecciones

En muchos casos, la mejor manera de combatir el contenido duplicado es configurar una redirección 301 desde la página «duplicada» a la original. Cuando varias páginas con el potencial de posicionarse bien se combinan en una sola, no solo dejan de competir entre sí, sino que también crean una señal de relevancia y popularidad más fuerte en general. Esto tendrá un impacto positivo en su capacidad para clasificar bien.

Etiqueta rel=canonical

Otra solución es usar los atributos de etiqueta rel=canonical. Una URL canónica es la versión preferida de un conjunto de páginas con contenido similar que les dice a los motores de búsqueda que una página determinada debe tratarse como una copia de la URL especificada y que todos los enlaces y la popularidad aplicados a esa página deben acreditarse en realidad. especificado como canónico. Elegir una url canónica resuelve varios problemas:

  • Para establecer la URL para mostrar en los resultados;
  • Para agrupar enlaces para URL similares o duplicadas;
  • Para simplificar las estadísticas de seguimiento de un solo producto/tema;
  • Para gestionar el contenido sindicado;
  • Para evitar perder tiempo rastreando páginas duplicadas y optimizar el presupuesto de rastreo;

Solo se debe enviar una versión de la URL a los rastreadores de Google a través de la herramienta de archivo del mapa del sitio.

Meta Robots Noindex

La metaetiqueta «Noindex,Follow» puede ser particularmente útil para tratar estos problemas. Esta etiqueta permite que los motores de búsqueda analicen los enlaces de una página, pero les impide incluirlos en sus índices. El uso de meta robots es una solución particularmente eficaz para el contenido duplicado relacionado con la paginación.

Uriel N Peñaloza

Licenciado en Ciencias Políticas, SEO e Inversionista.

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba