Hoy estoy medio curioso, y se me ha ocurrido escribir algunas cosas que observo en el día a día que espero sean útiles para mis colegas que recién empiezan en el mundo del los Blogs o con una página Web; he observado por ejemplo, que muchas personas confunden el término «contenido duplicado» e incluso le dan un mal uso, pensando que si se toma parte del contenido de una página y se traslada a otra, serán sancionados ambos sitios o si tengo páginas duplicadas en mi sitio Google me aplicará la bota sobre mi cabeza.
Debemos diferenciar aquí dos cosas: una es el uso de las fuentes RSS para obtener contenido adicional relevante para tu sitio Web o Blog (algo legal e incluso permitido por Blogger) y la otra es copiar todo un texto tal cual y colocarlo en tu sitio con el acápite de «fuente» o «leido en» al final. Google nos dice claramente en el Blog oficial para Webmaster que no existe explicitamente una sanción por contenido duplicado, sin embargo (y como suele suceder), que da la duda respecto a las aclaraciones que nos hace respecto al tratamiento de este tema.
Lo primero que nos indica y deja claro, es que crear múltiples URls con el mismo contenido dentro de la misma página puede generar un rendimiento menor del sitio, sin que este sea sancionado, lo que si puede suceder es que el buscador bloquee algunas de las URls por no considerarlas relevantes, ya que no aportan nada nuevo al lector; sin embargo la sanción no necesariamente puede aplicarse ya que esto puede suceder muchas veces por errores del CMS o gestor de contenido.
Hay que considerar que la mayoría de los motores de búsqueda tratarán de conseguir un cierto nivel de variedad en cuanto a contenido, lo que buscan es mostrar en la primera página de resultados (los 10 primeros puestos) contenido diferente y relevante, y no diez diferentes URL que contengan el mismo contenido. Con este fin, Google por su cuenta trata de filtrar los documentos duplicados, sean estos de la misma página o de dos distintas, detectando la original por antiguedad de indexación y otros factores.
En líneas generales si queremos crear un sitio que cite fuentes originales de otras páginas y emplee el contenido de otros sitios de Internet, debemos atenernos al peligro de ser ignorados por el motor de búsqueda, al menos en las primeras posiciones; sin embargo esto puede mejorarse, añadiendo una sustanciosa cantidad de valor agregado para los lectores (por ejemplo, opiniones propias y consejos). Otra de las consideraciones es que se puede emplear contenido de otros sitios pero respetando el tipo de licencia que el sitio original utiliza para compartir dicho contenido, si por ejemplo es una licencia Creative Commons 2.5, lo que debemos hacer es reconocer los créditos de la obra y al autor, simple y claro como el agua.
Tener contenido duplicado dentro del sitio puede afectarlo de en una variedad de maneras, pero a menos que Googlebot detecte que ha sido deliberado, es poco probable que exista una sanción; situaciones deliberadas son por ejemplo el redireccionamiento hacía un sitio único, el mal uso de programas de afiliados, la firma de contenido de otros como nuestro, la creación de sitios «espejo», etc.
otra vez muchas gracias!! breve y claro!! muy util. yeye