

Contenuti duplicati: è una questione che ti preoccupa? Sia nel caso in cui tu sia l'autore di contenuti poi duplicati su altri siti o che invece sia proprio tu a ripubblicare contenuti di altri autori sul tuo sito, è importante analizzare quali sono gli aspetti principali e i problemi che caratterizzano i contenuti duplicati, senza cadere nei luoghi comuni o dare facili risposte.

Guarda nell'articolo il video di Robin Good sulla questione dei contenuti dublicati
Sono stato spinto a scrivere questo post perché invitato a far parte di una conversazione via mail in cui un webmaster si lamentava del fatto che i suoi contenuti venivano ripubblicati su un altro sito, specialmente da quando Google aveva posto i contenuti duplicati in una posizione più alta nei risultati delle ricerche rispetto ai contenuti originali.
A prima vista, l'autore originale sembrerebbe avere tutte le ragioni per lamentarsi e chiedere al “duplicatore” di smettere di ripubblicare contenuti altrui e iniziare a scriverli autonomamente. Ma la questione, se analizzata a fondo, è molto più delicata e complessa di quanto sembri.
Robin Good parla di contenuti duplicati
C'è un'enorme differenza se il duplicatore o il sito che ripubblica contenuti provvede a citare esplicitamente l'autore e il sito non solo in maniera testuale ma anche inserendo il link verso il sito originale. Un credit link visibile del contenuto originale che includa sia il nome del sito, l'autore e il titolo dell'articolo originale (con un link diretto a questo) è il minimo a cui deve provvedere un web publisher che distribuisce contenuti tramite feed o ripubblica contenuti preesistenti.
ll secondo fattore fondamentale che cambia i termini della questione è se il sito duplicatore aggiunge un “valore extra” rispetto al contenuto originale, come ad esempio un'introduzione, altri link o fonti, contenuti o notizie relative all'argomento, immagini o illustrazioni attinenti. Insomma, informazioni che il lettore possa ritenere davvero utili.
Il terzo elemento chiave è il permesso. Se almeno una volta hai perso tre minuti per chiedere tramite email il permesso di ripubblicare un articolo e hai spiegato chiaramente cosa ne vuoi fare, sei completamente al sicuro dal punto di vista etico (non ho mai sentito parlare di qualcuno che si sia lamentato di contenuti pubblicati con il proprio permesso).
In merito alla duplicazione dei contenuti sui siti, posso dire che se fatto eticamente (cioè seguendo i tre consigli qui sopra) e aumentando le modalità con cui le altre persone possono giungere a quell'articolo (grazie all'uso di titoli differenti e introduzioni ai contenuti), questo può essere davvero un modo naturale ed efficace per diffondere nuove idee e informazioni di valore.
All'estremo opposto si trovano siti che ripubblicano contenuti qualitativamente scarsi in centinaia di domini solo per cercare di ottenere una monetizzazione a costo zero (questo è il caso di quelli che prelevano materiale assemblato dalle directory di articoli), oppure si trovano piccoli web publisher che per raggiungere velocemente visibilità e una forte indicizzazione nei motori di ricerca, diffondono i loro contenuti di bassa qualità nelle directory di articoli, nella speranza di ottenere molti link diretti dai siti che ripubblicheranno liberamente i loro contenuti.
Ma questa è solo una mia opinione.
Questa è l'opinione ufficiale di Google in materia:
"Generalmente, per contenuti duplicati si intendono grosse porzioni di contenuto presenti all'interno di un sito web, ognuno dei quali corrisponde perfettamente a un altro contenuto o a una copia simile. In teoria questo non è un comportamento scorretto.
Esempi di contenuti duplicati non ingannevoli possono essere:
Discussioni nei forum che possono generare sia pagine normali sia pagine ottimizzate per la navigazione da dispositivi mobili.
Elenchi di oggetti mostrati o collegati attraverso diversi indirizzi distinti tra loro.
Versioni stampabili di pagine web.
Tuttavia, in alcuni casi, il contenuto è duplicato esplicitamente su altri siti con l'obiettivo di alterare i risultati dei motori di ricerca e ottenere così maggior traffico. Atteggiamenti ingannevoli come questo possono essere pericolosi per un utente con poca esperienza. Ad esempio, un visitatore che osserva sostanzialmente lo stesso contenuto ripetuto in un blocco di risultati.
Google si impegna seriamente a indicizzare e a mostrare pagine con informazioni diverse.
Nei rari casi in cui Google avverte che il contenuto duplicato ha l'intento di manipolare le nostre classifiche e ingannare i nostri utenti, prende gli opportuni provvedimenti per l'indicizzazione e la classificazione dei siti coinvolti.
Come risultato, il sito potrebbe scendere di posizione nella classifica oppure essere completamente rimosso dall'indice di Google, in questo caso non apparirà più nei risultati delle ricerche."
Generalmente gli utenti di Google vogliono vedere risultati diversi per una stessa ricerca. Invece saranno comprensibilmente annoiati se vedranno gli stessi contenuti in tutti i risultati.
"Tuttavia, noi preferiamo concentrarci sul filtraggio piuttosto che eseguire aggiustamenti sulla classifica ...così nella maggior parte dei casi, la cosa peggiore che può succedere ai webmaster è vedere la versione "meno desiderata" di una pagina in mostra nella nostra classifica."(Fonte: Google Webmaster Central)
"Google si impegna seriamente a indicizzare e a mostrare pagine con informazioni diverse. [Solitamente noi escludiamo i duplicati e] scegliamo uno tra essi da inserire nelle nostre classifiche.Nei rari casi in cui Google avverte che il contenuto duplicato ha l'intento di manipolare le nostre classifiche e ingannare gli utenti, prende gli opportuni provvedimenti per l'indicizzazione e la classificazione dei siti coinvolti.
"(Fonte: Google Webmaster Central)
Ora presta attenzione a questa cosa:
La maggior parte dei problemi di Google iniziano quando la duplicazione è attuata sul tuo sito e non quando qualcun'altro ripubblica il tuo contenuto su altri siti.
Ora lascia che ti dica un concetto fondamentale:
Se c'è un altro sito che ripubblica alcuni dei tuo contenuti e si posiziona prima nelle classifiche di Google, tu hai SICURAMENTE un problema da risolvere col TUO sito (e la soluzione NON è andare e urlare o minacciare chi ha ripubblicato il tuo contenuto, ma svegliarti ed essere curioso abbastanza per capire perché Google preferisce il sito duplicato al tuo).
La mia esperienza quotidiana nella gestione di alcuni siti può testimoniare che l'unico interesse di Google è mantenere un'alta qualità e contenuti pertinenti che corrispondano perfettamente alla richiesta fatta da un qualsiasi utente. Se un altro sito che sta usando alcuni dei tuoi contenuti appare prima di te, osserva attentamente il tuo sito prima di insultare qualcuno che sta ripubblicando i tuoi articoli.
Allo stesso tempo, penso che tu abbia tutte le ragioni per scrivere e lamentarti se i duplicatori non ti hanno contattato prima di aver ripubblicato i tuoi contenuti (presupponendo ovviamente che i tuoi contenuti non siano stati pubblicati sotto una licenza aperta come le Creative Commons).
Ma in molti casi, il webmaster che ripubblica o duplica (e qui sto escludendo i programmi di ripubblicazione automatica e i siti spam che copiano esplicitamente contenuti unicamente per interessi economici) non sta solamente traendo vantaggio dal tuo contenuto, ma sta piuttosto diffondendo le tue idee, aumentando il loro valore grazie ai link verso il tuo sito e, allo stesso tempo, si sta comportando in maniera trasparente per quanto riguarda la proprietà e l'origine del tuo contenuto.
In ogni caso, faresti meglio ad EVITARE di lamentarti o limitare l'attività di chi sta di fatto contribuendo in maniera veramente positiva a propagare le tue informazioni.
Il fatto che le pagine duplicate possano trovarsi in una posizione più alta nei risultati delle ricerche non deve impedire il miglioramento del tuo contenuto: aggiornalo, riduci i contenuti non necessari e autopromozionali che tu stesso potresti trovarti a “duplicare” nelle tue pagine.
Lascia che ti spieghi meglio questa cosa.
Nella scambio di email a cui ero stato invitato, l'autore originale si lamentava perché nelle pagine dei motori di ricerca il suo contenuto originale qualche volta era oscurato dalla più alta rilevanza del contenuto “copiato” e ripubblicato da un altro webmaster.
Ho esaminato a fondo il contenuto in questione in entrambi i siti e sai cosa ho scoperto? Il contenuto della pagina dell'autore originale indicizzata da Google pesava intorno ai 60 KB, dei quali però almeno la metà non facevano realmente parte del'argomento principale dell'articolo. Era soltanto un insieme di link verso altri articoli che avevano più visibilità rispetto al contenuto dell'articolo in questione.
Inoltre era il “replicatore” a trane vantaggio. Cioè colui che non solo si era preso il disturbo di provvedere ad un'opportuna introduzione, corredata da ulteriori link e fonti, un esplicito riconoscimento dell'originale e link diretti verso di esso, ma aveva anche riunito diversi aspetti dall'autore esterno per analizzare il tema in maniera più approfondita ed esauriente. Il contenuto del sito “replicatore” è stato calcolato da Google tre volte di più rispetto all'originale. Il contenuto attinente costituiva la parte principale della pagina, lasciando ai link, alle pubblicità e ad altre informazioni solo una parte marginale dello spazio disponibile.
Ecco perché Google, nonostante sappia perfettamente chi abbia scritto per primo l'articolo e dove sia pubblicato (visto che il sito duplicatore non fa mistero di ciò apponendo link e riconoscimenti in modo esplicito), preferisce mettere nella posizione più alta della sua classifica la pagina del sito “duplicatore”.
In parole povere, il sito duplicatore ha fatto un lavoro apprezzabile sotto tutti i punti di vista, ampliando il raggio d'azione e il valore del contenuto originale creato dall'altro sito e, allo stesso tempo, dandone pieno credito e riconoscimento.
Il sito originale lamenta la sua incapacità di mantenere una posizione alta nelle classifiche delle ricerche, ma non ha l'umiltà di ammettere il valore del contenuto che sta fornendo, neanche tentando di migliorarlo e aggiornarlo in modo che non abbia paragone con le altre risorse disponibili online sullo stesso argomento. Lamentandosi degli ottimi risultati e dei riconoscimenti raggiunti dagli altri siti, il sito originale corre anche il rischio di privarsi di importanti punti di collegamento, prestando troppa attenzione alla continua perdita di visibilità e dimenticando di migliorare e di fornire migliori servizi per l'utente.
Solo su un punto il sito “replicatore” ha sbagliato completamente. Ha dato troppe cose per scontate, prendendosi troppa libertà senza aver mai avuto la gentilezza di chiedere ufficialmente il permesso al sito originale di ripubblicare i contenuti ritenuti interessanti.
Morale della favola: finché non vedi chiaramente un testo che espliciti senza ombra di dubbio: “Copia liberamente i miei contenuti sul tuo sito...”(il che non è raro da trovare - vai alla fine della pagina per trovare un chiaro esempio) è sempre tuo dovere trovare il tempo di contattare l'autore di qualsiasi contenuto tu voglia ripubblicare e chiedere così il permesso per farlo. Fine della storia.
Ci sono alcuni passaggi da compiere per affrontare opportunamente la questione dei contenuti duplicati e assicurarsi che i visitatori vedano il contenuto che tu desideri (ricorda ancora una volta che Google sta ragionando PIÙ sul fronte della duplicazione di contenuti sul TUO STESSO sito piuttosto che su quello di altri, dal momento che di questi Google se ne occupa tranquillamente da solo).
Tuttavia, se la nostra revisione ha indicato che sei coinvolto in pratiche scorrette e il tuo sito è stato rimosso dai nostri risultati di ricerca, riesamina il tuo sito con attenzione. Se il tuo sito è stato rimosso dai nostri risultati di ricerca, rileggi le linee guida per i webmaster per ulteriori informazioni. Una volta apportate le modifiche e sicuro che il tuo sito non violi più le nostre linee guida, rinvia il tuo sito per sottoporlo ad un nuovo esame.
Per quanto riguarda il tuo sito:
(Fonti: Google Advice on Duplicate Content
Google Duplicate Content Guidelines article)
Sfortunatamente Google non risponde ufficialmente alle domande più difficili e delicate che molti webmasters hanno posto. Qui di seguito ce ne sono alcune a cui il team di Google non ha risposto chiaramente:
Ecco cosa dice Kristen Veraldi... (5 Febbraio 2008)
"Grazie Susan,Posso essere solo d'accordo con te, nell'universo dei contenuti TUTTO sta nell'aggiungere valore in maniera puntuale e adatta dal tuo unico e onesto punto di vista.
Tuttavia, per quanto riguarda quelli che comprendono ciò e seguono questo mantra per costruire le proprie fondamenta, pensi che aggiungere contenuti generici di terze parti (parliamo, per esempio, di una volta su quattro) possa realmente macchiare la reputazione di un sito?
E nel caso in cui il contenuto di terze parti non fosse originato dal Web, non ci fosse quindi un link originale, solo lo stesso contenuto in centinaia di altri siti (come si potrebbe conoscere quello realmente originale) e fosse solo prodotto esclusivamente per un'ampia distribuzione da una sorta di azienda specializzata nel generare contenuti?
Se quegli articoli aggiungessero valore alla tua sfera locale (per esempio, creando contatti con persone che leggono i tuoi articoli, ma che tu non stai cercando in maniera diretta)?
Mi chiedo, nel caso in cui non ti interessasse ottimizzare questi contenuti generici e il loro valore fosse prettamente intrinseco, potresti metterlo a disposizione e sentirti ancora tranquillo che ciò non arrecherà danno al tuo contenuto originale nei motori di ricerca (visto che noi naturalmente ci prendiamo cura delle indicizzazioni!).
Questa è una situazione davvero comune, mi chiedo se tutti quelli che hanno dei siti basati su template si preoccupino di essere protetti.
Se tutto ciò fosse fonte di preoccupazione, potrebbe essere risolto usando solamente programmi che non seguono le tag delle pagine contenenti questi articoli?
Credo che sia impossibile rispondere definitivamente a queste domande, tutto ciò che puoi aggiungere è vivamente apprezzato. Grazie!
"
oppure
adwords ha scritto (2 Marzo 2008):
"Possiedo una directory di articoli composta completamente da contenuti duplicati (non solo articoli). Non molto tempo dopo aver iniziato ho notato una flessione nel traffico e scoperto che tutte le mie pagine si trovavano nell'indice supplementare. Ho organizzato gli articoli e li ho formattati in HTML secondo le convenzioni standard. Praticamente in questo modo ogni articolo appare tre volte meglio del sito con minori cambiamenti.Ho riorganizizzato la navigazione e il file robots.txt in modo da escludere dall'indicizzazione tutto tranne le versioni standard. Tutto ciò ha fatto in modo che tutte le pagine conducessero a quella principale e che il traffico aumentasse gradualmente.
Da quell'esperienza ho imparato che la duplicazione all'interno di uno stesso sito è decisamente più redditizia rispetto a quella fatta su siti diversi.
"
Così, visto che mancano alcune risposte ufficiali, ecco i miei consigli sulla questione della duplicazione dei contenuti:
I consigli di Robin Good:
Per quelli che ripubblicano contenuti da altri:
a) dai credito al nome dell'autore, con un link del suo profilo o della sua biografia se disponibile online.
b) cita il sito dell'autore, con il nome e un link di esso.
c) fai riferimento al titolo, data e link dell'articolo originale.
...e per quelli i cui contenuti sono stati pubblicati da altri:
Se il contenuto viene ripubblicato previa un permesso, accrescendo significativamente il valore, cambiando il suo titolo, aggiungendo un'introduzione, dando credito e riconoscimento della fonte originale, penso che sia l'autore originale sia il “ripubblicatore” ne trarranno un beneficio consistente. Quante più persone leggeranno il contenuto, tante più persone verranno a conoscenza del sito e dell'autore originali. Grazie al servizio di diffusione gratuito compiuto dai motori di ricerca il messaggio sarà raccolto da un numero maggiore di utenti. Allo stesso tempo verranno fornite informazioni aggiuntive o complementari a quelle originali.