MasterNewMedia Italia
Scopri i migliori tool per comunicare,
collaborare e fare marketing
   
Curated by: Luigi Canali De Rossi
 


14 agosto 2008

Contenuti Duplicati: Problemi E Soluzioni Per Chi Ripubblica Contenuti Online

Contenuti duplicati: è una questione che ti preoccupa? Sia nel caso in cui tu sia l'autore di contenuti poi duplicati su altri siti o che invece sia proprio tu a ripubblicare contenuti di altri autori sul tuo sito, è importante analizzare quali sono gli aspetti principali e i problemi che caratterizzano i contenuti duplicati, senza cadere nei luoghi comuni o dare facili risposte.

Robin-Good-duplicate-content-issues-480.jpg
Guarda nell'articolo il video di Robin Good sulla questione dei contenuti dublicati

Sono stato spinto a scrivere questo post perché invitato a far parte di una conversazione via mail in cui un webmaster si lamentava del fatto che i suoi contenuti venivano ripubblicati su un altro sito, specialmente da quando Google aveva posto i contenuti duplicati in una posizione più alta nei risultati delle ricerche rispetto ai contenuti originali.

A prima vista, l'autore originale sembrerebbe avere tutte le ragioni per lamentarsi e chiedere al "duplicatore" di smettere di ripubblicare contenuti altrui e iniziare a scriverli autonomamente. Ma la questione, se analizzata a fondo, è molto più delicata e complessa di quanto sembri.

 




Duplicare Contenuti: Fattori Fondamentali

C'è un'enorme differenza se il duplicatore o il sito che ripubblica contenuti provvede a citare esplicitamente l'autore e il sito non solo in maniera testuale ma anche inserendo il link verso il sito originale. Un credit link visibile del contenuto originale che includa sia il nome del sito, l'autore e il titolo dell'articolo originale (con un link diretto a questo) è il minimo a cui deve provvedere un web publisher che distribuisce contenuti tramite feed o ripubblica contenuti preesistenti.

ll secondo fattore fondamentale che cambia i termini della questione è se il sito duplicatore aggiunge un "valore extra" rispetto al contenuto originale, come ad esempio un'introduzione, altri link o fonti, contenuti o notizie relative all'argomento, immagini o illustrazioni attinenti. Insomma, informazioni che il lettore possa ritenere davvero utili.

Il terzo elemento chiave è il permesso. Se almeno una volta hai perso tre minuti per chiedere tramite email il permesso di ripubblicare un articolo e hai spiegato chiaramente cosa ne vuoi fare, sei completamente al sicuro dal punto di vista etico (non ho mai sentito parlare di qualcuno che si sia lamentato di contenuti pubblicati con il proprio permesso).

In merito alla duplicazione dei contenuti sui siti, posso dire che se fatto eticamente (cioè seguendo i tre consigli qui sopra) e aumentando le modalità con cui le altre persone possono giungere a quell'articolo (grazie all'uso di titoli differenti e introduzioni ai contenuti), questo può essere davvero un modo naturale ed efficace per diffondere nuove idee e informazioni di valore.

All'estremo opposto si trovano siti che ripubblicano contenuti qualitativamente scarsi in centinaia di domini solo per cercare di ottenere una monetizzazione a costo zero (questo è il caso di quelli che prelevano materiale assemblato dalle directory di articoli), oppure si trovano piccoli web publisher che per raggiungere velocemente visibilità e una forte indicizzazione nei motori di ricerca, diffondono i loro contenuti di bassa qualità nelle directory di articoli, nella speranza di ottenere molti link diretti dai siti che ripubblicheranno liberamente i loro contenuti.

Ma questa è solo una mia opinione.




Qual è il Contenuto Duplicato Consentito da Google

Questa è l'opinione ufficiale di Google in materia:

"Generalmente, per contenuti duplicati si intendono grosse porzioni di contenuto presenti all'interno di un sito web, ognuno dei quali corrisponde perfettamente a un altro contenuto o a una copia simile. In teoria questo non è un comportamento scorretto.

Esempi di contenuti duplicati non ingannevoli possono essere:

Discussioni nei forum che possono generare sia pagine normali sia pagine ottimizzate per la navigazione da dispositivi mobili.

Elenchi di oggetti mostrati o collegati attraverso diversi indirizzi distinti tra loro.

Versioni stampabili di pagine web.

Tuttavia, in alcuni casi, il contenuto è duplicato esplicitamente su altri siti con l'obiettivo di alterare i risultati dei motori di ricerca e ottenere così maggior traffico. Atteggiamenti ingannevoli come questo possono essere pericolosi per un utente con poca esperienza. Ad esempio, un visitatore che osserva sostanzialmente lo stesso contenuto ripetuto in un blocco di risultati.

Google si impegna seriamente a indicizzare e a mostrare pagine con informazioni diverse.

Nei rari casi in cui Google avverte che il contenuto duplicato ha l'intento di manipolare le nostre classifiche e ingannare i nostri utenti, prende gli opportuni provvedimenti per l'indicizzazione e la classificazione dei siti coinvolti.

Come risultato, il sito potrebbe scendere di posizione nella classifica oppure essere completamente rimosso dall'indice di Google, in questo caso non apparirà più nei risultati delle ricerche."

Generalmente gli utenti di Google vogliono vedere risultati diversi per una stessa ricerca. Invece saranno comprensibilmente annoiati se vedranno gli stessi contenuti in tutti i risultati.

"Tuttavia, noi preferiamo concentrarci sul filtraggio piuttosto che eseguire aggiustamenti sulla classifica ...così nella maggior parte dei casi, la cosa peggiore che può succedere ai webmaster è vedere la versione "meno desiderata" di una pagina in mostra nella nostra classifica."

(Fonte: Google Webmaster Central)

"Google si impegna seriamente a indicizzare e a mostrare pagine con informazioni diverse. [Solitamente noi escludiamo i duplicati e] scegliamo uno tra essi da inserire nelle nostre classifiche.

Nei rari casi in cui Google avverte che il contenuto duplicato ha l'intento di manipolare le nostre classifiche e ingannare gli utenti, prende gli opportuni provvedimenti per l'indicizzazione e la classificazione dei siti coinvolti."

(Fonte: Google Webmaster Central)




Contenuti Duplicati e Chi Viene Classificato Per Primo: Qual è il Vero Problema?

Ora presta attenzione a questa cosa:

La maggior parte dei problemi di Google iniziano quando la duplicazione è attuata sul tuo sito e non quando qualcun'altro ripubblica il tuo contenuto su altri siti.

Ora lascia che ti dica un concetto fondamentale:

Se c'è un altro sito che ripubblica alcuni dei tuo contenuti e si posiziona prima nelle classifiche di Google, tu hai SICURAMENTE un problema da risolvere col TUO sito (e la soluzione NON è andare e urlare o minacciare chi ha ripubblicato il tuo contenuto, ma svegliarti ed essere curioso abbastanza per capire perché Google preferisce il sito duplicato al tuo).




Quando un Altro Sito Ripubblica il Tuo Contenuto è Giusto Arrabbiarti o No?

La mia esperienza quotidiana nella gestione di alcuni siti può testimoniare che l'unico interesse di Google è mantenere un'alta qualità e contenuti pertinenti che corrispondano perfettamente alla richiesta fatta da un qualsiasi utente. Se un altro sito che sta usando alcuni dei tuoi contenuti appare prima di te, osserva attentamente il tuo sito prima di insultare qualcuno che sta ripubblicando i tuoi articoli.

Allo stesso tempo, penso che tu abbia tutte le ragioni per scrivere e lamentarti se i duplicatori non ti hanno contattato prima di aver ripubblicato i tuoi contenuti (presupponendo ovviamente che i tuoi contenuti non siano stati pubblicati sotto una licenza aperta come le Creative Commons).

Ma in molti casi, il webmaster che ripubblica o duplica (e qui sto escludendo i programmi di ripubblicazione automatica e i siti spam che copiano esplicitamente contenuti unicamente per interessi economici) non sta solamente traendo vantaggio dal tuo contenuto, ma sta piuttosto diffondendo le tue idee, aumentando il loro valore grazie ai link verso il tuo sito e, allo stesso tempo, si sta comportando in maniera trasparente per quanto riguarda la proprietà e l'origine del tuo contenuto.

In ogni caso, faresti meglio ad EVITARE di lamentarti o limitare l'attività di chi sta di fatto contribuendo in maniera veramente positiva a propagare le tue informazioni.

Il fatto che le pagine duplicate possano trovarsi in una posizione più alta nei risultati delle ricerche non deve impedire il miglioramento del tuo contenuto: aggiornalo, riduci i contenuti non necessari e autopromozionali che tu stesso potresti trovarti a "duplicare" nelle tue pagine.

Lascia che ti spieghi meglio questa cosa.




Chi Dovrebbe Apparire Per Primo Nei Risultati Dei Motori di Ricerca?

Nella scambio di email a cui ero stato invitato, l'autore originale si lamentava perché nelle pagine dei motori di ricerca il suo contenuto originale qualche volta era oscurato dalla più alta rilevanza del contenuto "copiato" e ripubblicato da un altro webmaster.

Ho esaminato a fondo il contenuto in questione in entrambi i siti e sai cosa ho scoperto? Il contenuto della pagina dell'autore originale indicizzata da Google pesava intorno ai 60 KB, dei quali però almeno la metà non facevano realmente parte del'argomento principale dell'articolo. Era soltanto un insieme di link verso altri articoli che avevano più visibilità rispetto al contenuto dell'articolo in questione.

Inoltre era il "replicatore" a trane vantaggio. Cioè colui che non solo si era preso il disturbo di provvedere ad un'opportuna introduzione, corredata da ulteriori link e fonti, un esplicito riconoscimento dell'originale e link diretti verso di esso, ma aveva anche riunito diversi aspetti dall'autore esterno per analizzare il tema in maniera più approfondita ed esauriente. Il contenuto del sito "replicatore" è stato calcolato da Google tre volte di più rispetto all'originale. Il contenuto attinente costituiva la parte principale della pagina, lasciando ai link, alle pubblicità e ad altre informazioni solo una parte marginale dello spazio disponibile.

Ecco perché Google, nonostante sappia perfettamente chi abbia scritto per primo l'articolo e dove sia pubblicato (visto che il sito duplicatore non fa mistero di ciò apponendo link e riconoscimenti in modo esplicito), preferisce mettere nella posizione più alta della sua classifica la pagina del sito "duplicatore".

In parole povere, il sito duplicatore ha fatto un lavoro apprezzabile sotto tutti i punti di vista, ampliando il raggio d'azione e il valore del contenuto originale creato dall'altro sito e, allo stesso tempo, dandone pieno credito e riconoscimento.

Il sito originale lamenta la sua incapacità di mantenere una posizione alta nelle classifiche delle ricerche, ma non ha l'umiltà di ammettere il valore del contenuto che sta fornendo, neanche tentando di migliorarlo e aggiornarlo in modo che non abbia paragone con le altre risorse disponibili online sullo stesso argomento. Lamentandosi degli ottimi risultati e dei riconoscimenti raggiunti dagli altri siti, il sito originale corre anche il rischio di privarsi di importanti punti di collegamento, prestando troppa attenzione alla continua perdita di visibilità e dimenticando di migliorare e di fornire migliori servizi per l'utente.

Solo su un punto il sito "replicatore" ha sbagliato completamente. Ha dato troppe cose per scontate, prendendosi troppa libertà senza aver mai avuto la gentilezza di chiedere ufficialmente il permesso al sito originale di ripubblicare i contenuti ritenuti interessanti.

Morale della favola: finché non vedi chiaramente un testo che espliciti senza ombra di dubbio: "Copia liberamente i miei contenuti sul tuo sito..."(il che non è raro da trovare - vai alla fine della pagina per trovare un chiaro esempio) è sempre tuo dovere trovare il tempo di contattare l'autore di qualsiasi contenuto tu voglia ripubblicare e chiedere così il permesso per farlo. Fine della storia.




I Consigli di Google

Ci sono alcuni passaggi da compiere per affrontare opportunamente la questione dei contenuti duplicati e assicurarsi che i visitatori vedano il contenuto che tu desideri (ricorda ancora una volta che Google sta ragionando PIÙ sul fronte della duplicazione di contenuti sul TUO STESSO sito piuttosto che su quello di altri, dal momento che di questi Google se ne occupa tranquillamente da solo).

  • Duplicare il contenuto di un sito non rende automatico l'intervento su tale sito, a meno che l'intento del contenuto duplicato sia di ingannare e manipolare i risultati del motore di ricerca. Se il tuo sito ha problemi di contenuti duplicati e non rientra nella categoria sopra descritta, noi facciamo un attento lavoro per scegliere la versione del contenuto da mostrare nei nostri risultati di ricerca.

    Tuttavia, se la nostra revisione ha indicato che sei coinvolto in pratiche scorrette e il tuo sito è stato rimosso dai nostri risultati di ricerca, riesamina il tuo sito con attenzione. Se il tuo sito è stato rimosso dai nostri risultati di ricerca, rileggi le linee guida per i webmaster per ulteriori informazioni. Una volta apportate le modifiche e sicuro che il tuo sito non violi più le nostre linee guida, rinvia il tuo sito per sottoporlo ad un nuovo esame.

  • Non preoccuparti troppo dei siti che si appropriano dei tuoi contenuti, ripubblicandoli scorrettamente. Anche se è fastidioso, è altamente improbabile che tali siti possano avere un impatto negativo sulla presenza del tuo sito su Google. Se trovi un caso estremamente fastidioso, ti invitiamo ad usare la DMCA request per rivendicare la proprietà dei contenuti e lasciare a noi il compito di trattare con il sito incriminato.
  • Se scopri un altro sito che sta duplicando il tuo contenuto appropriandosene illecitamente e ripubblicandolo, è improbabile che ciò possa avere un impatto negativo sul posizionamento del tuo sito nelle pagine dei risultati di ricerca di Google. Se trovi un caso estremamente fastidioso, ti invitiamo ad usare il DMCA per rivendicare la proprietà dei contenuti e richiedere la rimozione del sito incriminato dagli elenchi di Google.
  • Anche in questo caso, ricorda che noi mostreremo sempre la versione (non bloccata) che a noi sembrerà più appropriata per gli utenti in ogni singola ricerca, che sia o no la versione che preferisci.
  • Distribuite con attenzione: Se distribuisci i tuoi contenuti su altri siti, Google mostrerà sempre la versione che riteniamo più appropriata per gli utenti in ogni singola ricerca, che sia o no la versione che preferisci. Tuttavia, è utile assicurarsi che in ogni sito in cui appaia il tuo contenuto includa un link all'articolo originale. È anche possibile chiedere a coloro che utilizzano il tuo materiale distribuito di bloccare la versione sui loro siti utilizzando il file robots.txt.
  • Per quanto riguarda il tuo sito:

  • Riduci al minimo le ripetizioni inutili: Per esempio, invece di inserire un testo sul copyright alla fine della pagina, includi una breve sintesi, inserendo un link ad una pagina più dettagliata.
  • Riduci al minimo i contenuti simili: Se disponi di molte pagine simili, provvedi ad ampliare ogni pagina o a riunire le diverse pagine in una sola. Per esempio, se hai un sito di viaggi con pagine separate per due città, ma le stesse informazioni su entrambe le pagine, potresti unire le due pagine in una sola oppure potresti aumentare le informazioni in modo da aver un contenuto unico per ogni città.
  • Scegli le pagine da indicizzare: Piuttosto che lasciare che gli algoritmi di Google determinino le versioni "migliori" di un documento, potresti aiutarci suggerendoci la tua versione preferita. Per esempio, se non si vuole permettere l'indicizzazione della versione stampabile di un articolo del tuo sito, disabilita queste directory o fai uso di espressioni regolari nel file robot.txt.
  • Utilizza i messaggi 301: Se hai ristrutturato da poco il tuo sito, utilizza nel tuo file .htaccess le redirezioni 301 ("RedirectPermanent") per redirigiere gli utenti, Googlebot e gli altri spider verso le nuove pagine (in Apache puoi fare questo editando il file .htaccess file; in IIS puoi farlo dal pannello di controllo)
  • Sii coerente: Prova a mantenere i tuoi link interni con nomi coerenti. Per esempio, non linkare a pagine tipo http://www.example.com/page/; http://www.example.com/page e http://www.example.com/page/index.htm.
  • Utilizza domini di primo livello: Per aiutarci a mostrare la versione più appropriata di un documento, utilizza, ove possibile, domini di primo livello per la gestione di contenuti specifici per un determinato paese. A noi fa comodo sapere che www.example.de è un sito focalizzato sui contenuti per la Germania, piuttosto che www.example.com / de o de.example.com.
  • Utilizza i Webmaster Tools per comunicarci come preferisci indicizzare il tuo sito: Puoi indicare a Google il tuo dominio preferito (per esempio, www.example.com o http://example.com).
  • Evita di pubblicare informazioni parziali: agli utenti non piace vedere pagine "vuote", per cui se possibile evita i placeholder. Per esempio, non pubblicare pagine per le quali non hai ancora pronto un contenuto effettivo. Se crei pagine contenenti placeholder, utilizza il file robots.txt per impedire che vengano analizzate.
  • Cerca di conoscere bene il tuo sistema di gestione dei contenuti: Assicurati di avere familiarità con la visualizzazione del contenuto del tuo sito web. Blog, forum e relativi sistemi, spesso mostrano gli stessi contenuti in vari formati. Ad esempio, un post di un blog può essere visualizzato sull'home page di un blog, in un pagina dell'archivio o in una pagina di altre voci con la stessa etichetta.

(Fonti: Google Advice on Duplicate Content

Google Webmaster Central

Google Duplicate Content Guidelines article)




Sfortunatamente Google non risponde ufficialmente alle domande più difficili e delicate che molti webmasters hanno posto. Qui di seguito ce ne sono alcune a cui il team di Google non ha risposto chiaramente:

Ecco cosa dice Kristen Veraldi... (5 Febbraio 2008)

"Grazie Susan,

Posso essere solo d'accordo con te, nell'universo dei contenuti TUTTO sta nell'aggiungere valore in maniera puntuale e adatta dal tuo unico e onesto punto di vista.

Tuttavia, per quanto riguarda quelli che comprendono ciò e seguono questo mantra per costruire le proprie fondamenta, pensi che aggiungere contenuti generici di terze parti (parliamo, per esempio, di una volta su quattro) possa realmente macchiare la reputazione di un sito?

E nel caso in cui il contenuto di terze parti non fosse originato dal Web, non ci fosse quindi un link originale, solo lo stesso contenuto in centinaia di altri siti (come si potrebbe conoscere quello realmente originale) e fosse solo prodotto esclusivamente per un'ampia distribuzione da una sorta di azienda specializzata nel generare contenuti?

Se quegli articoli aggiungessero valore alla tua sfera locale (per esempio, creando contatti con persone che leggono i tuoi articoli, ma che tu non stai cercando in maniera diretta)?

Mi chiedo, nel caso in cui non ti interessasse ottimizzare questi contenuti generici e il loro valore fosse prettamente intrinseco, potresti metterlo a disposizione e sentirti ancora tranquillo che ciò non arrecherà danno al tuo contenuto originale nei motori di ricerca (visto che noi naturalmente ci prendiamo cura delle indicizzazioni!).

Questa è una situazione davvero comune, mi chiedo se tutti quelli che hanno dei siti basati su template si preoccupino di essere protetti.

Se tutto ciò fosse fonte di preoccupazione, potrebbe essere risolto usando solamente programmi che non seguono le tag delle pagine contenenti questi articoli?

Credo che sia impossibile rispondere definitivamente a queste domande, tutto ciò che puoi aggiungere è vivamente apprezzato. Grazie!"

oppure
adwords ha scritto (2 Marzo 2008):

"Possiedo una directory di articoli composta completamente da contenuti duplicati (non solo articoli). Non molto tempo dopo aver iniziato ho notato una flessione nel traffico e scoperto che tutte le mie pagine si trovavano nell'indice supplementare. Ho organizzato gli articoli e li ho formattati in HTML secondo le convenzioni standard. Praticamente in questo modo ogni articolo appare tre volte meglio del sito con minori cambiamenti.

Ho riorganizizzato la navigazione e il file robots.txt in modo da escludere dall'indicizzazione tutto tranne le versioni standard. Tutto ciò ha fatto in modo che tutte le pagine conducessero a quella principale e che il traffico aumentasse gradualmente.

Da quell'esperienza ho imparato che la duplicazione all'interno di uno stesso sito è decisamente più redditizia rispetto a quella fatta su siti diversi."

Così, visto che mancano alcune risposte ufficiali, ecco i miei consigli sulla questione della duplicazione dei contenuti:




I consigli di Robin Good:



Per quelli che ripubblicano contenuti da altri:

  1. Chiedi per prima cosa il permesso: Sempre
  2. Aggiungi anche un minimo valore: Scrivi un'introduzione e un titolo differenti.
  3. Aggiungi valore di qualità: incrementa il valore aggiungendo altri contenuti, immagini, i tuoi commenti personali e qualsiasi altra informazione che possa soddisfare pienamente il lettore che sta ricercando notizie sull'argomento.
  4. Dai pieno riconoscimento all'autore: non importa quali regole o requisiti tu abbia trovato sul modo migliore e più corretto per collegare l'articolo che hai ripubblicato interamente con l'originale, il mio consiglio è :

    a) dai credito al nome dell'autore, con un link del suo profilo o della sua biografia se disponibile online.

    b) cita il sito dell'autore, con il nome e un link di esso.

    c) fai riferimento al titolo, data e link dell'articolo originale.

  5. Esplicita la licenza originale quando possibile: Non permettere che l'autore originale pensi o presuma in nessun modo che tu stia applicando al suo contenuto protetto da copyright la tua licenza Creative Commons o General Public License. Non hai nessun diritto di farlo, lui, al contrario, ha tutto il diritto di arrabbiarsi in questo caso.



...e per quelli i cui contenuti sono stati pubblicati da altri:

  1. Lascia perdere. Mantenere i contenuti solo sul tuo sito generalmente non rappresenta il maggior vantaggio. Se esistono siti che onestamente desiderano migliorare le potenzialità del tuo contenuto facendolo crescere di valore, permettilo.
  2. Riconosci il valore e il contributo che questi altri siti stanno procurando, ampliando la visibilità e diffondendo la potenzialità dei tuoi contenuti e delle tue idee in una platea maggiore di utenti, specialmente quando questi siti si comportano in maniera chiara e trasparente dando credito e riconoscimento al tuo contenuto originale.
  3. Non seccarti se un sito che sta usando alcuni dei tuoi contenuti sale nelle classifiche di Google non incolparlo. Osserva il tuo sito e cerca di capire come valorizzare al meglio il contenuto che stai proponendo ai tuoi lettori, in modo da non avere rivali in questo campo. Se Google piazza un altro sito al posto del tuo, non è mai un errore.
  4. Semmai, rendi più semplice la condivisione e la ripubblicazione dei tuoi contenuti su altri siti, attraverso feed RSS, widget, licenze aperte che dichiarino esplicitamente che sei in favore della più ampia diffusione dei tuoi contenuti, affinché ti siano garantiti riconoscimenti e link diretti.



Se il contenuto viene ripubblicato previa un permesso, accrescendo significativamente il valore, cambiando il suo titolo, aggiungendo un'introduzione, dando credito e riconoscimento della fonte originale, penso che sia l'autore originale sia il "ripubblicatore" ne trarranno un beneficio consistente. Quante più persone leggeranno il contenuto, tante più persone verranno a conoscenza del sito e dell'autore originali. Grazie al servizio di diffusione gratuito compiuto dai motori di ricerca il messaggio sarà raccolto da un numero maggiore di utenti. Allo stesso tempo verranno fornite informazioni aggiuntive o complementari a quelle originali.

 

Scritto da per MasterNewMedia.
 
 
 
 
 
Commenti    
blog comments powered by Disqus

 

 

 

 

8823
 




 

I Toolkit di Robin


 









 

 

 

 

  • RSS Feed

          Mail
    Nome:
    Email:
     



     
     

     

    Web Analytics