MasterNewMedia Italia
Scopri i migliori tool per comunicare,
collaborare e fare marketing
   
Curated by: Luigi Canali De Rossi
 


13 giugno 2011

La Guida A Google Panda - Parte 3: Cosa Cercare E Cosa Pulire

Cosa devi fare per riprenderti dalla penalizzazione di Google Panda? C'è qualcosa di specifico cui devi guardare? Quanto tempo ci vuole per riprenderti? La risposta a tutte e tre queste domande è: nessuno lo sa per certo (ancora). O almeno non finché un numero consistente di siti web colpiti da Panda non si riprenderanno completamente e condivideranno cosa hanno fatto per venirne fuori.

guida-google-panda-cosa-cercare-pulire-000009270022XSmall.jpg
Photo credit: Eric Isselée - iStockphoto ed Argus

Questo è il motivo per cui, almeno per adesso, il nuovo algoritmo di Google, conosciuto anche come Panda, rimane un danno gravissimo per le migliaia di siti web che sono stati colpiti, e rappresenta un problema sempre maggiore per tutti quegli editori online che pubblicano in lingue diverse dall'inglese, che sono preoccupati del suo arrivo.

Il mio umile consiglio è di seguire queste tre semplici raccomandazioni:
a) Non ascoltare coloro che dicono di essere dei guru, coloro che nonostante la loro esperienza od il loro seguito, non sono stati penalizzati o non hanno avuto un'esperienza diretta con Google Panda. Ci sono diversi report lì fuori che condividono quelli che, in apparenza, sembrano degli ottimi consigli, ma molti di questi sono semplicemente rielaborati da quelle che potremmo definire speculazioni, emerse dopo la prima iterazione di Panda.

b) Vatti a leggere cosa i webmaster e gli editori dei siti web colpiti da Panda hanno trovato, scoperto e fatto per rialzarsi. Dato che non esistono, ad oggi, casi di un recupero totale su Panda, oltre ad un paio di dubbiose eccezioni, dovrai andare a guardare cosa pensano i webmaster dei siti colpiti da Panda su quali possano essere i problemi maggiori ed aspettare che Panda venga rilasciata nuovamente (ci sono state due principali iterazioni finora: il 24 febbraio e l'11 aprile) per vedere se queste persone avevano ragione.

c) Mettiti all'opera adesso. Se il tuo sito web è pubblicato in una lingua diversa dall'inglese, ti consiglio caldamente di NON aspettare che Panda colpisca i siti nella tua lingua e di vedere se il tuo sito web rimane incastrato nel suo rastrello, ma di agire pro-attivamente per cambiare il tipo di contenuti e le relative variabili sotto il tuo controllo che potrebbero potenzialmente innescare Panda.

Dentro la Parte 3 della Guida a Google Panda voglio condividere i passaggi che io ed il mio team di MasterNewMedia abbiamo fatto per assicurarci che i segnali che fornivamo ai robot di Google non rappresentassero in alcun modo - come se ce ne fosse ancora bisogno - quelli di un tipico sito di scarsa qualità.

Nello specifico:

  • Quale approccio strategico abbiamo usato per MasterNewMedia
  • Che passi abbiamo compiuto
  • Come trovare contenuti "nascosti" o "scarsi" sul tuo sito
  • Quale tipo di contenuti "scarsi" abbiamo trovato e pulito
  • Contenuti duplicati
  • Problemi legati agli annunci pubblicitari
  • I tag, le pagine di archivio e le notizie

Il mio obiettivo con questo report, è fornire informazioni utili a coloro che si trovano nella mia stessa situazione e pensano non dovrebbero starci, e però non sanno dove cercare o cosa fare a riguardo. Come ho già scritto, voglio condividere queste informazioni anche con i numerosi editori online che pubblicano in lingue diverse dall'inglese, e che attendono nervosamente che Panda arrivi nei siti delle loro lingue.

Le mie non sono soluzioni - almeno per adesso - ma solo dati ed informazioni che puoi usare per capirci qualcosa su questo puzzle che è Panda.

Dato il tempo che io ed il mio team abbiamo speso su questa cosa, ed i risultati visti finora (zero), si potrebbe facilmente concludere che i problemi che ho elencato prima, e su cui ho lavorato per uscire dalla penalizzazione di Panda, siano chiaramente delle variabili non critiche per far risollevare sa sole un sito web.

Ma è vero anche che, per adesso, Panda NON funziona in tempo reale, e quindi per affermare con certezza che questi punti non siano in grado di fare la differenza, bisognerà ancora attendere qualche tempo. Quando Google ri-aggiornerà i suoi indici e l'intera gamma di siti penalizzati da Panda, allora saremo in grado di vedere meglio cosa funziona davvero e cosa no.

Queste, le strategie ed i passi chiave che ho applicato su MasterNewMedia per riprendermi da questa situazione disastrosa.

Ti invito a guardare anche:
La Guida A Google Panda - Parte 1: Cosa È, Come Funziona, Danni Collaterali
La Guida A Google Panda - Parte 2: Il Nuovo Algoritmo Che Autoapprende E Come Approcciarlo

 

 


Quali Passi Chiave Ho Compiuto per Riprendermi da Panda

Questi sono i primi passaggi chiave che ho fatto dopo che io ed il mio team di MasterNewMedia abbiamo capito di essere stati colpiti da Google Panda.




1) Analisi dei Report

Questa cosa ha richiesto di scavare a fondo tra i dati analitici e di cercare specifici cambiamenti nel traffico, nelle visite provenienti da altri siti e nel posizionamento dei nostri contenuti più importanti e profittevoli.

Abbiamo deciso di raccogliere tutti i dati che avevamo a disposizione e di identificare quali fossero gli articoli che erano stati colpiti in maniera più pesante su MasterNewMedia. Volevamo vedere se ci fossero dei tratti comuni, delle somiglianze o delle caratteristiche peculiari che distinguessero tali articoli da tutto il resto del sito.

Il primo passo in questa direzione è stato avere una chiara visuale di quali pagine avessero perso traffico a differenza di quelle pagine che avevano mantenuto un livello di traffico stabile (o più alto in alcuni casi). Abbiamo raccolto i dati usando Google Analytics e creato uno script che ha confrontato i dati delle principali 250 pagine con più traffico prima dell'avvento dell'aggiornamento Panda con gli stessi dati del post-Panda.

In seguito, abbiamo organizzato e diviso tali articoli in quattro gruppi distinti:

  1. Articoli che avevano perso traffico.
  2. Articoli che avevano incrementato il traffico.
  3. Articoli che avevano perso così tanto traffico a causa di Panda, che non erano più tra le prime 250 pagine per livello di traffico.
  4. Articoli che non erano tra le prime 250 pagine più viste prima di Panda, e che sono diventati articoli di punta dopo la penalizzazione.

Arrivati a questo punto, abbiamo iniziato a cercare tratti comuni tra i gruppi, per identificare possibili aree deboli da sistemare o migliorare.

Un'osservazione chiave emersa dalla nostra analisi è la seguente:

Panda non considera necessariamente un sito "svalutato" o "penalizzato" solo perché alcune pagine hanno perso posizionamento. Abbiamo notato che, nello stesso sito, alcune pagine avevano perso posizioni nei risultati di ricerca, mentre altre ne avevano guadagnate parecchie.

In maniera forse curiosa, lo stesso si può dire delle URL. Panda sembra concentrarsi unicamente sui risultati.

Ciò vuol dire che la stessa pagina può scendere di posizioni per alcune parole chiave e rimanere stabile per altre.

Una delle nostre pagine più popolari, la RSSTop55, ne è un chiaro esempio. Qui sotto puoi vedere elencate alcune delle principali parole chiave che erano, e sono tutt'ora, usate per trovare questa guida di MasterNewMedia tramite una ricerca su Google. Per ciascuna, puoi vedere il posizionamento della RSSTop55 "prima" e "dopo" l'aggiornamento Panda.

URL: http://www.masternewmedia.org/rss/top55/

Parole chiave e posizionamento:
best rss prima Panda 6 - dopo 21
best rss feeds prima Panda 7 - dopo 53
rss directory prima Panda 8 - dopo 35
rss directories prima Panda 1 - dopo 6
rss directory list prima Panda 3 - dopo 3




2) Revisione di Gruppo e Brainstorming

È meglio guardare i dati ed i problemi da quanti più angoli differenti è possibile ed analizzare tutte le soluzioni alternative che si possano trovare. Ecco perché ho deciso che la seconda cosa più importante da fare fosse radunare il mio team e guardare a mente aperta alla situazione, suggerendo allo stesso tempo idee per risolvere i problemi che avevamo identificato.

Ci siamo virtualmente seduti in una conferenza su Skype ed abbiamo speso dai 30 ai 60 minuti giornalmente per analizzare e condividere riflessioni su ciò che avevamo trovato e su quale fronte potessimo muoverci. Abbiamo fatto questa cosa ogni santa mattina per due mesi interi, finché abbiamo capito che non avevamo nient'altro da sistemare, aggiustare o migliorare.




3) Piano d'Azione

Sulla base della nostra analisi, revisione dei problemi e brainstorming di possibili soluzioni, ho sviluppato un piano d'azione basato sulle aree principali da analizzare più a fondo, e sulle quali dovevamo iniziare immediatamente a sistemare i problemi.

Questo piano è stato seguito ogni giorno su micro e macro livelli. Avevamo una grande mappa mentale di problemi ed inconvenienti che avevamo identificato come possibili cause o aree problematiche dove c'era bisogno di un miglioramento, e da lì aggiungevamo nuovi elementi ogni giorno da ricontrollare ed analizzare in gruppo, insieme ad uno specifico piano di lavoro per ogni giorno lavorativo sul fronte Panda.

 

Aree Chiave Analizzate



a) Contenuti Scarsi od Inesistenti

google-panda-update-thin-content-id26395991.jpg

I contenuti scarsi sono contenuti o troppo corti o troppo leggeri, relativamente alla quantità di altri elementi presenti su una pagina web. Contenuti scarsi sono considerati anche quei contenuti che forniscono poco o nessun valore immediato per i lettori, contenuti generati tramite procedure automatizzate o aggregando automaticamente dei titoli senza fornire valore ulteriore.

Guardando ai nostri contenuti su MasterNewMedia, e scavando attraverso aree del sito e pagine che di norma non guardiamo mai, abbiamo trovato un sacco di contenuti potenzialmente scarsi e deleteri.

Questi erano per la maggior parte:


  • Pagine con Contenuti Scadenti


    Pagine molto vecchie che, per un motivo o per un altro, avevano perso parte del loro contenuto (i template erano stati cambiati senza guardare alle conseguenze) od in alcuni casi erano totalmente vuote.

    Azioni intraprese: Aggiunti i metatag NOINDEX - NOFOLLOW



  • Pagine di Notizie


    Pagine di contenuto e di notizie vecchie, talvolta di sei anni fa, con piccole notizie composte alle volte da uno o due paragrafi solamente.

    Azioni intraprese: Cancellate - inviate a 404



  • Pagine Tag


    Le pagine tag generate dal CMS (content management system) o da qualche plugin dedicato. Per lo più, una pagina tag è generata da ogni nuova tag che usi nei tuoi articoli e, se hai fatto una cosa del genere per anni, dimenticandoti delle pagine tag, potresti seriamente aver pubblicato un centinaio di pagine tag che, nella maggioranza dei casi, forniscono un valore ed un'utilità molto esigue ai tuoi lettori.

    Azioni intraprese: Cancellate - inviate a 404



  • Articoli Introduttivi


    Gli articoli Introduttivi erano articoli corti che ho pubblicato per un periodo di tempo relativamente breve (un paio d'anni fa), che funzionavano da apripista per articoli più lunghi. Questi fornivano solo una breve introduzione all'articolo, e per qualche tempo usavano anche lo stesso contenuto iniziale ed immagine usati nell'articolo completo.

    Azioni intraprese: Cancellate - inviate a 404



  • Contenuti con Molto Traffico Irrilevanti per gli Argomenti Trattai dal Sito


    I contenuti non rilevanti sono contenuti che non si riferiscono alle tue aree di competenza o di maggior interesse ma che, nonostante ciò, ricevono tonnellate di traffico. Essendo stato uno sperimentatore ed una persona curiosa come editore, ho coperto argomenti che potrebbero essere stati visti da Google come non rilevanti per la maggior parte del mio pubblico. Nello specifico, avevo coperto in passato lo tsunami del 2004 nel Sud-Est asiatico con un report curato che integrava tutte le clip video esistenti che ero stato in grado di recuperare online. Come conseguenza di ciò, MasterNewMedia avrebbe avuto fino ad oggi, migliaia di visitatori che cercavano informazioni e video su quell'argomento. Così tanti, infatti, che per lunghi periodi di tempo e fino a pochi mesi fa, questo insieme di pagine avrebbero rappresentato le sezioni più viste del sito.

    Azioni intraprese: Spostato su un dominio separato e ridirezionato con un 301



  • Eccessive Pagine sugli Articoli Multi-Pagina


    Avere articoli lunghi composti da troppe pagine potrebbe causare una sgradevole esperienza utente ed essere causa diretta della proliferazione di contenuti scarsi.

    Azioni intraprese: Ridotto in maniera significativa il numero di pagine di articoli e guide multi-pagina, facendo sì che ogni pagina avesse più testo / recensioni ed accertandosi che ogni pagina avesse una sufficiente quantità di contenuto di qualità ed un'appropriata proporzione tra contenuti e pubblicità. (Direi che 3:1 o più sia una buona proporzione).



  • Altre Possibili Pagine con Contenuti Scarsi


    Durante la nostra lunga ricerca abbiamo trovato un sacco di contenuti scarsi o deleteri che non sapevamo di avere. Trovare queste pagine "perse", inutili o potenzialmente dannose, è una sfida di per sé, perché non sai esattamente dove andare a guardare.

    Azioni intraprese: Un modo molto efficace e semplice per trovare contenuti potenzialmente scarsi che si nascondono nel tuo sito, è effettuare la seguente ricerca su Google: -asdfsda site:iltuosito.com. Scorri questi risultati in maniera casuale e fai attenzione a cosa trovi. Dopo, vai all'ultima pagina dei risultati e guarda se lì Google ti dice:

    "Al fine di visualizzare i risultati più rilevanti, sono state omesse alcune voci molto simili alle x già visualizzate. In alternativa, è possibile ripetere la ricerca includendo i risultati omessi."
    . Se succede, clicca su "ripetere la ricerca includendo i risultati omessi" e puoi stare certo che lì troverai dei sospetti interessanti sia per contenuti "scarsi" o "duplicati". Provalo subito.

    Ridotto in maniera significativa il numero di pagine di articoli e guide multi-pagina, facendo sì che ogni pagina avesse più testo / recensioni ed accertandosi che ogni pagina una sufficiente quantità di contenuto di qualità ed un'appropriata proporzione tra contenuti e pubblicità. (Direi che 3:1 o più sia una buona proporzione).

 

b) Contenuti Duplicati

google-panda-update-duplicated-content-id6935051.jpg



  • Pagine Archivio


    Le pagine archivio possono generare facilmente contenuti duplicati, perché a Google ed agli altri motori di ricerca possono sembrare una moltitudine di pagine con lo stesso titolo. In più, se queste, come nel mio caso, forniscono accesso a centinaia di pagine che vanno indietro fino al 2001 elencando cronologicamente ogni singolo contenuto pubblicato, queste potrebbero anche finire per avere caratteristiche simili alle pagine con contenuti "scarsi". Poco contenuto, generate automaticamente, poco o nessun valore ulteriore aggiunto, in alcuni casi troppo poco contenuto.

    Azioni intraprese: Cancellate - inviate a 404



  • Serie di Articoli


    Le serie di articoli, almeno nel mio caso qui a MasterNewMedia, sono articoli, serie di recensioni od altri tipi di contenuti che ho pubblicato settimanalmente per un periodo di tempo relativamente ampio (1-2 anni), e che avevano per la maggior parte lo stesso titolo. Un valido esempio sono gli Sharewood Picnics di qualche anno fa, che ogni Domenica fornivano una serie di piccole recensioni di servizi appena rilasciati. Per la maggior parte, questi articoli settimanali condividevano tutti la stessa parte iniziale del titolo, giacché la differenza stava solo nell'ultima parola dello stesso (esempio: New Media Picks Of The Week: Sharewood Picnic 36).

    Un altro caso che poteva potenzialmente generare contenuti duplicati avrebbe potuto essere la nostra serie settimanale dedicata a Media Literacy di George Siemens, che ci aveva fornito il permesso di aggregare i suoi post giornalieri dentro un unico grande digest settimanale su MasterNewMedia. Ovviamente, ogni digest di questo tipo citava chiaramente come autore George Siemens e linkava il suo blog. In questo caso, inoltre, i titoli della serie erano sempre gli stessi per la prima parte (esempio: Media Literacy: Making Sense Of New Technologies And Media by George Siemens - Aug 15 09) dove l'unico elemento diverso era la data alla fine.

  • Azioni intraprese: Aggiunti i metatag NOINDEX - NOFOLLOW



  • Contenuti Ripubblicati Illegalmente


    Il dopo Panda, è stato caratterizzato da molti siti web automatici che ripubblicano il nostro contenuto ed appaiono prima di noi nei risultati di ricerca di Google. Anche qualora avessimo meritato di essere colpiti da Panda, non capisco perché i miei contenuti, ripubblicati su altri siti senza alcun credito o link indietro, debbano essere classificati prima dell'originale.

    Azioni intraprese: Dato che è letteralmente impossibile contrastare efficacemente questi siti che prendono i contenuti dai nostri feed RSS e li ripubblicano, né è fattibile pensare di inviare per ognuno una richiesta di esclusione dai risultati di ricerca al DMCA - considerando anche che Google non può spesso agire rapidamente ed in maniera efficace in tal senso - abbiamo scelto la cura più rapida. Ritardare la pubblicazione del feed RSS che, se da un lato è una pratica che rimpiango come editore, ci dà idealmente un po' più di tempo per far sapere a Google quando pubblichiamo qualcosa di nuovo.

    P.S.: Verifica con Copyscape sei tuoi articoli più letti pubblicati in passato sono stati colpiti duramente e rimpiazzati nelle SERP da altri contenuti copiati illegalmente - controlla e riferisci.



  • Articoli Relazionati


    Gli articoli relazionati sono gli articoli complementari che suggerisco di leggere alla fine di ogni articolo. A MasterNewMedia ho sempre mostrato sei articoli relazionati per ogni articolo. Per ogni articolo relazionato, c'era un titolo linkato, la miniatura di un'immagine ed un estratto testuale dell'introduzione.
  • Azioni intraprese: Ridotto il numero degli articoli relazionati, rimosso il testo per ognuno.



  • Contenuti Ripubblicati


    Nel tempo, ho chiesto molte volte permesso a persone che conoscevo, mi piacevano od avevo semplicemente appena scoperto, di curare, illustrare e ripubblicare i loro contenuti originali su MasterNewmedia con piena attribuzione e link indietro. L'obiettivo editoriale era specificatamente identificare favolosi contenuti che poche persone conoscessero, curarli in maniera profonda rendendoli più leggibili ed illustrandoli, fornendo ulteriori riferimenti e link, e fornendo loro un palcoscenico per raggiungere un pubblico più vasto e multilingua (MasterNewMedia è pubblicata in quattro lingue diverse).

    Azioni intraprese: Nessuna. Credo che contenuti del genere abbiano il diritto di stare lì per come sono, dato che sono stati pubblicati con il permesso esplicito dell'autore, e ne attribuiscono la paternità totalmente e linkando l'articolo originale. Il ruolo di MasterNewMedia come scopritrice e curatrice di tali contenuti, a mio modo di vedere, non è assolutamente qualcosa di cui vergognarsi. MasterNewMedia aggiunge valore tangibile ai contenuti, formattandoli nuovamente, illustrandoli e rifinendo i link ed i riferimenti, come traspare chiaramente confrontando la versione originale di qualunque contenuto con la nostra versione ripubblicata.



  • Template di Sistema


    Non mi sono ancora del tutto chiari gli aspetti tecnici di questa cosa, ma di una cosa sono certo. Cercando contenuti scarsi e ripubblicati mi sono imbattuto in alcune pagine che non avevo mai visto prima sul mio sito. In verità, non sono del tutto certo che altre persone abbiano avuto modo di vederle. Ma Google sì. E grazie all'indice di ricerca di Google sono stato in grado di individuarle, esaminarle ed accorgermi che, se Google vede queste pagine e queste pagine non vanno bene, o non sono utili, allora è una buona idea sbarazzarsene.

    Le pagine, almeno nel mio caso, sono pagine di articoli che ho sul mio sito, ma che esistono ad una URL diversa da quella "ufficiale", e sono anche "vestite" da un template di sistema nudo e crudo, creato dal mio CMS.

    Azioni intraprese: Identificate e cancellate (404) cosicché non possano più essere trovate.

     

    c) Proporzione Contenuti / Pubblicità

    google-panda-update-ratio-proportions-id28215531.jpg

    Un'altra possibile causa di Panda che abbiamo identificato, è stata la proporzione tra contenuti ed annunci pubblicitari.



    • Quantità di Annunci Basata sulla Lunghezza dell'Articolo


      Anche se l'approccio editoriale di MasterNewMedia è caratterizzato da articoli lunghi ed approfonditi che siano molto curati, illustrati ed abbiano numerosi riferimenti esterni, fornendo di base una proporzione tra contenuti e pubblicità già molto buona, abbiamo deciso di fare ulteriori ricerche, e di stabilire anche delle regole specifiche in merito a quanti annunci (di Google) avremmo mostrato su di una pagina in base a alla quantità di contenuto che la pagine avesse.

      Azioni intraprese: Dato che gli articoli possono variare come lunghezza da post corti ed articoli brevi sotto le 400 parole, fino a report approfonditi o mini-guide con oltre 2000 parole, abbiamo creato dei template separati per articoli lunghi e corti, impostando un confine chiaro di 805 parole come limite minimo per mostrare gli annunci pubblicitari.



    • Numero di Annunci Basato sulla Lunghezza dell'Articolo


      Una volta implementato, abbiamo rifinito ulteriormente questo approccio, definendo esattamente quanti annunci singoli mostrare, ed in quale posizione in base alla lunghezza dell'articolo. Questo ci ha permesso di renderci conto che gli annunci non sarebbero stati mostrati su articoli con poco contenuto e che i contenuti più lunghi avrebbero sempre avuto un numero di annunci proporzionale alla dimensione dell'articolo.


    • Annunci di Google Sotto l'H1 del Titolo


      La seconda considerazione che abbiamo fatto è stata la presenza, anche in articoli con un'ottima proporzione tra contenuti ed annunci pubblicitari, di un gruppo di annunci molto visibile, proprio sotto il titolo e prima del contenuto effettivo. Su monitor di modeste dimensioni e basse risoluzioni, questi annunci di Google prendono la maggior parte dello spazio visibile above-the-fold, e potrebbero non fornire, anche quando rilevanti, la migliore esperienza utente possibile.

      Azioni intraprese: Ridotto drasticamente il numero degli annunci sotto il titolo degli articoli lunghi, ma dato che questi specifici annunci producono ancora una parte rilevante dei nostri introiti pubblicitari, dopo qualche tempo abbiamo dovuto eliminare questa soluzione, perché tenendo in considerazione che Panda si aggiorni o cambi ulteriormente, questa cosa ci causava solo una tremenda perdita di introiti con nessun beneficio tangibile in nessun altro fronte.

      Quindi, questo potrebbe davvero essere un cambiamento rilevante, ma non è economicamente sostenibile per noi al momento.




    d) Altre, Improbabili Cause che Abbiamo esaminato



    • Integrità dei Link


      Il nostro prossimo dubbio riguardava la qualità dei link. Ciò implicava un approccio su più fronti:
      1. Inventario di tutti i link rotti sul sito
        Anche se un periodico controllo di qualità dovrebbe essere scontato, ho fallito ripetutamente nel riservare abbastanza tempo per mantenere pulito ed immacolato l'inventario dei nostri link che vanno all'esterno. Ma, data la gravità della situazione, ho colto l'opportunità di ritornare su questo fronte e fare quanta più pulizia possibile.

        Azioni intraprese: Lanciare Link Sleuth (PC) ed Integrity (Mac) su tutto il sito per identificare tutti i link rotti esistenti.



      2. Identificazione dei Link che Finivano in 404
        Il passo successivo dopo l'inventario generale dei link rotti, è stato identificare quali di questi link rotti fossero causati da un sito web o da un servizio che non esiste più.

        Azioni intraprese: Ho scandagliato tutti i link rotti manualmente e mi sono accorto subito di quanto tempo richiedesse questa operazione. Per velocizzare il processo, abbiamo creato uno script che controllava automaticamente se il 404 fosse dovuto ad un sito od un servizio che non esisteva più, o se una pagina individuale od una URL fossero cambiate.



      3. Identificazione dei Link che Puntavano a Siti Dannosi
        Anche su questo fronte, le cose non erano così facili come pensavamo. Il nostro attuale sistema di gestione dei commenti si basa sulla piattaforma Disqus, che è un servizio di terze parti che sostanzialmente ospita i contenuti dei nostri commentatori sui loro server, ma perette a noi di pubblicarli sotto gli articoli relazionati tramite un codice embed in JavaScript. I link dannosi che uscivano fuori da quei commenti potevano essere un problema per noi? Non ne eravamo certi.

        Tuttavia, su migliaia di vecchi articoli che abbiamo su MasterNewMedia, avevamo i commenti di MovableType, che sono presenti all'interno del codice HTML delle nostre pagine. Ciò vuol dire che qualunque link che un commentatore possa aver posizionato sul sito, avrebbe potuto nascondere un link di spam che portava siti web potenzialmente dannosi.

        Azioni intraprese: Abbiamo preparato uno script che ha fatto la maggior parte del lavoro. Ha esaminato tutti i commenti ed isolato tutti i link al loro interno, per facilitare una revisione manuale da parte di un editore umano. Anche se può sembrare ridondante, è stato necessario che alcuni dei link controllati dallo script fossero ricontrollati dall'occhio umano di un redattore, perfettamente innocente. Alcuni anchor text ed anche la URL del link erano spesso relativi a degli articoli specifici. Ma quando aprivi il link, c'era una sorpresa: il link non andava dove ti aspettavi, e ti portava dritto ad un sito dannoso. Ad ogni modo, non c'era un numero significativo di questi link e li abbiamo puliti in maniera relativamente veloce.

        Abbiamo anche rimosso tutti i link che non erano necessari dall'header e dal footer.



    • Proporzione tra Dimensione del File e Contenuto dell'Articolo


      Per assicurare una migliore proporzione tra dimensione del file e contenuto dell'articolo, abbiamo deciso di ottimizzare il codice della pagina per avere pagine che si caricassero in maniera più veloce. Sebbene avessimo già speso parecchio tempo nel 2010 per ottimizzare e migliorare la velocità totale del sito, volevamo controllare più a fondo se avessimo ancora parti di codice nelle nostre pagine od elementi HTML che non fossero più necessari e che potessero essere rimossi.

      Azioni intraprese: Abbiamo in effetti trovato e rimosso elementi inutili, vecchi o ridondanti sia nell'header e nel footer così come nelle colonne laterali che non era necessario tenessimo.

      Abbiamo cercato sostanzialmente di minimizzare la quantità di codice HTML usato nella pagina.



    • Qualità del Testo


      Ispirato da un video di Matt Cutts che parlava della qualità del testo, abbiamo speso del tempo anche per controllare e misurare la qualità della nostra scrittura usando gli indici Lexical Density e Gunning Fog.

      Azioni intraprese: Sfortunatamente, non abbiamo notato nessun tratto comune rilevante su questo fronte. Una cosa che però abbiamo riscontrato durante la nostra ricerca, è stato che l'indice Gunning Fox era quasi sempre intorno a 12 per i nostri articoli migliori.



    • Link Relativi


      Mentre sistemavamo altre cose, abbiamo notato, grazie al feedback degli utenti, che avevamo un considerevole numero di link che erano "relativi" invece di essere "assoluti".

      Azioni intraprese: Cambiati tutti i link relativi in assoluti.



    • Trattini nelle URL


      Dato che alcuni blog su Panda speculavano (fai attenzione, perché abbiamo perso un sacco di tempo per ascoltare e testare queste cose) che più di dieci trattini dentro una URL potessero non piacere a Google, volevamo controllare se, avere pubblicato tanti articoli con URL lunghe, potesse essere un problema.

      Azioni intraprese: Abbiamo controllato e misurato se i "trattini nelle URL" fossero un problema reale o solo fuffa. E fuffa erano.

      Abbiamo scoperto che alcune delle nostre pagine che avevano avuto più traffico dopo Panda, avevano infatti un sacco di trattini dentro le URL. Alcune, anche fino a 14. Ecco un paio di esempi:

      a) /information_access/p2p-peer-to-peer-economy/peer--to-peer-governance-production-property-part-2-Michel-Bauwens-20071020.htm ha avuto un incremento del 7% dopo Panda

      b) /information_access/p2p-peer-to-peer-economy/peer--to-peer-governance-production-property-part-1-Michel-Bauwens-20071020.htm ha avuto un incremento del 21% dopo Panda

      N.B.: Usiamo i trattini come separatore tra le parole da moltissimo tempo ed abbiamo scoperto che molte URL che hanno ricevuto più traffico dopo l'aggiornamento Panda contengono trattini. I due articoli sopra sono solo i due esempi più estremi.



    • Liste (Tag LI nel testo)


      Alcune speculazioni pubblicate su articoli che parlavano di Panda, suggerivano che un testo con il tag LI (liste ordinate o non-ordinate) potesse posizionarsi meglio dopo Panda rispetto ad uno senza.

      Azioni intraprese: Controllati i dati prima e dopo Panda, ed i risultati hanno dimostrato che c'erano pagine con liste sia tra gli articoli che avevano guadagnato traffico sia tra quelli che l'avevano perso, dunque non c'è nessuna prova definitiva che confermi o smentisca la speculazione sull'effetto positivo dei tag LI.



    • URL Senza Estensioni


      Un certo numero di siti web (specialmente quelli basati su WordPress) hanno URL senza estensioni (.htm, .html, ecc). MasterNewMedia usa questo tipo di URL dal 2008, e volevamo controllare se ci fosse prova che questa variabile nelle URL avesse qualche correlazione con gli articoli colpiti da Panda.

      Azioni intraprese: Siamo andati a confrontare i principali 250 articoli più visti sul nostro sito ed abbiamo scoperto che 107 su 250 di questi hanno delle URL SENZA estensioni - sia prima che dopo Panda. Quindi. anche qui, nessuna prova tangibile od immediatamente riconducibile a Panda.



    • Frames ed iFrames


      Altri report speculativi menzionavano l'uso dei frames nelle pagine web come un'altra possibile causa di Panda.

      Azioni intraprese: Dato che non usiamo i frames sul sito, non siamo nella posizione migliore per investigare questa cosa, ma abbiamo alcune pagine che usano iframes ed alcune di esse hanno subito un impatto negativo mentre altre hanno incrementato il traffico. Per farla breve - non c'è nessuna prova ultima dell'impatto negativo dei frames che sia stata trovata su MasterNewMedia.


     

    Conclusioni

    Il tempo totale che abbiamo investito per l'analisi e per le modifiche relative a Panda è stato di almeno 60 giorni circa o più fino ad adesso.

    Sfortunatamente non posso fornire a questo punto alcuna prova del fatto che alcune di queste azioni che abbiamo intrapreso siano davvero utili per riprendersi da una "penalizzazione" di Panda.

    Potrebbe benissimo essere che potessimo tenere la maggior parte di quei contenuti che abbiamo rimosso, cancellato od impostato su NOINDEX, e che la paura generata da questa improvvisa perdita di "introiti" ci abbia fatto agire in modi che, in altre situazioni, considererei molto aggressivi.

    Solo il tempo e la prossima iterazione di Panda, ci daranno una risposta.

    Mentre il tempo passava, e portavamo avanti tutti questi cambiamenti e rifiniture, mi sono convinto sempre più che non sia nessuno di questi cambiamenti individuali che possa salvarti il culo dal filtro di Panda.

    È più una questione di cosa fai con le tue pagine per renderle utili, attraenti ed ammirate dai lettori, che conta di più e sul quale devi lavorare.

    Su questo fronte, ho speso tempo a produrre un alto numero di ricerche approfondite e report e guide di alta qualità, esattamente come piacciano a Google.

    Ma evidentemente, non è abbastanza.

    Aumentare il tempo di permanenza sulla pagina e diminuire la bounce rate associata alla poca permanenza sul sito, sono i tipi di cose dove ho ancora margine di manovra per migliorare. Ma ciò richiede di smettere quasi del tutto il canale di introiti principale che ha permesso ad una piccola rivista indipendente come MasterNewMedia di rimanere in vita per tutti questi anni. E come ho scritto prima, non sono ancor disposto a rinunciare a quei soldi tutto d'un colpo.

    Quindi, come posso - o puoi - uscire da questo circolo vizioso?

    Vuoi soddisfare Panda, ma dipendi dal traffico dei motori di ricerca e dagli introiti degli annunci pubblicitari che Google ti manda. E se riesci a far felice Panda, per esempio spegnendo gli annunci principali che hai, i tuoi introiti pubblicitari vanno giù di colpo.

    L'unica soluzione, per come la vedo io, è non dipendere da Google ed utilizzare il tuo sito web per crescere un seguito di tifosi davvero sfegatati, ed offrire loro contenuti o servizi di qualità così alta che queste persone vorranno pagarti per avere per contenuti, opzioni od intangibili di livello avanzato.

    Questa è la strada per uscire dalla dipendenza di Google perché, almeno per adesso, uno non può più contare sul produrre contenuti di alta qualità come ho fatto io, perché, a meno che Panda non abbia commesso qualche errore, chiaramente non è abbastanza agli occhi dei suoi nuovi criteri di classificazione.

    Dato il numero di contenuti presi e ripubblicati illegalmente che adesso sono posizionati prima di MasterNewMedia per specifiche parole chiave che appartengono ai nostri contenuti, c'è una speranza seria che Panda possa aver bisogno di più tempo per ristabilire un ordine corretto dentro le SERP di Google, ma dato che non esiste alcuna garanzia in merito, né so quando questa cosa accadrà, penso sia meglio concentrarsi su altri fronti.



    Nel prossimo articolo, Illustrerò la mia visione di un ideale motore di ricerca del futuro, che sia davvero imparziale ed inalterabile da pratiche scorrette. Non so se Google sarà colui che prenderà questa strada, ma penso sinceramente che qualcuno, desideroso di creare il primo motore di ricerca totalmente trasparente, la imboccherà presto.





    Enrico Madrigrano analizza le possibili cause di Google Panda, offrendo alcuni spunti particolarmente interessanti.


     

     


    Se te le sei perse, ecco le altre Parti di questa Guida:

    La Guida A Google Panda - Parte 1: Cosa È, Come Funziona, Danni Collaterali

    La Guida A Google Panda - Parte 2: Il Nuovo Algoritmo Che Autoapprende E Come Approcciarlo

    La Guida A Google Panda: Parte 4 - Il Futuro Che Vorrei

    La Guida A Google Panda: Parte 5 - Il Dilemma Di AdSense

     



    ebook-penalizzazione-download.png

     



    Scritto da per MasterNewMedia e pubblicato per la prima volta il 31 maggio 2011 con il titolo "The Google Panda Guide - Part 3: What To Look For, What To Clean". Traduzione ed editing di Daniele Bazzano.




    Photo credits:
    Contenuti Scarsi o Nulli - superdumb
    Contenuti Duplicati - Norebbo
    Proporzione Contenuti / Pubblciità - robynmac


     
     
     
     
     
    Commenti    
    blog comments powered by Disqus

     

     

     

     

    16667
     
    



     

    I Toolkit di Robin


     









     

     

     

     

  • RSS Feed

          Mail
    Nome:
    Email:
     



     
     

     

    Web Analytics