Quando ho letto questo articolo di Michael Martinez su come funziona Google Panda e le sue riflessioni molto interessanti sui meccanismi dietro a questo algoritmo, ho subito pensato di inserirlo nella SEOttimana.
Ma non sarei mai riuscito a riassumere in pochi minuti tutti questi spunti molto interessanti su Google Panda, che è uno degli algoritmi più discussi ma comunque più misteriosi ( per tantissimi motivi, e lo è ancora di più da quando è diventato “lento” ) e spaventosi di Google, sopratutto per chi i siti li fa senza troppa convinzione od impegno.
Inoltre so, dati di lettura degli articoli alla mano, che anche l’inglese spaventa ( e anche la lunghezza, ma se si vuole imparare qualcosa, bisogna impegnarsi un poco suvvia! ).
Ecco qui allora la traduzione integrale del post, oltre 4000 parole! Un bellissimo articolo senza, a mio giudizio, niente di superfluo o fuori posto.
Buona lettura!
Questo articolo è comparso per la prima volta sul blog SEO Theory di Michael Martinez
Potete trovare l’articolo originale qui: How the Panda Algorithm may evaluate your site
Quello che ho capito di Google Panda in questi 4 anni
Facciamo un passo indietro al 2011 e consideriamo nuovamente le 23 domande che Amit Singhal ha pubblicato per i Webmaster. Erano tempi dove la confusione e la frustrazione causate dall’algoritmo Panda ai SEO toccavano i massimi livelli. Personalmente risolsi i miei problemi con Google Panda nel giro di due mesi, come ho documentato in questo post scritto nel Giugno 2011.
Ma la mia soluzione, ovvero cancellare più di 20.000 pagine di contenuti per poi ripartire dai 100 più importanti, è sempre stata considerata “troppo radicale” , anche se sono ritornato piuttosto velocemente al traffico pre Panda, arrivando nel tempo a superarlo.
Quello che non potevo fare in quel momento, lavorando sotto un patto di non divulgazione molto restrittivo, era condividere ciò che avevo imparato dell’algoritmo Panda grazie al mio studio di molti siti Web colpiti da esso. Nel 2013, quando il mio patto di non divulgazione è scaduto, ho pubblicato alcune delle mie scoperte in “come funziona l’algoritmo Google Panda”.
Anche oggi, per quel che ne so, rimane la migliore descrizione di quello che un algoritmo di learning come Panda fa, e anche il miglior chiarimento di alcune delle cose “esoteriche” che Googlers come Matt Cutts e Amit Singhal hanno menzionato nei loro commenti pubblici riguardo l’algoritmo stesso.
Quello che molti dei Web marketer non sembrano capire è che Panda non funziona allo stesso modo su tutti i siti Web. Come nel ben più grande ranking system di Google, il processo di valutazione di Panda può usare differenti segnali per differenti siti Web. Tutti vorrebbero una bella, ordinata e coincisa lista di cose da cercare sui loro siti, ma tutte le liste pubblicate nell’arco degli ultimi anni sono state troppo corte, troppo vaghe, troppo imprecise per aiutare veramente qualcuno.
Vi dirò da subito che più di metà dei siti che ho recuperato da Panda avevano semplicemente troppa navigazione sulle loro pagine. Lo abbiamo capito molto presto ma, come ho menzionato, avevo un patto di non divulgazione. Quando questo è terminato ho tenuto questa scoperta per me, perché non volevo che la gente la considerasse erroneamente come una soluzione universale ( NON è una soluzione universale! ).
Ora nel tardo 2015 ci sono troppe persone che parlano ancora di”contenuti sottili”, “migliorare i contenuti”, etc. etc. I Web marketer utilizzano delle definizioni molto limitate di”contenuto”: il contenuto è tutto ciò che sta sulla pagina e quando si sta scrivendo un algoritmo che disseziona un documento Web come Panda, si arriveranno ad avere centinaia di piccoli “segnali” che potrebbero o non potrebbero avere un significato nel complesso.
Quello che Panda cerca sono SCHEMI ( patterns ). Semplicemente questo. Nient’altro. Tutti gli algoritmi di learning cercano schemi.
Google ha preso un gruppo di siti Web, li ha sottoposti a un gruppo di persone per un’analisi “a mano” ( basata magari su un centinaio di domande, delle quali Amith Singhal ha pubblicato le 23 che ripubblicherò qua sotto), e sulla base delle risposte ottenute da queste persone gli ingegneri di Google hanno diviso questi siti Web in siti di ”bassa qualità” e siti di “alta qualità”. I risultanti siti di “bassa qualità” sono serviti come base per la valutazione di tutti i contenuti di “bassa qualità”, stessa cosa per quelli di “alta qualità”.
In altre parole, l’algoritmo Panda ha estratto i segnali da questo set di dati , che è servito per “l’apprendimento” dell’algoritmo, fino ad arrivare, con buona approssimazione, a fargli “capire” quali segnali avevano influenzato le decisioni degli ingegneri riguardo alla qualità dei siti.
Avete tutti avuto abbastanza dati disponibili per fare qualcosa di simile: tutto quello che avreste dovuto fare era di leggere le tante liste di siti ”Winners and losers” di Panda pubblicate e analizzare la struttura delle pagine su questi siti per identificare potenziali segnali che potessero essere usati per influenzare la valutazione di Panda di un sito Web.
In pratica non dovete neanche identificare esattamente i segnali che l’algoritmo usa: tutto quello che dovete fare è trovare un modo coerente di distinguere i Winners dai Losers. Solamente questo: seguire i vincitori e ignorare i vinti. Punto. Fine del problema Panda.
Ma purtroppo ora esiste anche il problema del lunghissimo tempo che Google impiega a rivalutare i siti web tramite Panda: se il vostro sito non migliora dopo il corrente “rilascio lento” dell’ultima versione di Panda dovrete attendere che Google rivaluti i vostri contenuti attraverso una futura scansione, chissà quando.
Alan LaFrance ha scritto un interessante commento su Search Engine Roundtable, spiegando come pensa che Google stia gestendo questi dati: forse Google è molto vicina ad automatizzare Panda, ma se anche fosse potrebbe volerci un altro anno per vedere la vera automazione in tempo reale.
Analisi delle 23 domande di Singhal ai webmaster per prevenire o recuperare da Panda
Ciò che segue sono consigli riguardo agli espliciti elementi da ricercare SUL VOSTRO SITO. Questa lista non sarà mai completa. Questa lista probabilmente non coinciderà mai esattamente con nessun sito. La regola principale nel risolvere un declassamento da Panda è disfare qualsiasi cosa abbiate fatto “per la SEO” e fare solamente ciò che va fatto per migliorare l’esperienza utente ( che non ha niente a che vedere con l’engagement e le metriche utente ),
( NOTA del traduttore: ho semplificato lo schema in testo per comodità: troverete prima la domanda di Singhal e dopo i potenziali segnali che Panda potrebbe utilizzare per leggere il sito dal punto di vista della domanda stessa )
Ti fideresti resti delle informazioni presenti in quest’articolo?
Tra i segnali che un algoritmo di learning potrebbe usare per decidere se un sito è affidabile:
- informazioni di contatto facili da trovare
- metodi di pagamento standard
- nessun contenuto nascosto
- nessuna promozione vaga o incomprensibile
- design di pagina pulito
- combinazioni di colore neutrale
- linguaggio non offensivo
- link riferiti a siti non commerciali o ben conosciuti
- poche affermazioni da spaccone
- minima o nessuna paginazione ( divisione di content su più pagine )
Questo articolo è scritto da un esperto o un appassionato che conosce l’argomento molto bene, o è di natura più superficiale?
Segnali che potrebbero indicare che l’autore è un vero esperto:
- viene indicato il nome dell’autore
- esiste un profilo dell’autore
- l’autore da una definizione dei termini e spiega i concetti
- l’autore riassume le informazioni in modo conciso
- l’autore crea link ad altre fonti di informazione
- l’autore esplora multipli sotto argomenti
- l’autore usa una terminologia adatta allo standard dell’argomento
Questo sito ha articoli duplicati, sovrapposti o ridondanti sugli stessi argomenti o su argomenti simili con solamente piccole variazioni sulle parole chiave?
La SEO spinta dalle parole chiave sputa fuori continuamente articoli “da manuale”, senza nessun riguardo rispetto al fatto che uno stesso argomento sia già stato trattato ( dallo stesso punto di vista ) sul sito.
Ti fideresti di questo sito tanto da dargli le informazioni della tua carta di credito?
La gente vuole trasparenza quando fornisce sul web le proprie informazioni finanziarie.
Ecco alcuni elementi che possono contribuire nel comunicare affidabilità e trasparenza:
- richiedere la registrazione utente
- informazioni di contatto chiare
- termini di servizio facili da trovare
- orari facili da trovare
- indirizzo dell’attività facile da trovare
- sistemi di pagamento standard di terze parti ( PayPal etc. )
- pagine FAQ ( domande frequenti )
- chiaro riferimento a licenze e eventuali informazioni governative
Questo articolo ha errori grammaticali, stilistici o riporta fatti errati?
Non fatevi ossessionare da questo punto.
La qualità dei contenuti di Wikipedia è atroce eppure Panda è stato molto clemente con il sito in questione.
Una nota: REVISIONATE E AGGIORNATE I VOSTRI CONTENUTI anche mesi o anni dopo che sono stati pubblicati. NON SMETTETE MAI DI FARLO.
Gli argomenti trattati sono spinti dal genuino interesse dei lettori del sito o viene generato del contenuto cercando di intuire ciò che potrebbe ben posizionarsi sui motori di ricerca?
Se il tuo sito sta pubblicando contenuti basandosi sulla keyword research stai sbagliando.
Le vere “autorità” di un argomento specifico guidano la discussione e ispirano nuove query.
Le politiche editoriali non dovrebbero essere dettate da liste di keyword costruite sui dati di Adwords: si dovrebbe ragionare sugli argomenti, senza costruire articoli intorno a titoli pieni di keyword.
Questo articolo contiene contenuti o informazioni, report, ricerche o analisi originali ?
Come potrebbe un algoritmo di learning identificare informazioni originali ?
- Utilizzo di frasi non ancora utilizzate per quell’argomento
- Utilizzo di sostantivi non ancora utilizzati per quell’argomento
- Link a contenuti più recenti e più nuovi
- Utilizzo di annotazioni non ancora utilizzate per quell’argomento su immagini, video e altri contenuti incorporati
La pagina ha un valore sostanziale quando comparata alle altre pagine contenute nei risultati di ricerca?
Questo è molto soggettivo. Il valore sostanziale potrebbe includere:
- Miglior organizzazione
- Maggior dettagli
- Informazioni originali
- Frasi uniche
- Diagrammi, illustrazioni o immagini
- Miglior scorrimento del testo ( o meno testo vago )
- Minima o assente paginazione
Quanto controllo di qualità è svolto sui contenuti?
Il controllo di qualità potrebbe includere:
- Regolari revisioni del testo
- Regolari aggiustamenti nel posizionamento di widget
- Regolari aggiustamenti nel posizionamento di immagini, video, etc.
- Regolari aggiustamenti alla navigazione
- Cambiamenti nello stile, fogli di stile, url, footers, etc. etc.
In buona sostanza, cambiate qualcosa, qualsiasi cosa che sia rotta o non funzioni. Non cadete nel “costruisci e dimentica”. Revisionate tutto dopo che è stato pubblicato, una settimana dopo, un mese dopo, sei mesi dopo. I motori di ricerca vedono i cambiamenti che apportate.
L’articolo descrive entrambe le facciate di una storia?
Non dovete trattare “pro” e “contro” in tutti i vostri articoli. Potete ad esempio citare fonti differenti, e spiegare perché non sono necessariamente d’accordo. Ma non tutte le storie sono o possono essere del tipo compara/contrasta.
Potreste anche solo mostrate l’evoluzione di un’idea, o come un’idea sia utilizzata in tanti differenti contesti. Non dovete essere scontati, cercando comunque di essere il più possibile completi.
Il tuo sito è identificato come un’autorità nella sua nicchia/argomento trattato?
Avete guadagnato i vostri link o vi state basando su quelli costruiti da voi stessi ? Questi due tipi di link lasciano “footprints” ( segnali che i motori di ricerca utilizzano per capire l’origine di un link ) molto differenti. Impara questa differenza.
Cercate di non essere scontati nei vostri approcci al web marketing. Capirete star guadagnando una reputazione quando la gente vi contatterà, lascerà commenti sul vostro sito e vu chiederà di scrivere per loro ( per le giuste ragioni, senza menzionare la SEO ), etc. etc.
I contenuti sono prodotti in massa o prodotti da una grande quantità di autori esterni, distribuiti su di un grande network di siti facendo in modo che molte pagine o siti non ricevano le adeguate attenzioni?
Sai già se stai facendo questo. Se è così e non hai nessun problema con Panda, continua così.
Se lo stai facendo e hai un problema con Panda, prendi in considerazione un cambiamento di strategia.
Se non lo stai facendo e non hai nessun problema con Panda, passa oltre.
L’articolo è stato ben scritto e revisionato o sembra approssimativo o prodotto in tutta fretta?
Avete notato come si torni sempre sulla REVISIONE?
Non parliamo solo di grammatica o di spelling: le FRASI creano footprint.
Contenuti ben congegnati utilizzano queste frasi in modo più ricco e completo, basandosi su vocabolari più completi.
Se sul tuo sito non pubblici “articoli”, ad esempio su forum o su ecommerce, questo ragionamento probabilmente non si applica al tuo caso.
Per una query legata alla salute, ti fideresti delle informazioni di questo sito?
Qual è la differenza tra sitoufficialedimedicina.it e ilmiositodirimedinaturaliconaffiliazioni.it? Scommetto che la conosci.
I segnali che un algoritmo di learning potrebbe utilizzare per identificare informazioni affidabili e autorevoli includono:
- Un ampio utilizzo di termini tecnici appropriati
- Un formato consistente negli articoli informativi
- Navigazione chiara e coincisa
- Navigazione ben congegnata
- Struttura ampia della pagina, con un buon uso di spazi e colonne
Riconosceresti questo sito come una fonte autorevole quando menzionato per nome ( Nota mia: brand! )
In quale altro spazio viene menzionato il sito con il suo nome?
- Articoli di news?
- Siti di media come YouTube?
- Blog?
- Forum?
- Comunicati stampa?
Come sono costruite le menzioni? C’è differenza tra il linguaggio del marketing, quello delle news e quello “casual” dei normali utenti. Un sito ben conosciuto riceverà menzioni in tutte queste forme.
Un sito “gonfiato” artificialmente solitamente si basa su tattiche promozionali rapide e di facile implementazione.
Il contenuto di alta qualità è menzionato più e più volte negli anni. Lo spam non molto.
Questo articolo contiene una descrizione completa e omnicomprensiva dell’argomento trattato?
E’ soggettivo. Questo non significa “inizia a scrivere articoli di 5000 parole”. Un algoritmo di learning potrebbe utilizzare segnali quali:
- Utilizzo di liste o tabelle nel contenuto
- Utilizzo di titolazioni ( headings ) nel contenuto
- Ripetizioni di frasi importanti nelle varie sezioni del contenuto
- Organizzazione specifica dell’articolo ( attraverso il markup HTML )
L’articolo contiene un’analisi arguta o informazioni interessanti che vanno oltre l’ovvietà?
L’analisi analitica, come sezione del testo, potrebbe includere segnali quali:
- Un set di frasi ed espressioni completamente differenti dal contenuto principale
- Punti illustrativi dei ragionamenti
- Citazioni diverse da quelle contenute nel contenuto principale
- Piccoli riassunti dei contenuti dell’articolo principale
- Riferimenti testuali alle sezioni di contenuto dell’articolo principale
E’ una pagina che vorresti mettere nei segnalibri, condividere con gli amici o in generale raccomandare a qualcuno?
A dispetto di quello che credono molti marketer, Google non sta tracciando i dati di user engagement degli utenti. Non gli è possibile raccogliere i dati per tutti i siti web e sono comunque troppo facilmente manipolabili.
Fate caso alle caratteristiche caratterizzanti dei contenuti molto condivisi, tra le quali:
- Una struttura in stile “lista” del contenuto
- Utilizzo delle titolazioni
- Inclusione di domande specifiche ( con risposte )
- Presentazione concisa delle informazioni
- Punti chiave delle informazioni facilmente comprensibili, individuabili ed estrapolabili
Questo articolo ha una quantità eccessiva di pubblicità che distrae o interferisce con il contenuto principale?
La pubblicità è una delle forme di disordine possibili presenti in una pagina. Alcune pubblicità sono semplicemente promozione di altri contenuti del sito, senza scomodare banner o altro. Una pubblicità è una pubblicità.
La pubblicità può essere un widget, un media incorporato, o un link di testo. Se è li per produrre conversioni, è pubblicità.
Ti aspetteresti di vedere questo articolo su di un magazine stampato, un’enciclopedia o un libro ?
Segnali che un algoritmo di learning potrebbe utilizzare per identificare pagine ad alta qualità includono:
- Un layout di pagina ben definito ( NON semantic markup o schema )
- Aree di contenuto ben definite
- Le fonti sono chiaramente citate ( fonti delle foto, autori, intestazioni, utilizzo di materiale coperto da copyright )
Gli articoli sono corti, senza sostanza o comunque carenti in dettagli utili e specifici ?
Anche se gli articoli corti di per se non conseguono automaticamente una bassa valutazione riguardo alla loro qualità, se l’argomento è sviluppato in modo chiaramente molto più lungo e dettagliato su altri siti qual è il senso di un articolo corto su quello stesso argomento?
Dovete fare in modo di dare spunti facilmente individuabili ed estrapolabili nelle vostre informazioni.
Se non potete riassumere il punto di un articolo corto in una frase che non sia “ho bisogno di pubblicare qualcosa!” probabilmente è di bassa qualità.
Le pagine sono prodotte con grande attenzione e cura dei dettagli e non in modo grossolano?
Segnali che indicano una grande “cura e attenzione per i dettagli” possono essere:
- Layout non standard in alcune parti del sito ( dove serve e per rendere più chiaro/fruibile/comprensibile/completo un contenuto )
- Elementi della pagina che non si sovrappongono sul display
- Il testo è facile da identificare e leggere
- L’architettura delle informazioni è ben sviluppata
- Le immagini e i contenuti “rotti” e mancanti sono sostituiti in un lasso di tempo relativamente breve
- Gli errori di battitura e le frasi troncate sono risolte in un lasso di tempo relativamente breve
- Gli elementi di navigazione sono aggiornati velocemente quando il contenuto cambia
- Le parti della pagina che sbordano ( troppo alte o larghe ) vengono aggiustate in tempistiche ragionevoli
- Le informazioni datate sono cambiate, rimosse o annotate in tempi ragionevoli
- I media incorporati sono piazzati in modo da non inficiare la scorrevolezza del testo
- I pastrocchi vengono rimossi in modo veloce
- Hack, sezioni formattate male e altri elementi di disturbo nella pagina sono rimossi in modo rapido
Gli utenti potrebbe lamentarsi dopo aver visto pagine da questo sito ?
Un segnale piuttosto semplice che un algoritmo di learning potrebbe utilizzare sono i commenti negativi riguardanti la vostra azienda o sito web presenti su altri siti.
Google ha rilasciato la sua Prediction API nel 2011 e vi hanno insegnato addirittura come utilizzare la API per fare sentiment analysis.
La sentiment analysis è quindi un’ottima candidata come sorgente di segnali per Panda, ma non date per scontato che la stiano utilizzano.
Limitatevi a considerare le tipologie di sito web delle quali la gente solitamente si lamenta:
- Lenti nel caricamento
- Troppe pubblicità
- Informazioni di contatto difficilmente rintracciabili
- Informazioni datate
- Contraddicono i siti meglio conosciuti ( non necessariamente una cosa negativa ! )
- Design fuori dallo standard (NOTA: immagino intenda poco intuitivi, non creativi! )
- Pessima esperienza utente/cliente
- Assomiglia troppo ad un altro sito che odiano
Tutto ciò probabilmente NON riguarda ciò che le persone dicono sugli altri siti. E’ riferito a cosa voi stiate facendo sui vostri stessi siti. Smettete di cercare lo “user engagement” e concentratevi sull’esperienza che voi create per le persone che visitano il vostro sito.
Segnali buoni contro segnali cattivi
Il tuo sito, ogni specifica pagina sul tuo sito, può avere segnali buoni e cattivi. Un segnale buono in un contesto può essere cattivo in un altro contesto e viceversa. Il tuo mix di buoni e cattivi segnali sarà molto probabilmente usato basandosi sui siti che l’algoritmo riterrà simili al tuo. Potrebbero essere competitor oppure siti dei quali non ha mai sentito parlare. Nel tuo mix i segnali buoni e cattivi potrebbero annullarsi a vicenda.
C’è ancora tantissima confusione riguardo a cosa Panda faccia veramente
Nel luglio 2015 Search Engine Land ( da qui in poi SEL ) ha annunciato il rilascio di Panda 4.2, la prima versione a rilascio lento. Oltre 120 commenti sono stati pubblicati da diversi marketer ( SEL ha rimosso tutte le discussioni dalle sue pagine ma potrete vedere commenti qui ).
È nata una disputa intorno alla dichiarazione secondo la quale Panda sarebbe un algoritmo sitewide ( NOTA del traduttore: generalmente si intende che prende in considerazione l’intero sito e non specifiche pagine ) che potrebbe colpire solo alcune pagine ( una cosa assolutamente senza senso ).
Quando poco tempo dopo SEL ha condotto un’intervista telefonica con gli ingegneri di Google chiedendo chiarimenti ha ricevuto la stessa risposta senza senso:“ Google ha detto che anche se Panda ha un’azione sitewide , potrebbe non colpire tutte le pagine del sito allo stesso modo. Alcune potrebbero soffrirne più di altre.”
Tutte le interpretazioni date a queste dichiarazioni piuttosto vaghe sono state insoddisfacenti: chiunque non lavori a Google può solo fare speculazioni riguardo a come Panda valuti pagine e/o siti web.
“Sitewide” può voler dire una/ più di una/ tutte queste cose :
- tutte le pagine identificate come parte del sito vengono valutate
- un’unica valutazione e computata per l’intero sito applicata a tutte le pagine
- ogni pagina viene prima o poi valutata, e questa valutazione viene inclusa in una valutazione generale del sito
- una valutazione di tutto il sito è utilizzata per aggiustare il posizionamento delle singole pagine nelle loro specifiche query ( come il classico PageRank )
- viene computata una valutazione per ogni pagina e ne viene trasferito del valorealle altre pagine tramite link
- viene computata una valutazione per ogni pagina e aggiunta alle altre pagine del sito in modo equo
- viene computata una valutazione per pagina e viene aggiunta alle altre pagine on site sulla base di una “pesatura” in modo non-PageRank ( nota del traduttore: penso intenda con una logica differente rispetto alla “pesatura” del classico PageRank )
Come vengono determinati i posizionamenti sulle query
I principi base dell’information retrieval non sono cambiati. Quando si scrive una query in un motore di ricerca accadono diverse cose:
- il motore di ricerca seleziona documenti le cui valutazioni reverse-index ( che, per farla semplice, dalle parole catalogano documenti e non viceversa ) indicano che possono essere rilevanti la query
- Viene utilizzato un filtro per eliminare documenti non accettabili ( per le ragioni più disparate )
- Le valutazioni “statiche” salvate nei documenti sono combinate con quelle computate a run-time ( nota del traduttore: per semplificare, nel momento in cui avviene la richiesta ) sulla query
- Fino a 1000 risultati vi vengono presentati nei risultati di ricerca, classificati in base alle valutazioni di rilevanza insieme alle valutazioni statiche
La versione “classica” del PageRank è un’esempio di valutazione statica. Una query può attingere da tutte le precedenti valutazioni statistiche già computate o utilizzarne solo alcune.
Una query può “soppesare” una valutazione statica in modo differente da un’altra query che usa la stessa valutazione (Nota: Amit Singhal ha riscritto il software di Google da zero nel 2000 quindi il “PageRank classico” non è più utilizzato da come fu descritto nel 1998 da molto, molto tempo ). Alcune valutazioni di rilevanza a run-time potrebbero essere calcolate separatamente dalle valutazioni concernenti l’information retrieval basati su “parole nella pagina” e “anchor text associati alla pagina”.
Per esempio, l’età presunta di un documento ( magari basata su quando è stato scansionato per la prima volta ) potrebbe essere utilizzata per attivare un segnale di “recentemente pubblicato”, che potrebbe aiutare il documento a essere posizionato al di sopra di contenuti più rilevanti se il fattore “la query predilige i contenuti freschi” è attivato.
Se la valutazione di Google Panda venga utilizzata sulla base del sito o della singola pagina non importa: ad un certo punto qualsiasi cosa Panda faccia viene presa in considerazione per ogni pagina del sito.
Cosa ha dichiarato Google riguardo a Panda
Google ha confermato che può decidere di ridurre la scansione per siti che non considera importanti. Questo potrebbe includere siti colpiti da Panda oppure no: sono commenti fatti da Matt Cutts nel 2011.
Nel giugno 2014 John Mueller ha detto che Google non riduce la scansione per siti penalizzati.
Nel marzo 2015 John Mueller ha detto che Google può decidere di ridurre la scansione per pagine che si caricano lentamente, ma che aumenterebbe il crawl se vede miglioramenti nella velocità delle pagine.
Quello che i webmaster dovrebbero poter sapere con chiarezza è se essere colpiti da Panda influenza le loro possibilità di recupero da Panda stesso. Per mia esperienza non è così: anche altra gente rilevò recuperi almeno parziali quando i refresh di Panda erano ancora mensili nel 2011 e nel 2012. Generalmente erano necessari almeno due aggiornamenti dei dati per vedere se il problema Panda fosse stato risolto.
Nel 2011 quando Hubpages fu colpito da Panda Matt Cutts suggerì a Paul Edmondson che dividere il contenuto in sottodomini avrebbe aiutato, e Hubpages vide effettivamente alcuni miglioramenti.
Conclusioni
Dove ci lasciano questi discorsi se non in una situazione dove emergono ancora più domande?
Prima di tutto, concordiamo che finchè l’algoritmo Panda non funzionerà secondo le seguenti modalità tutti continueremo a fare supposizioni completamente alla cieca:
- L’algoritmo deve lavorare in modo continuo
- I dati di Panda devono essere passati all’indice in tempo reale ( o almeno avvicinarsi a tale rapidità)
- I siti hanno bisogno di metodi sicuri e affidabili per identificare un declassamento da Panda
Troppe persone lamentano di aver perso traffico a causa di Panda quando non hanno nessun modo per confermare questa loro deduzione.
Anche i SEO più esperti non hanno certezze assolute. In verità, molti dei problemi che sembrano contribuire ad un declassamento da parte di Panda sono valutati anche da altri algoritmi ( come il Payday Loan Algorithm ).
Quindi se lo stesso segnale di “bassa qualità” può essere utilizzato da molteplici algoritmi, potresti essere fortunato e aggiustare un problema che ti sta arrecando danno in due modi differenti o potresti pensare di star “aggiustando” un problema Panda quando, in verità, stai facendo i conti con qualcosa di completamente differente.
Nessun praticante di SEO, Guru, esperto, blogger, consulente, autoproclamato data scientist o qualunque altra persona ha una conoscenza assoluta sulla questione Panda. Tutti cercano di capire al meglio delle loro possibilità il da farsi, ma si tratta sempre di opinioni e intuizioni.
Conosco solo una cura universale che ha funzionato ogni volta che ho provato: cancellare completamente il sito e ripartire con un design completamente differente, meno contenuti e un’enfasi maggiore nel creare una migliore esperienza utente. Naturalmente molti di voi mi diranno che non è una strada praticabile.
In qualunque modo interpretiate le criptiche spiegazioni di Google, Panda ha sempre riguardato CIO’ CHE STA SULLA PAGINA.
Spero possiate trovare i suggerimenti che ho dato in questo articolo utili; Ho condiviso molti altri suggerimenti riguardo a Panda nella “SEO Theory premium Newsletter” negli anni passati.
P.S. Hai visto che non scherzo quando dico che nei miei contenuti non c'è posto per la fuffa?
Tutto scritto da me, nessuno stagista e niente ghost writers. Se ne avrai voglia ci sentiamo al prossimo contenuto, io ti aspetto!
ferdinando dice
Ciao Emanuele,
grazie mille per questa lunghissima traduzione! Articolo davvero ricco e istruttivo.
Emanuele Vaccari dice
E’ un bellissimo articolo, ne valeva la pena 🙂
Ferdinando dice
Concordo 😉
vincenzo dice
bravo 🙂
Emanuele Vaccari dice
grazie!
Francesco BrioWeb Russo dice
Ciao Emanuele, complimenti per il lavorone di traduzione… in effetti si tratta di un articolo davvero interessante!
Emanuele Vaccari dice
Ciao Francesco, innanzitutto grazie!
Si, ne è valsa la pena, sono contento che molti abbiano avuto modo di apprezzarlo 🙂
Fabio dice
Complimenti Emanuele,
meriti un elogio per la traduzione. Purtroppo, infatti, gli articoli tecnici sono spesso tradotti in modo molto approssimativo. Ma non è per niente il tuo caso.
Venendo al contenuto, sono certo che molti SEO e webdesigner abituati a lavorare sui siti in ottica un pò troppo “old-serp-oriented” faranno una fatica enorme a curare i fattori citati da Michael Martinez.
A volte non so se ridere o piangere quando leggo post che spiegano come utilizzare le keyword applicando formule matematiche o modelli pseudo-statistici.
Il mio parere, invece, è che dovrebbe essere naturale operare tenendo in considerazione qualità e aggiornamento nei contenuti, creatività e pulizia nella grafica e semplicità nella user-experience.
Forse gli algoritmi di Google sono molto più umani e banali di come gli esperti del settore li vogliano vedere.
Insomma, a volte è meglio lasciare matematica e analisi statistiche nei libri universitari e usare un pò più di naturalezza. D’altronde gli utenti sono persone reali e non numeri…
Emanuele Vaccari dice
Fabio sono d’accordo con te. E per forza di cose più gli algoritmi evolveranno più saranno “umani” nei loro giudizi: prepararsi quindi pensando agli umani è un modo di lavorare “future proof” , a prova di futuro.
Emanuele Vaccari dice
PS: purtroppo nel testo trovo molti errori, ma più che di traduzione voglio incolpare il software di dettatura che devo ancora ben calibrare 🙂
Marco Salvo dice
Grazie per il post!
Questa frase mi ha decisamente fatto piacere leggerla:
-> Le vere “autorità” di un argomento specifico guidano la discussione e ispirano nuove query <-
Emanuele Vaccari dice
Prego! Comunque si, è un bel concetto. Per lo stesso motivo in questi giorni sto cercando di placare la corsa allo "studio dei competitor", meglio concentrarsi nel capire gli utenti e diventare appunto queste "autorità".
Sir dice
Ciao, sto leggendo dall'originale e non trovo nel tuo articolo la traduzione di "The text is easily clippable".
Come lo tradurresti in ITA?
Emanuele Vaccari dice
L'ho saltato perchè non saprei tradurlo, lo chiedo a Martinez faccio prima 🙂
Bartolomeo D'Alia dice
Wow, è tanta roba!
Me lo devo leggere con calma.
Grazie mille Emanuele.
Emanuele Vaccari dice
Prego! Ma mi raccomando leggilo perché è un articolo molto interessante 🙂
Irene dice
Articolo utile e molto interessante, anni di studio su SEO buttati al vento dopo questa lettura.
Grazie Emanuele, buon lavoro! 🙂
Emanuele Vaccari dice
Oddio Irene, ti ringrazio ma vorrei capire in che senso "anni di studi al vento" 🙂