Come funziona Google?
Spesso è una domanda che chi fa SEO, o chi la vuole imparare, non si pone abbastanza ( o non lo fa affatto ). Si passa subito a “come faccio ad arrivare in prima posizione” ? Come se questa fosse l’unica verità da ricercare.
Ma la verità secondo me è che come per la chitarra quando si imparano le canzoni prima delle scale, è un modo per rendere la propria conoscenza e abilità limitata.
Sono rimasto quasi shockato da come in Italia questo splendido intervento allo SMX West 2016 di Paul Haar, ingegnere software di Google con 14 anni di servizio alle spalle, sia stato bellamente ignorato per fare eco ai soliti allarmismi e titoli clickbait che infestano ormai il panorama SEO internazionale.
Cory Collins, che sinceramente non conoscevo prima di questo post ( e del quale troverete maggiori informazioni poche righe più in basso ), ha fatto questo splendido post riassuntivo per “i più pigri”, che so di per certo che quasi nessuno in Italia avrebbe affrontato in quanto in lingua inglese, commettendo in verità un errore madornale.
Ho deciso quindi di adattarlo in italiano perchè penso che chiunque lavori in un ambito che tocca o anche solo sfiora la SEO dovrebbe leggere un post come questo. Dico “adattarlo” perchè mi sono permesso di renderlo più chiaro: ho tolto citazioni di slide e i link alle varie parti del video per alleggerire la pagina, e ho introdotto delle parti ulteriori nel testo per chiarificare le parti un pochino più fumose o solo sfiorate.
Prendetevi il vostro tempo perchè sarà un lungo e interessante viaggio.
Il post originale che ho riadattato è apparso per la prima volta sul blog pageonepower.com, scritto da Cory Collins.
Come Danny Sullivan, che ha introdotto Haahr, ha giustamente detto, il titolo professionale di Paul non indica chiaramente che lui sia di fatto parte della senior leadership del ranking team di Google.
Se sei un SEO, questo dovrebbe far saltare un battito al tuo cuore.
[ NDR: ho tagliato alcune parti collegate ad una intro che non ho tradotto ]
Andiamo dunque a vedere cos’è stato detto esattamente da una figura così importante e interessante [ NDR: potete trovare le slide qui : How Google Works: A Ranking Engineer’s Perspective By Paul Haahr , prese dal Search Marketing Expo – SMX ) ]
Cosa fa un ingegnere del ranking di Google
Inizierò rompendo una delle mie personali regole a riguardo di reportage di questo tipo: lo farò ignorando l’ordine cronologico. Questo per mettere in risalto una parte molto importante della presentazione che è servita come elemento fondante.
Questa sezione è dedicata nel ricercare una risposta alla domanda “cosa fa un ingegnere del ranking di Google” ?
Sono state date in verità quattro risposte, ognuna delle quali definisce in modo più preciso il ruolo di un ingegnere del ranking:
- Scrivere codice per i server della Google Search.
- Cercare nuovi segnali e combinare i vecchi segnali in modi nuovi.
- Ottimizzare per le nostre metriche di rilevanza/search intent e qualità.
- Muovere i risultati con buoni voti da esperimenti dal vivo e raters umani in su, muovere i risultati peggiori verso il basso.
Quindi cosa fa un ingegnere del ranking?
La cosa che primariamente ho inteso è stata: assicurarsi che l’esperienza di ricerca stia effettivamente migliorando per gli utenti ( umani ). E come fanno a farlo? Cercando di rendere Google sempre più simile alle Search Quality Rating Guidelines. [ NDR: da quanto lo dico! ]
Dopo la conferenza un tweet di Haahr enfatizza l’importanza delle Search Quality Rating Guidelines, e di come i SEO dovrebbero leggersi bene l’intero documento.
.@sugarrae Glad you liked. For transparency, I think the rater guidelines were actually a big deal. Read them yet?https://t.co/llmUQJbkQ8
— Paul Haahr (@haahr) March 31, 2016
La mia citazione preferita dalla presentazione dal momento in cui lui sta parlando delle Google’s Search Quality Rating Guidelines al minuto 16:08.
Se vi state chiedendo il perchè Google stia facendo qualcosa in particolare, spesso la risposta è che sta cercando di rendere la ricerca più simile possibile a quello che le linee guida dei rater dicono.
E’ una dichiarazione molto importante: vengono riassunti tutti i cambiamenti di Google come un tentativo di rendere la ricerca più fedele possibile al documento che loro stessi hanno pubblicato.
In sintesi: “volete capire Google? Leggetevi le linee guida dei raters“ [ NDR: leggetele di prima persona, non accontentatevi dei riassunti spesso imprecisi, ve lo dice uno che ha letto ambedue le versioni: la verità dovete cercarla con la vostra testa ]
La Google search oggi
Ci sono due filoni principali nella Google search attualmente:
- Mobile First
- Caratteristiche
La mobile search sta dominando le query di ricerca, e Google pensa sempre di più mobile first. Non sono novità per i SEO, ma è qualcosa che è stato volutamente enfatizzato.
La seconda cosa che è stata sottolineata è stata l’importanza delle nuove caratteristiche, in particolare in ambito mobile:
Per riassumere Haahr ha detto questa interessante frase:
Ci stiamo dirigendo sempre di più verso un mondo dove la ricerca viene considerata come un assistente in tutti i momenti della propria vita
La ricerca diventerà un aiuto sempre più diretto nella vita di tutti i giorni dei propri utenti. E se lo dice Google tendo a credere che sia la verità ( hanno abbastanza cervelloni per capirlo meglio di noi )…
Come funziona la Google Search?
Partiamo dal principio: Google una volta era semplicemente 10 link blu. Nella presentazione viene riassunto il grande problema di Google in quel periodo con la frase “Che documenti mostriamo? In che ordine li mostriamo?”
Viene aperta una interessante parentesi: Haahr si è preso un momento per specificare che non avrebbe mai toccato l’argomento ads.
Ha detto:
Le pubblicità sono fantastiche, la verità è che ci fanno fare un sacco di soldi, e funzionano bene per molti inserzionisti. Ma nel mio lavoro ci viene espressamente detto “non pensare all’effetto sulle pubblicità, non pensare all’effetto sulle entrate, pensate solo ad aiutare l’utente“
E’ interessante ascoltare questo appunto sulla chiara separazione tra chiesa e stato, pardon, risultati a pagamento e risultati organici.
[ NDR: prevedo già la rivolta popolare, ma a me piace credere che sia effettivamente la verità ]
Life of a query: la vita di una query
La spiegazione di Paul del meccanismo di posizionamento parte con la vita di una query. I concetti introdotti in questa sezioni sono utilizzati anche come corso per i nuovi ingegneri di Google per spiegare loro la verità sul motore, e non solo per quelli che lavoreranno nella search.
Si parte dicendo che ci sono due parti principali del motore di ricerca:
- La parte “prima del tempo” ( prima della query );
- La parte di lavorazione della query;
Analizzando le attività più nello specifico:
Prima della query
- Scansionare il web
- Analizzare le pagine scansionate
- Estrarre i link ( la versione classica della search comprendeva solo questa );
- Rendering dei contenuti ( Javascript, CSS – è stato un passaggio molto enfatizzato: ormai vedono la stessa pagina che vede l’utente, al contrario di un volta dove veniva scansionato il codice );
- Analisi ed annotazione semantica ( linguistica e relativa al knowledge graph, come l’estrazione dei dati )
- Costruire un indice
- Come l’indice di un libro, per ogni parola, creare una lista di pagine dove vengono citate
- Per fare questo dividere il tutto in milioni di “pagine” dell’indice
- Queste pagine vengono chiamate “shards” [NDR: schegge]
- Innumerevoli shards per indicizzare tutto il web
- Aggiungere i meta dati specifici delle pagine
Questo processo avviene miliardi di volte al giorno, di continuo, su miliardi di pagine.
Lavorazione della query ( all’atto della ricerca dell’utente )
I processi che seguono avvengono ogni volta che viene inviata una query a Google
- Comprensione ed espansione della query
- La query nomina entità conosciute?
- Ci sono sinonimi utili alla comprensione della chiave nel contesto?
- Il contesto conta: è uno degli elementi più importanti in questo passaggio;
- Recupero e assegnazione del punteggio
- Vengono inviate la query a tutte le shard;
- Per ogni shard:
- Identifica le pagine con corrispondenza alla query;
- Computa un punteggio per query+pagina : il punteggio misura il grado di corrispondenza. E’ la parte più difficile di tutto il processo;
- Ritorna le migliori N pagine per punteggio alle shard;
- Si combinano tutte le migliori pagine;
- Vengono ordinate per punteggio;
- Aggiustamenti post recupero
- Clustering degli host ( quante pagine vengono dallo stesso dominio? )
- Generazione sitelinks;
- Viene controllata la duplicazione;
- retrocessione per spam, applicazione delle azioni manuali
- Generazione degli snippet;
- Generate le pagine, vengono fuse con le altre features del motore ( ads, knowledge panel, map panel etc. etc. );
Solo dopo tutto questo processo viene finalmente servita la SERP all’utente.
Segnali per l’assegnazione di punteggio usati da Google
Innanzitutto, cos’è un segnale per Google? A prescindere da quanto si è detto nella community SEO in questi anni, la verità è che è semplicemente una informazione utilizzata per arrivare a dare un punteggio alla pagina.
Un segnale può essere in una di queste 2 categorie per Google:
- Indipendente dalla query, legato alla singola pagina: PageRank [ NDR: cito testualmente ], la lingua utilizzata, mobile friendliness …
[NDR: E qui si apre una parentesi: secondo Haahr il pagerank è indipendente dalla query, quindi il topic della pagina dalla quale arriva questo PageRank è utile solo per determinare lo spam ma non rinforza “il valore del link” quando è “in topic” ? Strano che sia sfuggito ai SEO strilloni ] - Dipendente dalla query, sempre legato alla singola pagina: il numero di apparizioni di una keyword [ NDR: si lo ha detto! ], sinonimi, prossimità …
E’ in questo frangente che viene citata la “versione 2” del lavoro dell’ingegnere del ranking:
[Un ingegnere di Google Search] cerca nuovi segnali o combina i vecchi segnali in nuove modalità.
Metriche chiave per il team del ranking: Rilevanza, Qualità e tempo al risultato
Viene enfatizzata la rilevanza come metrica chiave per il ranking team nella sua ricerca della SERP perfetta. La rilevanza ( per quanto riguarda Google ) è stata definita come “corrispondenza con l’intenzione di ricerca“: la pagina risponde all’intento di ricerca, è veramente utile all’utente?
La rilevanza per big G è ” la nostra metrica chiave/migliore” e la “grande metrica interna“. Per Google è la metrica fondamentale nella quale eccellere [ NDR: anche per i webmaster! ].
Ci sono altre 2 metriche molto importanti: la qualità dei risultati forniti e il tempo al risultato ( quanto Google impiega a fornire il risultato, “faster is better” ).
Quanto valgono i posizionamenti per Google?
Google assegna un “peso” ad ogni posizione nelle SERP rispetto ad una data query. Chiama questo concetto “reciprocally ranked weighting” , perchè il valore viene commisurato in modo “reciproco” tra posizione e posizione.
Per essere chiari, non si parla di CTR, ma piuttosto di una metrica interna che valuta intere pagine di ricerca.
L’idea è che ci sia un degradamento di valore del 50% per ogni posizione, con la prima posizione che vale 10 volte la decima. [ NDR: non prendete come assoluta verità fattuale questa dichiarazione, è forse il punto che più differisce dalla realtà. un punto di arrivo forse per l’algoritmo ma sicuramente non il suo presente ]
E questo ha portato Haahr alla versione numero tre di “ciò che gli ingegneri del ranking fanno” : ottimizzare le metriche internet ( rilevanza e qualità ).
Come valuta Google i risultati di ricerca ( le SERP ) ?
Paul ha spiegato che ci sono 2 modi in cui Google analizza l’efficacia di specifiche SERP
- Esperimenti dal vivo sulle SERP
- Esperimenti con rater umani
Esperimenti dal vivo sulle SERP
Google fa test A/B su traffico reale, analizzando i cambiamenti nei pattern dei click. Sono stati testati, ad esempio, 41 tonalità di blu per i link.
Facciamo moltissimi esperimenti: è molto raro che qualcuno faccia una ricerca su Google e non sia parte almeno di un esperimento.
Haahr si sofferma quindi sul fatto che interpretare in tempo reale gli esperimenti in verità è un’attività veramente difficoltosa.
Fa l’esempio di un caso riguardante un answer box: tradizionalmente, se un utente clicca per entrare nel sito si parlerebbe di un buon risultato: ma come valutare se l’utente avesse visto l’answer box, fosse rimasto soddisfatto e avesse chiuso la query?
Verrebbe da pensare in verità ad un cattivo risultato, ma in questo caso non lo sarebbe davvero! Ecco un esempio portato direttamente da Haahr:
Molto affascinante. Il lavoro di Google è veramente duro.
Esperimenti con rater umani
Forse la cosa più importante che viene detta durante questo passaggio è che la maggior parte degli esperimenti con rater umani viene fatta su smartphones.
Questi esperimenti funzionano nel seguente modo:
- Mostrare a persone reali delle SERP sperimentali;
- Chiedergli di valutarle secondo rilevanza e qualità;
- Aggregare le valutazioni dei vari rater;
Il tutto naturalmente secondo i metri di giudizio spiegati nelle “verità” della Search Quality Evaluator Guidelines. Nel video trovate esempi di queste valutazioni.
Due metri di giudizio: rilevanza e qualità
Come già accennato, ci sono due metri di giudizio forniti ai rater:
- Bisogni soddisfatti ( rilevanza ) : questa pagina soddisfa veramente i bisogni dell’utente?
- Qualità della pagina : quanto è qualitativamente buona la pagina?
Il focus su queste metriche rimane mobile first:
- Tutte le istruzioni riguardanti la rilevanza sono a proposito dei bisogni degli utenti mobile
- Le query mobile sono utilizzate il doppio negli esperimenti rispetto alle classiche
- Viene utilizzata la posizione dell’utente
- Il tool per gli esperimenti visualizza l’esperienza mobile
- I rater visitano i siti tramite il loro smartphone
Parliamo ora dei due metri di giudizio nel dettaglio.
Valutazione dei bisogni soddisfatti ( rilevanza )
Ci sono 5 categorie di valutazione della rilevanza, chiamata “bisogni soddisfatti“:
- Completamente soddisfatti
- Altamente soddisfatti
- Moderatamente soddisfatti
- Leggermente soddisfatti
- Non soddisfatti
I rater non giudicano solo con queste 5 opzioni: vi è una slider posizionabile anche a metà di qualunque di questi livelli di valutazione.
In buona sostanza:
- “Completamente soddisfatti” è una valutazione adatta solamente quando la query è essenzialmente non ambigua e c’è un risultato che può totalmente e veramente soddisfare qualsiasi cosa l’utente intenda con quella query.
- “Altamente soddisfatti” a volte richiede disambiguazione per soddisfare l’intenzione di ricerca
- “Moderatamente soddisfatti” significa informazioni generalmente utili
- “Leggermente soddisfatti” significa accettabile ma senza informazioni veramente valide, con la speranza di avere risultati migliori da mostrare
- “Non soddisfatti” si riferisce essenzialmente a quando un bug affligge la SERP, portando risultati totalmente errati
Alcuni esempi in questo video, guardateli perchè sono importanti ( li trovate più chiari nelle Guidelines che trovate linkate nell’articolo ):
Valutazione della qualità della pagina
Google considera tre concetti importanti per descrivere la qualità di una pagina ( il famoso EAT che in italiano diventa EAA ):
- Expertise : l’autore è un vero sperto dell’argomento trattato?
- Autorevolezza : il sito è veramente autorevole sulla materia ? [ NDR: non parliamo di link ]
- Affidabilità : ti puoi veramente fidare di questo sito?
La scala del voto di qualità va da alta a bassa.
Le pagine di alta qualità:
- Hanno una quantità soddisfacente di contenuto principale di alta qualità;
- Expertise, autorevolezza e affidabilità sono lampanti;
- Il sito gode di una buona reputazione;
Nelle pagine di bassa qualità:
- La qualità dei contenuti è bassa;
- Non c’è molto contenuto principale [ NDR: ciò che non è ads o elementi non strettamente correlati al corpo centrale del documento ];
- Non viene palesato alcun expertise o autorità;
- Il sito ha una reputazione negativa;
- Il contenuto secondario ( le ads ad esempio ) tende a distrarre;
Il processo di sviluppo in ambito search ranking
Il team che lavora sulla ingegneria della ricerca è composto da un qualche centinaio di persone.
Come già detto, si concentrano su metriche e segnali, fanno costanti esperimenti, cambiamenti e tweak in modo da migliorare costantemente i risultati di ricerca e ad avvicinarli alle linee guida dei rater [ NDR: e quindi ad essere veramente utili per l’utente che ha digitato una specifica query ]
Il processo di sviluppo è in linea con quello utilizzato per lo sviluppo classico di software.
Passaggi interessanti di questo segmento:
- Il processo di test può richiedere settimane o mesi;
- Dei Quantitative Analysts ( esperti di statistica ) controllano i risultati confrontandosi con gli ingegneri;
- Vengono fatte riunioni dove vengono presentati i progetti, si rivedono le documentazioni e i report e si discutono le implicazioni e i meriti del cambiamento del ranking.
- Il lancio del codice può essere più o meno veloce, dipendentemente da quanto sia pronto per essere inserito nell’algoritmo che è live su Google. Per alcuni aggiornamenti ci sono voluti 2 anni!
Questi aggiornamenti al search vengono fatti primariamente per muovere i risultati migliori in posizioni migliori, e spostare quelli peggiori più in basso.
Cosa può andare storto nel processo di sviluppo
Vengono presentati due tipologie di problema:
- Valutazioni sistematicamente “sbagliate” dai rater
- Metriche che non riescono a catturare i concetti per i quali sono studiate
Valutazioni sistematicamente “sbagliate” dai rater
Viene presentato l’esempio della query [texas farm fertilizer].
Anche se pare chiaramente una chiave informazionale, risulta in verità anche essere il nome esatto di un brand di fertilizzanti. Google indicava come primo risultato una mappa che portava alla sede centrale del produttore in questione: è molto improbabile che la gente sia soddisfatta con un risultato del genere. In realtà è più probabile che voglia avere informazioni sul prodotto in questione.
Il fatto è che i rater umani continuavano a valutare questo risultato con “bisogni altamente soddisfatti” indicandolo come rilevante! Questo ha portato ad aggiungere mappe, cosa che ha creato un risultato valutato ottimamente ma che in realtà rendeva l’esperienza sul motore di ricerca pessima.
Metriche che falliscono
Viene citato un problema che affliggeva Google nel 2008-2011, quello delle content farm. Quest’ultime possono produrre contenuto di bassa qualita ma molto rilevante: questo portava ad avere pagine ben posizionate ma di bassa qualità.
Furono proprio le content farm a spingere Google ad implementare la slider che giudica la qualità dei risultati di ricerca negli esperimenti con i rater. Questo gli ha permesso di definire segnali basati sulla qualità della pagina [ NDR: e rivoluzionare il motore di ricerca. ]
Non viene sorprendentemente nominato Google Panda, che è stata la vera e propria soluzione algoritmica proprio alle content farm.
Per gli ingegneri di Google si possono risolvere le problematiche legate alle metriche in 2 modi:
- modificare le linee guida dei rater;
- svilupparne di nuove;
Q&A su Google
Cosa dobbiamo imparare da tutto questo ? ( Collins )
- Bisogna leggere le Search Quality Rater Guidelines. Vuoi veramente capire il ranking di Google? Leggile.
- Google pensa mobile first ( update 17/10/2016: Google ha appena annunciato che nei prossimi mesi metterà online un indice mobile only che sarà tendenzialmente più aggiornato di quello Desktop );
- Ogni sessione di ricerca contiene almeno un esperimento.
- La rilevanza è la metrica numero uno di Google. Definiscono la rilevanza come la soddisfazione dei bisogni degli utenti espressi nell’atto della ricerca. Se vuoi posizionarti bene, devi riuscire a soddisfarli.
- Google da un peso molto alto al primo risultato: ogni risultato successivo degrada del 50% dell’importanza ai loro occhi. Il risultato numero 1 vale 10 volte il numero 10.
Cosa dobbiamo imparare da tutto questo ? ( Vaccari )
Io aggiungerei alcune riflessioni:
- I cosiddetti “test” lasciano sempre di più il tempo che trovano.
Non ne ho mai visti di fatti con criteri veramente scientifici, come bisognerebbe fare per un vero e proprio test, ed è IMPOSSIBILE condurne uno su di un sistema come Google, di cui possiamo valutare empiricamente output e input e basta.
Neanche Google capisce Google: guardate cosa dice l’ingegnere su Rankbrain qui https://youtu.be/eGSGZMI4Z_I?t=90…we still don’t understand what it ( RankBrain ) is doing exactly…
UPDATE: ho adattato un interessante articolo proprio su RankBrain , dategli una letta!
- Per capire cosa fare e come farlo nella SEO, usate la vostra esperienza pratica sul campo , se dovete cercare di capire come muovervi, usate il buonsenso e fatevi le domande giuste, come ad esempio “come posso servire l’utente che atterra sulla pagina nel miglior modo possibile?“
- La rilevanza è il fattore numero uno di Google.
Google sta cercando con tutte le sue forze di creare un meccanismo in grado di giudicare i siti come veri e propri rater umani.
Gli umani non giudicano i link, gli umani giudicano la funzionalità delle pagine: servono o non servono ad un utente che digita una certa query? Quanto sono rilevanti rispetto alla sua domanda?
Ogni aggiornamento che viene fatto vedo i miei siti inesorabilmente salire, sarà che è da un bel po’ che non perdo tempo a crearmi dei link fini a loro stessi, essere un SEO freelance ha i suoi vantaggi… per leggere esattamente come la penso o vi lascio la lettura di questo articolo sulla link building in Italia.
E’ stato un lungo viaggio, grazie a tutti per essere arrivati fin qua.
Spero di riuscire a discuterne con tutti voi lettori :).
P.S. Hai visto che non scherzo quando dico che nei miei contenuti non c'è posto per la fuffa?
Tutto scritto da me, nessuno stagista e niente ghost writers. Se ne avrai voglia ci sentiamo al prossimo contenuto, io ti aspetto!
milenam dice
Contenuto interessante!
Sono sicura che per avere un page rank degno di lode debbano esserci sostanza, continuità e personalita’.
Una biblioteca non è fatta di in solo libro, ma di volumi “curati” di autori che piacciono!
Grazie
Emanuele Vaccari dice
Ciao Milena, intanto grazie per il commento.
Il pagerank citato nell’articolo fa riferimento alla “link juice”, non tanto al valore, lo specifico e anzi lo correggo nel post :).
Sicuramente per avere autorità a livello “tecnico”, cioè tanto pagerank/link juice, bisogna avere autorità a livello “concreto”, un mix di quelle cose che giustamente tu indichi!
Francesco dice
Credo sia utilissimo questo tuo post, o per lo meno trovo davvero interessante avere una piccola certezza su cui basare ogni sforzo che bisogna fare per ottimizzare un sito web. Dovremmo basarci un po’ tutti su quello che hai appena tradotto per avere degli ottimi risultati e per produrre contenuti davvero utili a chi legge.
Emanuele Vaccari dice
Mi fa piacere che l’articolo ti sia stato utile Francesco
Ilario Gobbi dice
Questo sì che è un approfondimento da incorniciare, minuzioso e approfondito,
lo metterò tra le mie lettura MUST tutte le volte che verrò preso da dubbi su cosa può o non può incidere sul posizionamento! ^_^
A questo punto, immagino, gli unici test che vale la pena davvero fare sono quelli per immedesimarsi negli utenti per capire se essi trovano concretamente soddisfazione alle loro esigenze informative nelle nostre pagine, ovvero offrire un’altra rilevanza, esatto?
Emanuele Vaccari dice
Ciao Ilario, innanzitutto grazie per il commento.
Quello che penso è che con i test SEO “classici” non si possa raggiungere una conclusione che abbracci ogni query e ogni serp relativa, in virtù di come lavora Google e di come viene sviluppato. Ne ero convinto anche prima dell’intervento di Haahr: ogni query fa storia a se.
Sicuramente ogni passo verso la comprensione della propria utenza non può che essere prezioso.
Lorenz Crood dice
Grande! Anche tu usi Floating Social Bar, il miglior plugin in circolazione per i bottoni social. Secondo me è fenomenale: è velocissimo e pure bello col suo design semplice e pulito!
Sorry per il commento off topic 🙂
Emanuele Vaccari dice
Si ottimo plugin, come dici tu semplice e molto veloce
Marco Panichi dice
Grazie del prezioso contributo Emanuele! Come dici tu sono argomenti fondamentali e non si capisce perché siano altrettanto sottovalutati (forse il grado tecnico che alza un pochino l'asticella?).
Ti scrivo, oltre che per i dovuti complimenti, per chiederti approfondimenti sulla parte relativa alla costruzione dell'indice, che mi intriga non poco. Ho cercato di districarmi tra le tue parole, quelle dell'articolo originale (che tra l'altro ha trascritto male le slide quando dice "Link the index of a book") e le slide, ma ho difficoltà.
Ho capito che (correggimi se sbaglio):
1) per ogni parola, ho una lista di pagine web che contengono tale parola
2) questa lista è divisa in partizioni orizzontali (grazie wikipedia! https://en.wikipedia.org/wiki/Shard_(database_architecture) ) dette shard
Però non ho capito se è la lista ad essere divisa in shard oppure è la lista essa stessa la shard. Poi quando dice parola secondo te si riferisce al termine? O alla frase (mi si ricollegherebbe a quanto ho/hai letto riguardo il phrase indexing)? O ad un intento?
Insomma sento che mi mancano dei pezzi, che l'argomento è interessante e cercando in rete non ho trovato riferimenti utili.
Tu ne avresti?
Grazie comunque dell'attenzione e scusa la lungaggine 🙂
Marco
Emanuele Vaccari dice
Ciao Marco, innanzitutto grazie per aver sollevato la questione, effettivamente non è chiarissimo dal trascritto.
Allora, l'indice, formato dalle liste di documenti dove una word compare è diviso per motivi pratici in frammenti, le shard; appunto.
"Word" effettivamente può sembrare ambiguo ma penso che significhi esattamente "parola", perchè dall'indice al "formarsi" della SERP vera e propria mancano ancora molti passi: qua si parla dei dati "grezzi", molto prima che si formi, come dicevo, la SERP dopo l'input della query utente. Intento e quant'altro ancora non c'entrano, le pagine non sono divise nell'indice per "intento".
Il mio "sapere" diviene da pezzi e bocconi messi insieme nel tempo, probabilmente potrebbe aiutarti in modo più concreto Altavilla se cerchi riferimenti specifici, mi spiace 🙁
Marco Panichi dice
Grazie del chiarimento Emanuele!
Non ti dispiacere, penso che la questione sia abbastanza frammentata e anche io cerco di comporre il puzzle un pezzettino alla volta 🙂
Buon proseguimento,
Marco
Matteo dice
Ciao Emanuele,
come ci comportiamo con le query "ambigue"? Mi spiego meglio. Sto analizzando "cortometraggio in inglese".
Questa keyword/query secondo me è un problema perché:
1) con la localizzazione attiva Google penserà che un italiano cerchi la traduzione in inglese del termine; 2) la prima pagina in SERP ha quasi solo link che portano a traduttori come word reference e compagnia bella; 3) se cerco "cortometraggio in spagnolo", invece, in prima pagina mi compaiono anche molti video youtube con corti in spagnolo o sottotitolati; 4) nelle ricerche correlate sembra che gli utenti cerchino corti in lingua inglese o comunque sottotitolati.
Il mio sesto senso propende per posizionare un articolo con questa chiave/query intent scrivendo di corti in inglese perché credo che la query intention sia questa: come devo interpretare i risultati in SERP che mi sembrano dire "guarda che l'utente cerca la traduzione di cortometraggio"?
Il mio obiettivo finale sarebbe quello di posizionarmi più facilmente in prima pagina utilizzando contenuti che parlino di cortometraggi in inglese, dato che sto iniziando un lavoro SEO per una casa di produzione per cortometraggi: secondo te è possibile?
[aggiungo qualche riga al commento)
Sono ancora molto inesperto ma ti vorrei lanciare una “provocazione”. Poniamo il caso che la search intent sia proprio quella di cercare la traduzione di “cortometraggio in inglese”: qual é il passo successivo dell’utente? A che cosa gli serve aver cercato la traduzione?
– Magari per ritornare nel browser e cercare corti inglese da guardare? Plausibile.
– Perché sta cercando la traduzione di quella parola per scrivere un articolo in inglese? Mhh, poco plausibile.
– Quale potrebbe essere il passo successivo nella ricerca?
Grazie mille in anticipo.
Emanuele Vaccari dice
Ciao Matteo, non sono sicuro che questo post sia il posto "giusto" per questa discussione ( potresti porre la stessa domanda su Fatti di SEO ad esempio 🙂 ), provo comunque a risponderti:
se Google ti risponde con le pagine di traduzione significa che gli utenti cercano effettivamente i "cortometraggi" con un'altra query e utilizzano "cortometraggio in inglese" per cercare la traduzione. Ti pongo una riflessione: ma tu cercheresti qualcuno che possa farti un cortometraggio in inglese con quella chiave? Non penso. Cercheresti un cortometraggio random così? Non penso.
Se guardi tra le correlate, magari con uno scraper tipo quello che ho nella pagina "ringraziamenti", troverai un sacco di query disambiguate tipo "cortometraggi in inglese per bambini/sottotitolati/per adulti" etc. etc. Ecco, questi sono i refine della query che vengono utilizzati proprio dagli utenti che "inciampano" nella SERP che parla di traduzioni, ho parlato di una cosa simile proprio da Altavilla se ricordi!
Google raccoglie segnali per definire proprio questo genere di situazioni ambigue e se ti da in risposta solo traduzioni lascia perdere la query se non sei in un sito di traduttori :). Anzi, magari potresti parlare della traduzione giusto per completare il ventaglio di query che rende un sito rilevante per "cortometraggio".
Spero di essermi spiegato :), in bocca al lupo per il tuo lavoro e scusa il ritardo nella risposta.