Come i motori di ricerca leggono

come i motori di ricerca leggono

C'era una volta l'attivita' di SEO (Search Engine Optimization) semplice dettata da regole empiriche non troppo complesse per ottenere, in tempi piu' o meno veloci, facili posizionamenti su Google. C'era!

Perche' adesso con l'introduzione di Google di RankBrain, ossia l'applicazione di ricerca semantica e deep learning, ogni esperto influencer dice la sua su come dovrebbe funzionare dell'algoritmo, del colosso di Mountain view, per il posizionamento delle pagine web.

A complicare ulteriormente il lavoro dei consulenti SEO ci sono anche i portavoce di Google, che di volta in volta condividono informazioni poco esaustive sui segnali di qualità e ripetono il mantra "Content is king".

Se comunque si volesse fare ipotesi sugli algoritmi alla base della tecnologia di Google, la scelta non sarebbe ne casuale ne tanto meno campata in aria.

Infatti ci sono due campi dell'informatica che affrontano quell'insieme di problemi legati ai contentuti che coinvolgono la SEO: il Natural Language Processing (NLP) e l' Information Retrival (IR).

La ricerca scientifica in questi campi ha sfornato algoritmi ben documentati per la classificazione di testi ed il recupero di contenuti rilevanti in risposta a una query dell'utente.

Dato lo sviluppo recente della capacita' dei calcolatori e dello studio sempre piu' sofisticato dell'informatica per l'analisi di testi, la linguistica computazionale è una scienza eccitante e in rapida evoluzione.

Voglio dare una breve introduzione sul NLP per far capire l'ABC su come i supercomputer di Google possano affrontare il delicato compito di analisi di un testo.

Alla base di qualsiasi discorso ci sono le Parole, i mantoncini di base che esprimono concetti e relazioni ben noti agli esseri umani, ma poco significative ai calcolatori se non per il fatto che sono sequenze di 1 e o.

Definendo spazi e punteggiatura come delimitazione delle parole, la prima operazione che un computer e' in grado di fare e' la separazione di un testo, ossia di una sequenza alfanumerica, in un elenco di parole definiti token.

Considenarndo ad esempio la frase: "Il Sig. Ferri ferra coi ferri", i token della frase saranno: Il, Sig, Ferri, ferra, coi, ferri.

Sebbene questi token non elaborati conservano tutte le informazioni linguistiche, ad esempio la differenza tra il nome proprio Ferri ed i ferri, abbiamo anche una ridondanza di token simili.

Per eliminare informazioni non necessarie e' possibile elaborare i token per identificare le forme plurali e cogniugazioni verbali, e recuperare le forme iniziali delle parole chiamate lemmi.

Alcuni token estratti da un testo, come verbi, pronomi ausiliari ecc. il cui significato non e' indipendente dagli altri elementi della frase sono definiti stop-words e vengono eliminate per ridurre il numero di tokens da elaborare.

I token estratti in questa fase definiscono il significato semantico della frase, quindi il suo contesto generico, ma non e' possibile definire le relazioni tra i token.

In oltre ogni token puo' essere elaborato per separare la radice dalle desinenze, riducendo ancora il numero di parole da elaborare da parte del calcolatore per definire la semantica della frase.

Recuperati i token, i lemmi ed in fine le radici delle parole impiegate in un testo e' possibile rimuovere il resto delle parole o convertirle in minuscono per uniformarle, a meno che questa operazione non ne riduca la capacita' di analisi, come l'identificazione dei nomi propri.

Sapere come e perché i computer elaborano un testo, separandone gli elementi e identificandone lemmi e radici, ci permette di comprendere come avviene, anche se solo in modo approssimativo, il calcolo della metrica conosciuta come keyword density.

Sebbene questa metrica non sia l'elemento chiave del ranking di Google, e' chiaro che un lavoro di inserimento piu' o meno forzato di keyword esatte non sia necessario a fronte della presenza nel testo di parole con forme coniugate o con desinenze.

In questo senso il motto "Content is king" e' sempre attuale, scrivere approfodendo temi e inserendo contenuti di qualita', con un linguaggio ricco, ma allo stesso tempo adeguato al proprio pubblico, puo' fornire, in modo molto naturale, un numero elevato di keyword.

Comments are closed.

NON seguire questo link o sarai bannato dal sito!

Questo sito o gli strumenti terzi da questo utilizzati si avvalgono di cookie necessari al funzionamento ed utili alle finalità illustrate nella cookie policy. Se vuoi saperne di più o negare il consenso a tutti o ad alcuni cookie, consulta la cookie policy. Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all’uso dei cookie. Maggiori informazioni

Questo sito utilizza i cookie per fornire la migliore esperienza di navigazione possibile. Continuando a utilizzare questo sito senza modificare le impostazioni dei cookie o cliccando su "Accetta" permetti il loro utilizzo.

Chiudi