Google Perde la memoria

Google ha smesso di indicizzare le pagine vecchie

Google sta perdendo la memoria. O non gli è mai interessato averla?

Una notizia circolata sotto traccia nelle settimane passate potrebbe invece avere implicazioni dirompenti nel futuro della Rete: Google ha smesso di indicizzare i siti più vecchi di dieci anni.

Emersa solo in pochi siti mainstream (e guarda caso in nessuno italiano), la scoperta è stata fatta da Tim Bray, uno dei blogger della prima ora. Che nel tentativo di ritrovare alcuni suoi vecchi scritti, non è stato in grado di recuperarli attraverso Google.

Google perde la memoria o la abbandona?

Prima di pensare a un banale caso di incapacità, va detto che Bray è uno che sa il fatto suo: era già su Internet quando Google era agli albori e prima di esprimersi sulle pagine del suo blog ha fatto tutte le prove del caso, anche usando frasi esatte, ricerca per sito e così via.

Poteva farlo, perché era alla ricerca di suoi articoli di cui aveva il testo completo.

Sull’onda del lavoro di Bray, anche Marco Fioretti ha fatto una prova simile, con analoghi risultati. A questo punto le conferme iniziano a moltiplicarsi, e la notizia appare anche su altre fonti, per esempio boingboing.net.

Ma quindi Google non indicizza tutto il Web?

Per la verità, non lo ha mai fatto. Pensare che Google contenga tutte le pagine mai create è sempre stata una semplificazione. Sulla quale ci siamo adagiati tutti perché, fino a ora, nessuno si era mai posto il problema delle pagine datate. Nonostante il lavoro instancabile di realtà come The Internet Archive che senza troppo clamore tentano da anni di arginare questo fenomeno.

Insomma, finora nessuno si era mai accorto che il re era nudo

O forse, nessuno di autorevole si era preso la briga di andare a fondo. Ora appare chiaro che Google non ha alcun interesse nell’archiviare Internet di per sé, quanto nel fornire le risposte statisiticamente più commerciabili alle domande statisticamente più prevedibili. Insomma, a restituirci la parte vendibile del Web, trascurando tutto il resto.

Lo spiega perfettamente Tim Bray, con parole che provo a tradurre:

[Google] Si preoccupa di fornire buone risposte alle domande che contano per noi in questo momento. Se digito una domanda, anche qualcosa di complicato e oscuro, Google mi sorprende spesso con una risposta puntuale e precisa. Non hanno mai affermato di indicizzare ogni parola su ogni pagina.

Il mio modello mentale del Web è un archivio permanente e duraturo del patrimonio intellettuale dell’umanità. Perché questo sia utile, deve essere indicizzato, proprio come una biblioteca. Google apparentemente non condivide questo punto di vista.

Insomma. Google non è mai stato un archivio, (e per la verità non ha mai annunciato da nessuna parte di esserlo o volerlo essere).

Una scoperta che delinea il futuro di Google

Negli ultimi anni si fa un gran parlare della differenza fra motore di ricerca e motore di risposta. Google ha evidentemente una maggiore inclinazione per il secondo. Tuttavia questo secondo me è un problema, almeno per due motivi:

  • L’umanità non è culturalmente pronta a capire la differenza fra un macro-assistente virtuale che dà buone risposte e un reale sistema biblioteconomico in grado di raccogliere, e restituire, tutto lo scibile
  • al momento non esistono alternative al “qui e ora” voluto da Google. Anche se sembra che Bing e DuckDuckGo abbiano un approccio più sano nei confronti della memoria storica.

Certo, Esistono anche soluzioni specifiche per il Web “abbandonato”, come Archive.org e wiby.me, un motore di ricerca per “siti classici”. Ma manca la consapevolezza da parte degli utenti.

Chiedete a trenta persone che conoscete, ventinove vi risponderanno che su Google si trova tutto. E questo è un colossale problema.

Di fatto, lo scibile umano è in mano a un’azienda a fini di lucro

D’accordo, nella realtà non è propriamente così. Biblioteche e realtà virtuose come Archive esisteranno sempre. Ma quante sono, in percentuale, le persone che si accontentano dei risultati di Google e quante quelle che vanno oltre?

Parliamoci chiaro, chi si occupa di SEO lo sa più che bene: già essere fuori dalla prima pagina significa essere in una sorta di cimitero degli elefanti. Figuriamoci essere fuori da Google.

Il problema degli algoritmi si manifesta ancora una volta

Anche se ovviamente non c’è nessuna posizione ufficiale in materia, le ragioni di questa scelta sono ovvie: indicizzare le pagine web costa. E per un’azienda a fini di lucro, tutto quello che non è profittevole è dannoso. Fino qui nulla di sbagliato.

Ma cosa succederà se domani Google dovesse decidere di “tagliare” a cinque anni, o a sei mesi?

Sarebbe nel suo pieno diritto. Ma il patrimonio di conoscenza che potrebbe diventare irrecuperabile nel giro di pochi giorni potrebbe essere infinito. Poco importa se si tratta di fanfiction, meme sciocchi o opere d’arte. Rimane il problema che il lavoro di molti esseri umani potrebbe essere “oscurato” da una macchina nel giro di una notte.

Cosa possiamo fare per evitare di essere dimenticati da Google?

A lunghissimo termine, e con una visione piuttosto utopica, darci da fare per un Web in cui non esistano monopoli di fatto, al contrario di quello che succede ora. Favorire la frammentazione, la diffusione di standard, il diritto all’interscambio dei propri dati, la liquidità delle piattaforme. Evitando, per quanto possibile, i servizi che sappiamo adottare politiche poco trasparenti e in ogni caso quelli che detengono qualche tipo di monopolio.

L’utopia massima sarebbe un sistema in cui ciascuno possiede i propri dati in via esclusiva, e le diverse piattaforme li interrogano e li mettono in relazione in modo controllato. Ma rassegnamoci: è impossibile, anche dal punto di vista tecnico, almeno con la tecnologia di ora. Quantomeno è impossibile in una logica di scala.

A medio e breve termine, ricordarci e ricordare che Google non è il solo motore di ricerca: Bing e DuckDuckGo stanno iniziando a essere valide alternative, ma anche l’europeo Qwant. Usarli può essere impervio oggi, ma potrebbe essere il primo tassello per una Rete meno schiava degli algorimi. O per lo meno ridurre la dipendenza da un numero limitatissimo di algoritmi.

Insomma, l’umanità dovrebbe sforzarsi di non fare con la tecnologia l’errore che ha fatto svariati millenni fa quando si è lasciata addomesticare dal grano.

Ne parlerò meglio in futuro, ma oggi sta accadendo esattamente questo: invece di essere l’informatica ad adattarsi alle necessità dell’umanità, l’umanità si sta piegando alle nevrosi del digitale. Invece di creare motori di ricerca realmente efficaci, ci sforziamo di scrivere nel modo che i motori di ricerca possono comprendere.

Invece di usare l’intelligenza artificiale per un riconoscimento realmente efficace della scrittura a mano o della parola scritta, ci deformiamo le articolazioni sulle tastiere. invece di avere sistemi che ci permettono di aggregare le informazioni in modo semplice ed efficace, passiamo le ore a ingolfarci di informazioni inutili sui social media.

In qualche modo, sembra che l’unica cosa che ci importi è faticare il meno possibile, fisicamente e intellettualmente, quando l’essenza stessa dell’essere umano dovrebbe spingerci verso il contrario.

Ci ricordiamo tutti la fine che hanno fatto gli eloi, vero?

strumenti SEO gratuiti provati per l'Italia

Strumenti SEO gratuiti provati per l’Italia

Qualche tempo fa Ahrefs ha rilasciato una lista di strumenti SEO gratuiti. Mi sto cimentando a collaudarli per la lingua italiana.

Gli strumenti SEO gratuiti più famosi

Alcuni strumenti SEO sono così famosi che, tutti gli esperti SEO li considerano praticamente di pubblico dominio. Iniziamo proprio con questi, dal momento che non si sa mai abbastanza. Almeno un paio mi erano ingnoti. Vediamoli.

Answer the Public (answerthepublic.com)  – Si appoggia al sistema di completamento automatico di Google per restituire le domande effettuate dal pubblico. L’idea è buona, e in inglese funziona molto bene. In italiano se la cava, ma serve un grosso lavoro di affinazione. In particolare sulle parole chiave meno frequenti.
Per esempio, per “pizza” in italiano mi ha restituito come domande rilevanti “sono pazza di te” e “siamo pizza Miami springs“. Qualche risultato interessante c’è, ma dobbiamo necessariamente rivederli.

UberSuggest (ubersuggest.io) – Basta inserire una parola chiave, o una combinazione, e restituisce numerose keyword articolate basate su quella stessa parola chiave. I risultati possono essere esportati in un file CSV, senza registrazione. La Word Cloud è carina per vedere i pesi relativi delle combinazioni. Permette di scegliere sia la library di Google in italiano sia la lingua italiana, quindi funziona piuttosto bene.

Associati a questo l’articolo originale suggerisce keywordtool.io (che da l’impressione di basarsi sullo stesso database, e il Google Keyword Suggest Tool di SEOChat.com. Il primo funziona molto bene e ha anche una tab che suggerisce combinazioni di keyword informative (le buone vecchie “domande”) e permette di utilizzare la localizzazione italiana. Lo strumento di SEOChat.com non ha una funzione per usare il database italiano, quindi per noi non è particolarmente utile.

Soovle (soovle.com) – Analizza Google, Bing, Yahoo, Wikipedia, Amazon, YouTube, e Answers.com per creare combinazioni di parole chiave, informative e non. Si basa sulle funzioni di completamento automatico e sarebbe interessante, purtroppo non ha alcun supporto per l’italiano. Però che su Answers.com la questione “is white pizza pizza” sembra essere particolarmente dibattuta.

Hemingway Editor (hemingwayapp.com)- L’idea è interessante: lo strumento analizza il testo e fornisce suggerimenti sulla leggibilità, indicando frasi troppo lunghe parole deboli, avverbi e così via. Ma funziona solo per l’inglese, quindi se inseriamo un testo in italiano potremo sfruttare solo il misuratore della lunghezza delle frasi, che è comunque calibrato sui canoni linguistici inglesi.

Tuttavia, il vostro amichevole Kappa di quartiere ha fatto un paio di ricerche e ha scovato per voi due degnissimi sostituti per la lingua italiana: Il calcolo dell’indice di leggibilità di Linkomm, che restituisce una valutazione della leggibilità nelle principali scale (Flesch / Vacca, Flesch Kincaid e l’italianissimo Gulpease) e l’analizzatore di leggibilità di translated.net, che ha il grande vantaggio di evidenziare le parole “critiche” del nostro testo. Nessuno dei due offre suggerimenti in linea come fa Hemingway, ma sono comunque ottimi strumenti SEO gratuiti.

Strumenti SEO gratuiti - misuratore di leggibilità

La leggibilità della prima parte di questo testo misurata da Linkomm.

Strumenti per sviluppatori di Chrome – Lo strumento di debug interno a Chrome è perfetto per testare la velocità di risposta del sito, migliorare i tempi di rendering, gestire le chiamate e così via. Per chi si occupa di SEO tecnico è un toccasana, ed è fra gli strumenti nativi dei browser più completi.

Beam Us Up (beamusup.com/seo-analytics-cro-tools/) — Un software per fare SEO crawling, cioè analisi sul nostro sito in modo massivo su tutte le pagine o comunque su un numero consistente di pagine contemporanee. Buona alternativa gratuita a Screaming Frog o Website auditor. Come tutti gli strumenti preminentemente tecnici non ha scogli linguistici, quindi funziona perfettamente con la lingua italiana. E’ disponibile per Windows, Mac e Linux (è basato su Java.)

Google Keyword Planner / Trends / Webmaster Tools / Analytics / Sheets   Beh brava gente, la versione originale è molto più didascalica, ma io ve la dico così: se non conoscete a menadito questi strumenti di Google (e la nuova Search console, che finalmente è uscita dai primi anni 2000), recuperate al più presto. Sono le basi!

Strumenti per Webmaster di Bing (bing.com/toolbox/webmaster) – Il nome dice tutto: gli strumenti ufficiali di Bing, completamente analoghi (ma con un’interfaccia un po’ più chiara, a dire il vero) alla più celebre Search Console di Google. Ok, Bing in Italia ha meno del 4% del mercato (secondo Statcounter), ma al mondo le cose stanno un po’ diversamente, e sentire un’altra campana non fa mai male.

Yandex Metrica – Analytics gratuiti. Considerati (a torto!) un’alternativa per chi non vuole usare Google Analytics, hanno invece una serie di funzioni decisamente più interessanti e approfondite. Una su tutte, le heatmap che andavano di moda qualche anno fa ma che sono sempre utilissime. Il giorno, mai troppo vicino, in cui usciremo dai monopoli di fatto che infestano il nostro ambiente, questo prodotto avrà molto da dire. Anche in questo caso è uno strumento prettamente tecnico, e la lingua non è influente.

30 ottimi strumenti SEO gratuiti meno conosciuti

Il primo esempio dell’autore, parla della combinazione di due strumenti, ovvero l’estensione gInfinity, che permette di scorrere all’infinito i risultati di ricerca, e del bookmarlet di Chris Ainsworth, che permette di estrarre collegamenti e titoli (anchor) da una SERP. Usandoli insieme, possiamo collezionare decine di risultati in secondi, pronti per essere inseriti in un foglio di calcolo.

Ecco altri strumenti SEO gratuiti (disordinati come nell’orginale)

Mergewords (mergewords.com) è uno strumento interessante per chi ha diverse liste di keyword e le vuole combinare fra di loro. Se invece siete dei veri nerd, potete fare la stessa cosa programmando un foglio di calcolo per fare un prodotto cartesiano.
L’articolo originale parla anche di Keyword Mixer, che però nel frattempo è sparito.
Si tratta comunque di semplici strumenti combinatori, per cui funzionano senza problemi anche in italiano, anche se noi abbiamo qualche problema in più con le preposizioni

Keyword Shitter (keywordshitter.com) –  Questo è interessante: inserite una keyword, fate clic su start job e lui ne genera decine di long tail, probabilmente usando un suo database di ricerche inverse.
Sfortunatamente non ci sono opzioni per scegliere il motore o la lingua, per cui se volete usarlo per la lingua italiana va bene fino a quando si parte da parole italiane (per esempio scrivere). Se usate una parola internazionale (per esempio SEO), i risultati saranno principalmente in inglese.

LSIgraph.com – Strumento interessantissimo per identificare le keyword di indicizzazione semantica latente (Latent Semantic Indexing, LSI, dai cui prende il nome). Per intendersi, quelle che in modo meno accademico vengono chiamate intenzioni di ricerca. Sfortunatamente non funziona in alcun modo con la lingua italiana, al massimo per keyword moto comuni restituisce qualche risultato in inglese; inoltre ha un limite di 3 ricerche giornaliere.

TextOptimizer (textoptimizer.com) – fa qualcosa di simile a LSIgraph, ha anche qualche risultato per l’italiano (ma non aspettiamoci cose eccezionali), ma ha diverse restrizioni in più (bisogna registrarsi quasi subito).

Strumento di ricerca keyword di SERPs.com (https://serps.com/tools/keyword-research/)  –  Uno dei pochi strumenti gratuiti a restituire anche i volumi di ricerca, ma i risultati per la lingua italiana sono appena discreti.

Anche SEOBook ha uno strumento simile, ma i risultati per l’italiano non sono eccezionali e la registrazione è faticosa

Strumenti SEO gratuiti: una nota

Lo giuro, sono partito con le migliori intenzioni. Ma alla fine questo blog è soprattutto un posto dove fare esercizi e appuntare le informazioni più interessanti e divertirsi. Purtroppo negli ultimi mesi il tempo è stato tiranno. Per cui ho deciso, invece di lasciar frollare l’articolo in cantina e pubblicarlo l’anno prossimo, di iniziare a proporlo fino al servizio che ho testato, sperando che sia utile e apprezzato in ogni caso. I più curiosi possono vedere la lista completa degli strumenti (non testati per l’italiano, però) nell’articolo originale.

Logo di Bing

Bing cambia la partita del content marketing

Mentre tutto il mondo (me compreso) si preoccupava dei nuovi algoritmi di Google, negli USA altre notizie cambiano il mondo del content marketing. Secondo i dati divulgati settimana scorsa da ComScore e riportati da BGR via Search Engine Land infatti, Bing, il motore di ricerca di Microsoft, ha raggiunto la ragguardevole quota di mercato del 20%. In altre parole, un quinto delle ricerche negli Stati Uniti è fatta con il motore di ricerca Made in Microsoft, che di sicuro ha tratto giovamento dalla recente partnership con Yahoo!.

Volendo fare un po’ di sano onanismo statistico, secondo i dati riportati Google ha circa il 64% del mercato, Bing il 20 e Yahoo!, che usa gli strumenti di Bing, quasi il 13%. Questo significa che Bing controlla circa la metà delle ricerche rispetto a Google, e quasi un terzo del totale. Questo almeno stando ai dati di ComScore. Secondo altre fonti, per esempio un articolo di Forbes di gennaio, la cosa non è così significativa, perché è dovuta anche in parte al cambio di motore di ricerca predefinito nel browser Firefox in seguito a nuovi accordi. C’è da dire che l’articolo non è così recente, e anche dopo questa data i numeri di Bing hanno continuato a crescere. L’altro dato che i “conservatori” contestano è che si riferisce solo alle ricerche desktop, mentre sappiamo che questi numeri cambiano se includiamo il mercato mobile.

Il punto è: come queste notizie, o opinioni, possono influenzare il content marketing?

La risposta è semplice: negare che oggi nella creazione di contenuti di qualità rientrino anche i parametri del SEO significherebbe nascondere la testa sotto la sabbia. Passiamo nel campo delle opinioni: la mia convinzione, semplificando fino ai minimi termini, è che le discipline SEO siano poco più di un trick. In fondo si tratta di un reverse engeneering, basato su dati anche piuttosto aleatori, il cui scopo ultimo è interagire meglio con un meccanismo il cui funzionamento è ignoto. Il che significa più o meno cercare di capire come funziona un computer percuotendolo con un femore.

Gli zeloti del SEO lavorano sul nuovo algoritmo di Google

Si, lo so. La realtà è più complessa e qualche base analitica c’è. Ma il mondo delle scienze esatte, come la meccanica o la fisica tradizionale, è un’altra cosa. Allora il punto è questo: se cambia il mercato, anche le regole del SEO, e quindi in parte quelle del content marketing, devono cambiare. Perché già ottimizzare i soli testi per un singolo motore di ricerca è impervio, e ottimizzare tutti i contenuti per più motori è molto, molto più complesso. Certo, i dati sono riferiti solo agli Stati Uniti, solo alle ricerche desktop, e così via. Ma la storia ci insegna che sottovalutare questi segnali non è mai una buona scelta. E, fatte le dovute proporzioni, già oggi ignorare il peso di Bing nella progettazione e gestione dei contenuti significa giocarsi una discreta fetta di mercato.

La soluzione? Prima di tutto, la mia opinione: basare tutto sul solo SEO è, con buona pace degli zeloti di cui sopra, una scelta miope. La transizione verso un content marketing più strutturato è già iniziata. Oggi essere bravi a combinare le parole nell’ordine che piace a Google non basta più.

Bisogna pensare anche a Bing e Yahoo!.

Allora, perché non semplificare le cose e tornare a pensare agli esseri umani? La creazione di contenuti di qualità attraverso un content marketing intelligente è una delle possibili risposte.

E, peraltro, funziona perfettamente da sempre.