lunedì 23 luglio 2012

Il tema dei "finti follower" su Twitter è grandemente esagerato


La questione dei "finti follower" su Twitter scoperta da Marco Camisani Calzolari è come la notizia della morte di Mark Twain, successivamente smentita da lui stesso: grandemente esagerata.

In gran parte è un fenomeno fisiologico di tutti i database:

qualsiasi elenco di esseri umani (compresa la rubrica telefonica del proprio telefonino) accumula un tasso di errore pari almeno al 5% annuo (al 10% annuo se non viene fatta nessuna manutenzione e pulizia). Bastano due o tre anni di mancata pulizia delle liste per cumulare questo effetto raggiungendo percentuali di errore pari al 15-30%.

Questo perché gli esseri umani:

  1. traslocano
  2. cambiano indirizzo
  3. si ammalano
  4. muoiono
  5. cambiano vita
  6. cambiano mestiere
In particolare, nel caso degli account Twitter (di cui, a differenza per esempio dei database di indirizzi e-mail delle newsletter, in genere non viene fatta manutenzione dei follower) succede anche che:
  • L'utente non usa più l'account
  • Ne ha più d'uno e alcuni li usa poco
  • Si è dimenticato la password e, invece di recuperarla, ne ha creato un'altro
  • Non usa più da anni l'indirizzo e-mail connesso
  • Altri motivi che non mi vengono in mente.

ergo, un account Twitter con 4 anni di anzianità ha fisiologicamente almeno il 20% di follower obsoleti (account duplicati, non utilizzati, di cui l'utente ha perso la pw, è deceduto, ecc). Se a questi si aggiungono i bot e gli accounti automatici e semi-automatici (alcuni dei quali perfettamente legittimi, ad esempio quelli che lanciano automaticamente i nuovi post di un blog molto seguito), eccoci arrivati ai numeri che Marco Camisani Calzolari esibisce con tanto scandalo. :-)

Insomma: è un fenomeno fisiologico di ogni database, con numeri più o meno alti: anche gli elenchi degli abbonati dei periodici cartacei sono pieni di errori, salvo che, siccome spedire un giornale cartaceo costa, c'è un interesse economico a pulire il più possibile gli elenchi, tenendo questa percentuale d'errore sotto il 10%. Nel caso di Twitter, siccome l'errore ha un costo vicino a zero, praticamente nessuno si preoccupa di verificare e pulire le liste dei propri follower.


Aggiornamenti:


Qui un'interessante analisi del documento e della procedura applicata da Marco Camisani Calzolari (in inglese), di Gianluca Stringhini.


Qui l'analisi della vicenda, senza peli sulla lingua, di Gianluca Neri, blog Macchianera.


Qui invece un interessantissimo caso di utente inesistente ma popolarissimo, il caso Laiello su aNobii.

4 commenti:

Walter Vannini ha detto...

ciao,
guarda che lo "scandalo" non viene da Camisani Calzolari, ma da alcuni "comunicatori", che si sono sentiti chiamati in causa non si capisce perché (si capisce, si capisce...) e da alcuni pignoli che invece di parlare del problema fanno o dietrologia o discutono del sesso degli angeli (aka scientificità della ricerca).

Io credo che la percentuale di bot di per sé non sia un problema. Credo però che il numero di follower, come quello di like, come quello di pageviews, click, voti eccetera, non significhi assolutamente niente a meno che gli utenti non siano registrati e individuati (da chi li ha come followers, non dal social).

Grazie, ciao,
W

Anonimo ha detto...

Come non quotarti?

Gianni ha detto...

@Walter. In parte hai ragione. Però la ricerca di Camisani è basata in parte sul nulla. Ovvero si limita a scoprire un fenomeno vecchio come il direct marketing (e scoperto decine di anni fa proprio nel settore del direct marketing): data una lista di nomi, indirizzi, pseudonimi, col tempo si accumulano degli errori. L'errore poi è prendere questi errori fisiologici (che nel caso di Twitter sono particolarmente alti per i motivi che ho spiegato) e sommarli d'ufficio agli indirizzi a gestione automatica, generando una percentuale totale che è impressionante solo per profani e giornalisti.

Per quel che riguarda i numeri complessivi, hanno una loro importanza: semplicemente non vanno sopravvalutati.

L'errore di fondo è sopravvalutare sistematicamente i numeri della televisione e della stampa, invece :-)

Vorrei vedere cosa si direbbe di Facebook se le statistiche fossero basate su un panel segreto di 2000 utenti... eppure l'Auditel funziona così e nessuno fa polemiche :-)

M. ha detto...

L'analisi mi pare corretta. Fa strano notare che Camisani Calzolari si è servito di un algoritmo (un Bot) per rilevare i Bot. Perché per tarare un filtro tipo antispam si procede per prove ed errori; continui aggiustamenti. Mah.