Oltre che di virologia, economia, tattica calcistica, tuttologia teorica applicata… e hanno un casino di iscritti…
Su twitter un mio contatto ha segnalato questo messaggio:
Ieri ho fatto una sorta di test in fb. Ho 2 profili da 5000 persone, Ho chiesto cosa stessero leggendo in questo periodo. Al momento hanno risposto in 115.
Casomai ne avessi avuto bisogno, ho visto il livello di curiosità culturale che mi circonda.
Batto la testa nel muro.
Messaggio a cui è stata data anche questa risposta:
150 su mille è il 15%, tenendo conto che molti avranno sicuramente mentito, diciamo che restano circa il 10%. Questo spiega perché gli italiani votano in massa lega e 5s.
Posso dire che il messaggio originale ha un paio di errori metodologici nell’analisi statistica ovvero:
- Selezione del campione: il campione è realmente rappresentativo?
- Ampiezza del campione: quanti in realtà hanno partecipato?
- Errata valutazione della non “risposta”.
Primo errore: uno dei problemi della statistica campionatoria è la scelta del campione dal quale poi dedurre il comportamento della popolazione. Banalmente se faccio la stessa domanda “cosa ne pensa degli immigrati clandestini” durante una riunione di Potere al Popolo otterrò risposte completamente differenti da quelle che otterrei se la domanda la facessi durante una riunione di Forza Nuova. Se sbagli nello scegliere il campione ottieni risultati clamorosamente errati o meglio i risultati son corretti ma è sbagliato estenderli a tutta la popolazione.
Secondo errore: quanti hanno in realtà partecipato al sondaggio, quanti hanno realmente letto la pagina FB? ovviamente la mancanza di tale numero, 5000 iscritti significa poco, inficia tutte le analisi statistiche successive, hai 115 risposte su quante persone?
Terzo errore, in una indagine seria sai quante interviste son state poste e a quali domande la gente, che ha scelto di partecipare, ha risposto “non so” o non ha voluto rispondere. In questo sondaggio come fai a sapere quanti hanno realmente letto il messaggio e hanno deciso di non rispondere.
Per intenderci una cosa è:
Buongiorno vuole rispondere a qualche domanda sulla politica?
Sì
Il politico Tizio sostiene la tesi X; da 1 a 10 quanto è d’accordo con Tizio?
Non saprei
E altra cosa è:
Buongiorno vuole rispondere a qualche domanda sulla politica?
Non ho tempo, scusi.
Il primo caso la risposta la puoi registrare come “non sa/non risponde”, la seconda invece no. Devi considerare la persona come non partecipante.
Chi non ha risposto perché non ha risposto? perché non ha letto alcun libro? perché non interessato al sondaggio?
Quello di usare “le non risposte” e la “non partecipazione” a supporto della propria tesi è un altro errore da evitare. Chiedo a 5000 persone cosa pensano di Tizio. di queste 4500 mi rispondono che non hanno tempo/voglia di parlare con me. 300 me ne dicono corna e peste di Tizio e 200 lo considerano un novello Giulio Cesare. Io poi vado a sostenere che Tizio non viene giudicato positivamente da 4800 persone su 5000, il 96%. E poi magari scopro che Tizio alle elezioni ha carpito il 55% dei consensi (vedi elezioni politiche americane e “sorprendente vittoria” di trump).
Interessante anche il messaggio di risposta; sballa completamente i dati; da dove salta fuori il rapporto 150/1000? fa affermazioni apodittiche “molti avranno sicuramente mentito” e conclude con un bellissimo non sequitur “Questo spiega perché gli italiani votano in massa lega e 5s” o forse sequitur, cioè se questa è l’opposizione…
Divertente comunque che molti che stigmatizzano l’ignoranza della gente “che vota lega e 5s” poi tiri fuori perle che non hanno nulla da invidiare ad un Di Maio o ad un Toninelli qualsiasi…