111. Statistical Fallacies



“Meaningless and unknowable statistics” (statistiche prive di significato e non verificabili)

liberamente tratto da “Informal Logic” (Douglas Walton). Interessante in quanto le riviste odierne sono infarcite di tali pseudostatische:

Example 8.1

The American girl kisses an average of seventy-nine men before getting married (le ragazze americane baciano una media di settantanove uomini prima di sposarsi)

La domanda da porsi in relazione a tale genere di statistica  è  c o m e   si possa giungere a tale conclusione. E’ da ritenersi assai poco probabile che ciascuna ragazza tenga il conto esatto degli uomini baciati prima del matrimonio. Anche se ciascuna provasse a tenere il conto esatto vi sono buone possibilità di ricordare in modo errato. E anche se così non fosse, che motivo avremmo di ritenere che le intervistate  rispondano sinceramente? Molte donne si potrebbero sentire insultate attraverso tale domanda e potrebbero non voler rispondere affatto. Una volta fatte tali considerazioni risulta chiaro come la statistica sia assurda per l’impossibilità di ottenere dati affidabili ai fini di una seria statistica.

A titolo di esempio immaginate anche di venire confrontati con una statistica secondo la quale 33,87 %  di tutti i fuochi nelle foreste sarebbe appiccato intenzionalmente. Come si può giungere ad un tale dato? Innanzitutto consideriamo il fatto che per loro natura la causa di un gran numero di tali incendi rimane sconosciuta. Inoltre, anche quando la causa sia nota, ad esempio una sigaretta, è spesso impossibile verificare se essa sia stata gettata intenzionalmente o meno.

Le statistiche non verificabili o prive di significato sono state tradizionalmente nominate statistical fallacies, anche se l’errore reale consiste nella mancanza di indicazioni relative alle possibili riserve o punti critici del metodo impiegato. Inoltre assai raramente i media riportano menzione di esso. Un famoso esempio di statistiche non verificabili  è quello riguardante il numero di topi a New York:

“According to Seligman (1961), newspaper feature writers have claimed for years that there are eiht million rats in New York City. This sounds impressive, but how would you know that this figure is correct? Seligman interviewed the Rodent and Insect Consultant for New York City and was referred to two studies. The investigators counted rats in certain areas, and then extrapolated from thes findings to figures for the whole city. But how could one be confident that even the original counts could be accurate or representative of the rat population of an area? The problem is that the rats do not tend to be too co-operative. They tend to stick to inaccessible places, like sewers, and they are not too willing to stand around and be counted. According to the Insect and Rodent Consultant, “you can count a rat on the eighth floor of a building and then another on the seventh floor, and then another when you get to the sixth – but after all, you may be seeing the same rat three times".

L’errore della statistica non conoscibile o verificabile (unknowable statistic)  ha a che fare con la difficoltà o impossibilità ad accedere a dati idonei e/o sufficienti a detto fine, mentre l’errore della statistica priva di significato (meaningless statistic) ha a che fare con la vaghezza della definizione dei termini usati. Entrambi gli errori presentano l’impiego di cifre precise laddove queste non sono sufficientemente supportate e/o non vengono presentate con margine di incertezza. Per quanto riguarda il secondo tipo di errore si prenda ad esempio in considerazione una statistica sulla disoccupazione. Quanto spesso nel leggere tali statistiche vi siete imbattuti nell’esposizione del metodo alla base di esse?

“Another problem you would have to solve is how to define’ unemployed person’.  Does an actor who is between jobs count as unemployed? Does a mother who has not seriously considered going back to work count as unemployed? Let’s say you define unemployed person as an individual who is presently not working but who is seriously trying to find work. Than you have partly solved your problem of definition, and the mother seriously considered going back to work is not defined as an unemployed person, but you still have the problem of applying your definition to a particular person. Suppose the actor betweeen jobs has tried to find more work to fill in, but will only take on assignments that he finds artistically satisfying. Should we classify him as a person who is ‘ seriously trying to find work’ or not? This is a problem of interpretation that may significantly affect the unemployment figure arrived at (…) when making a decision based on a figure of current unemployment, to know what the figure really means it may be helpful to know or to ask about, the assumptions and definition on which the figure was based”