Luis Chiozza
Acerca de la superstición en el uso de la estadística 1
I El conocimiento estadístico
El resultado de un estudio estadístico no es, como habitualmente se piensa, un producto "imparcialmente objetivo", ya que implica dos tareas previas que se realizan con un determinado y subjetivo criterio axiológico. Una consiste en aislar y elegir el valor que se va a computar; la otra se refiere a la homogeneización de las variables que no se están estudiando y que podrían incidir alterando la influencia del valor computado. Si bien la segunda de estas tareas es la única que se refiere específicamente al conocimiento estadístico, ya que la primera es condición previa, ambas afectan al resultado obtenido.
La homogeneización es, por su naturaleza, imperfecta y, además, tan incompleta como cualquier otro proceso cognoscitivo, en tanto no se pueden tomar en cuenta aquellas variables que son desconocidas. Pensamos sobre todo en aquellas variables que no pueden ser tenidas en cuenta porque su identificación implica un determinado criterio interpretativo. Este criterio interpretativo depende de una adquisición cognoscitiva que puede ser concebida como un proceso que nunca llega a su término.
No queremos significar con esto que el estudio estadístico constituya una tarea inútil que resulte en un conocimiento falso, sino que, en la medida en que se lo considere imparcialmente objetivo, su utilización es supersticiosa y no es acertada.
Para un empleo adecuado, conviene tener conciencia de que la estadística sustituye al conocimiento de certeza, tanto como a la comprensión más profunda de los fenómenos. Por este motivo afirmamos que la estadística es nuestro "peor es nada".
El criterio de que lo que llamamos certeza no es más que una altísima probabilidad estadística, ha ganado terreno dentro de las ciencias físicas, pero nosotros nos referimos aquí al campo de las macroexperiencias cotidianas frente a las cuales tiene sentido distinguir entre probabilidad y certeza. Podemos decir, por ejemplo, que estadísticamente se ha comprobado que sólo el 5% de los soldados conscriptos obtienen un franco solicitado, mientras que al 95% le es negado. Sin embargo, es muy distinto afirmar que lo obtuvieron aquellos que se lo solicitaron al teniente, y les fue negado a quienes se dirigieron al sargento. Mejor aún sería poder explicar por qué el teniente otorga lo que el sargento niega.
También conviene tener conciencia de que las conclusiones estadísticas son siempre en términos de números cardinales, nunca ordinales. Nos aclaran que 2 personas de cada 10 no toleran la ropa de lana, pero no nos dicen que estas 2 personas son, por ejemplo, la tercera y la quinta. Dicho de otro modo: la estadística no se aplica al caso particular (Carnap, 1966; Popper, 1974). Uno por ciento, cuando se trata de uno, no es más ni es menos que uno.
II ¿Qué ocurre cuando se trata de uno?
Dado que nos interesa profundizar en la comprensión y ejemplificación de esta última idea, tomaremos como situación paradigmática el caso de la ruleta rusa.
Tenemos dos revólveres; cada uno de ellos posee un tambor giratorio con capacidad para 6 balas. En el revólver 5B colocamos 5 balas; en el revólver 1B una sola bala.
Sostener que la estadística no se aplica al caso individual equivale a sostener que, frente a la situación de gatillar uno de esos dos revólveres, por una única vez, apuntando a la propia sien, es indiferente cuál de los dos revólveres se elija, a los efectos de la posibilidad de morir. ("Posibilidad" no es idéntica a "probabilidad". Hay cosas posibles sin que haya manera cierta de determinar cuán probables son).
Imaginemos que tenemos dos ventanillas. Frente a cada una de ellas hay una fila de sujetos que esperan para realizar la experiencia con el revólver una única vez. En la ventanilla 5B está el revólver de 5 balas sobre 6 espacios; en la ventanilla 1B el revólver de una bala sobre 6 espacios. Cuando comienza la experiencia hacemos girar el tambor de ambos revólveres, de modo que desconozcamos la posición inicial del gatillo. Hacemos desfilar 6 sujetos delante de cada revólver, los cuales, sucesivamente dispararán, cada uno de ellos, un tiro sobre sí mismos, sin hacer girar nuevamente el tambor.
No nos hace falta la estadística para saber qué sucederá. En la ventanilla 5B morirán 5 personas y se salvará 1 (descontando la intervención de otros factores imprevistos), mientras que en la ventanilla 1B morirá sólo 1 y se salvarán 5. Esto es una "certeza" que no surge de un conocimiento estadístico, sino de una deducción.
Pero ahora vamos a cambiar esta experiencia imaginaria, para huir de la certeza y recurrir al conocimiento estadístico. Vamos a desestimar lo que pasa con todas las personas excepto con una, a la cual llamaremos Pedro y que, a los fines de nuestra experiencia haremos resucitar cada vez que muera.
Al empezar el experimento imaginario haremos girar los tambores al azar, para desconocer la posición inicial. Pondremos 5 personas frente a cada ventanilla y luego, con un dado, sortearemos el orden en que Pedro, la sexta persona, se colocará en la fila. En primer término lo hará frente a la ventanilla 5B y en segundo término, luego de "resucitado" o ileso, frente a la ventanilla 1B. Una vez terminado este ciclo, lo volveremos a repetir tal cual, tantas veces como queramos.
Para realizar este experimento imaginario, y ahorrarnos trabajo con dados y anotaciones, escribimos, con estas prescripciones, un programa de computadora2. Ensayamos 4 variantes: se repite el ciclo 100 veces, 50 veces, 3 veces y 2 veces. Además, finalizado cada ciclo, se establece en términos de porcentaje las probabilidades de muerte de Pedro en una y otra ventanilla y se halla también esta probabilidad porcentual al finalizar los 100 ciclos, los 50 ciclos, los 3 ciclos y los 2 ciclos.
Una vez realizada la experiencia hallamos, como era de esperar, que en 100 casos la probabilidad de muerte de Pedro coincide bastante aproximadamente con 5/6 para la ventanilla 5B y con 1/6 para la ventanilla 1B; que en 50 casos la probabilidad se aproxima menos a esa cifra; que en 3 y 2 casos (repetidos muchas veces) coincide o contradice manifiestamente dichas proporciones y que cuando se trata de un solo caso, la "probabilidad" 3 únicamente puede ser del 100% de muertes o del 0%, independientemente de la ventanilla considerada. Dicho en otras palabras: en el caso individual la aproximación estadística a la cifra 5/6 ó 1/6 es igual a cero.
Las cifras obtenidas la primera vez que realizamos la experiencia fueron las siguientes:
100 casos: N° de muertes con revólver 5B: 80 (80%)
N° de muertes con revólver 1B: 17 (17%)
50 casos: N° de muertes con revólver 5B: 39 (78%)
N° de muertes con revólver 1B: 7 (14%)
3 casos: N° de muertes con revólver 5B: 3 (100%)
N° de muertes con revólver 1B: 0 (0%)
2 casos: N° de muertes con revólver 5B: 1 (50%)
N° de muertes con revólver 1B: 0 (0%)
1 caso:
Para elegir un caso, sorteamos al azar un número del 1 al 100, lo cual nos dio el número 85; volviendo sobre el programa de 100 casos de la computadora, elegimos el caso número 85 que correspondía a
5B: muerto (100%),
1B: vivo (0%).
Si el sorteo hubiera arrojado el número 94 hubiera dado a la inversa. Si el número del sorteo hubiera sido el 11 hubiese muerto con ambos revólveres. Y si hubiera sido el 13 (!) se hubiera salvado con ambos.
Estas son las 4 posibilidades, cada una de las cuales, en el caso individual, una vez realizada, sólo puede evidenciar una probabilidad de 0% o de 100% de muerte (1/1 X 100=100; 0/1 X 100= 0).
Reproducimos la experiencia en el gráfico que se incluye a continuación
III ¿Qué ocurre cuando se mezclan los porcentajes?
Reintroduzcamos esta cuestión desde otro ángulo, extraído de una paradoja de Martín Gardner (1975).
En Mendoza, sobre un total de 180 enfermos de la misma dolencia, 110 fueron tratados con el sistema quimioterápico P y curaron 50; 70 fueron tratados con el sistema quimioterápico E y curaron 30. Esto equivale a un 45,4545... % de curaciones con el sistema P y un 42,857142... % con el sistema E. En términos más exactos, a un 35/77 de curaciones con el sistema P, y 33/77 con el E.
En el hospital de Córdoba, con un total de 230 pacientes de la misma enfermedad que los de Mendoza, 90 fueron tratados con el sistema P y curaron 60; 140 fueron tratados con el sistema E y curaron 90. Esto equivale a un 66,6666... % de curaciones con el sistema P, y a un 64,285714... % de curaciones con el sistema E. En términos más exactos, a un 28/42 de curaciones con el sistema P, y a un 27/42 con el sistema E.
En ambos casos existe una leve ventaja a favor del sistema P. Si promediamos los porcentajes de los Hospitales de Mendoza y de Córdoba, obtenemos un 56,0606... % de curaciones con el sistema quimioterápico P, y sólo un 53,57 % con el sistema quimioterápico E.
Pero en la oficina central de estadísticas no se conforman con el inexacto sistema del promedio y se procede a sumar los totales de enfermos tratados y se encuentra que: sobre un total de 410 enfermos, 200 fueron tratados con el sistema quimioterápico P y curaron 110; 210 fueron tratados con el sistema quimioterápico E y curaron 120. Esto equivale a un 55 % de curaciones con el sistema P, y un 57,142857 % de curaciones con el sistema E. En términos más exactos 231/420 para el caso del sistema P, y 240/420 para el sistema E.
Es decir que, sobre la misma experiencia clínica, se obtuvieron conclusiones contradictorias respecto de las obtenidas en Mendoza y Córdoba aisladamente.
Reproducimos la experiencia en el siguiente esquema, acompañado de un gráfico.
Imaginemos ahora otra experiencia extremando las cifras.
En el Hospital de Mendoza, sobre un total de 1.200 enfermos de la misma dolencia, 100 de ellos fueron tratados con el sistema quimioterápico P y curaron 90; 1.100 fueron tratados con el sistema quimioterápico E y curaron 880. Esto equivale a un 90 % de curaciones con el sistema P, y a un 80 % de curaciones con el sistema E.
En el Hospital principal de Córdoba, con un total de 1.000 pacientes de la misma enfermedad que los de Mendoza, 500 fueron tratados con el sistema P y curaron 250; otros 500 pacientes fueron tratados con el sistema E y curaron 225. Esto equivale a un 50 % de curaciones con el sistema P, y un 45 % de curaciones con el sistema E.
En ambos casos existe una ventaja, en la acción terapéutica, a favor del sistema P.
En la Oficina Central de Estadísticas se procede a sumar los totales de enfermos tratados y se encuentra que: sobre un total de 2.200 enfermos, 600 fueron tratados con el sistema P y curaron 340, y otros 1.600 pacientes fueron tratados con el sistema E y curaron 1.105. Esto equivale a un 56,666... % de curaciones con el sistema P, y un 69,060606... % de curaciones con el sistema E (en términos más exactos: 2.720/4.800 para el caso del sistema P, y 3.315/4.800 para el caso del sistema E).
Nuevamente la ventaja de un sistema respecto del otro se invierte.
Reproducimos la nueva experiencia en el siguiente esquema, acompañado de un gráfico.
IV El problema de la exactitud estadística
Si unimos lo que nos enseña la ruleta rusa con lo que nos plantea la "paradoja" de Gardner, tomando como ejemplo las segundas cifras de la paradoja, tenemos la siguiente conclusión: en Mendoza (a partir de un hecho que en nuestra suposición no fue un experimento planeado, sino la experiencia de un suceso acontecido procesado estadísticamente), pudimos establecer que el procedimiento P era mejor que el E, pero tuvimos que mezclar una afirmación estadística obtenida sobre 1.100 casos, con el grado de precisión X correspondiente a 1.100, con la afirmación estadística obtenida sobre 100 casos, con el grado de precisión Y correspondiente a 100 casos.
Cuando establecimos nuevos cálculos en la oficina central de Buenos Aires, sumando los hallazgos de Córdoba y de Mendoza, los grados de aproximaciones estadísticas se mezclaron en otra proporción (600 casos para el sistema P y 1.600 para el E); por lo tanto, fue posible obtener una afirmación de signo contrario: el tratamiento P era peor que el E.
Si preguntáramos ahora cuál es la conclusión estadística probablemente más exacta, deberíamos decir que es la que reúne el mayor número de casos, aun que nada nos asegura que si, a las conclusiones de Buenos Aires, sumáramos las obtenidas, por ejemplo, en Chile, el resultado no se volvería a invertir (al fin y al cabo, podría haber sucedido que las experiencias de Mendoza provinieran de la suma de las experiencias realizadas en las salas A y B, y que éstas, individualmente consideradas, hubieran arrojado un resultado inverso a favor del tratamiento E).
Si preguntáramos en cambio, cuál de las conclusiones estadísticas (Mendoza, Córdoba, Buenos Aires) es correcta, deberíamos decir que, en sí mismas, son correctas las tres. Sostener que, para poder comparar las estadísticas, debería partirse del mismo número de casos, es una afirmación que, como veremos, bajo su apariencia lógica, oculta una falacia.
Las cifras estadísticas corresponden a una experiencia que constituye la evaluación de un suceso real en el cual, para elegir algunos casos y excluir otros, hubiéramos debido tener un criterio o recurrir al azar. Pero, con cualquiera de los dos recursos, al disminuir el mayor número de casos, hasta homologarlo con el menor (de 1.100 a 100), disminuiríamos la precisión estadística en lugar de aumentarla. Dicho en otras palabras, restableceríamos una coherencia al precio de someter el resultado de mayor precisión al de menor precisión. Si bien nuestra ambición de compatibilizar una lógica coherente con nuestra impresión superficial intuitiva quedaría satisfecha, porque habríamos superado la aparente paradoja, estaríamos más lejos del conocimiento. Pero, lo que es más importante todavía, estaríamos, de todas maneras, completamente inseguros de que un mayor número de casos, aún en cantidades homólogas, no nos invertiría otra vez el resultado 4.
V. Comentario final
En las reuniones científicas habituales es muy frecuente escuchar que, con el ánimo de otorgar a un postulado el carácter de una afirmación objetiva, se recurre a la estadística como modo de evaluación privilegiado, que zanja definitivamente la cuestión. A menudo se confunde la casuística, que es una mera acumulación de casos, con una adecuada valoración estadística, que supone el conocimiento de la ciencia llamada Estadística.
Cuando las afirmaciones se presentan acompañadas por cifras que, como es el caso de las estadísticas, despiertan la idea de una medida, pareciera que cumplimos más acabadamente con un ideal que, a pesar de ser anacrónico y positivista, no ha dejado de tener vigencia: medir todo lo que sea susceptible de medida, y hacer susceptible de medida lo que aún no lo es.
Se niega entonces que:
1) La objetividad (más allá de si es posible o imposible) no es una adquisición estadística.
2) La estadística en sí misma (independientemente del grado de utilidad que le asignemos en el conocimiento) es una interpretación de la realidad, ya que la mera identificación de los hechos computados es el producto de haberlos interpretado.
3) Deificamos a la ciencia Estadística para conservar la ilusión de controlar y dominar una realidad inaprehensible en sí misma. De este modo desaprovechamos el verdadero valor de los sistemas de pensamiento que la constituyen como ciencia.
4) La estadística no puede reemplazar al conocimiento de las relaciones causales, que nos permiten deducir los efectos, ni al conocimiento de las relaciones de significación, que nos permiten comprender el sentido.
Un ejemplo, tomado de Carl Hempel, muestra las falacias a las que puede conducir el trato descuidado de la inferencia estadística. "Juan es alcohólico anónimo. Menos del 1 por ciento de los alcohólicos anónimos son profesores de enseñanza superior. De acuerdo con estas premisas, empleando una regla de probabilidad, la conclusión será que Juan, tiene una probabilidad inferior a 0,01 de ser profesor de enseñanza superior. Pero supongamos que Juan lee asiduamente el Journal of Philosophy , y más del 99 % de sus lectores son profesores de enseñanza superior. Luego Juan tendrá una probabilidad de 0,99 de ser profesor de enseñanza superior. Tenemos aquí dos conclusiones contradictorias" (Wartofsky, 1968) 5.
Debemos subrayar que la estadística es útil en aquellas circunstancias en las cuales necesitamos conocer, en un número elevado de casos, la proporción aproximada en que un determinado acontecimiento ocurrirá. En nuestro ejemplo de la ruleta rusa, es obvio que, de tener que establecer un negocio de venta de ataúdes frente a una de las dos ventanillas, será más conveniente hacerlo junto a la ventanilla 5B.
Frente a las limitaciones que hemos señalado, podría objetarse que no hacemos las cosas por una única vez, y que si bien no nos disparamos en la sien cotidianamente, solemos bajar las escaleras del subterráneo todos los días y conviene que lo hagamos por los lugares estadísticamente menos peligrosos.
Si bien es cierto que no vivimos actos únicos, también es cierto que la estadística, al homogeneizar las variables para crear la cantidad, nos quita la posibilidad de que nos apoyemos en ella para computar como suma a un conjunto de acontecimientos individuales que, a pesar de no ser únicos e irrepetibles son, sin embargo, disímiles, y sólo entrarían forzados en una misma estadística.
Cuando en situaciones individuales decidimos, sin conocer razones ni significados que estén a la altura de nuestros conocimientos mejor elaborados, lo hacemos sobre la base de creencias que extraen su fuerza del pensamiento mágico. Tales creencias nos explican que el uso supersticioso de la estadística sea mucho más habitual y extendido, aún dentro de la ciencia, de lo que, en una aproximación superficial, se está dispuesto a admitir.
La sabiduría popular, que se expresa muchas veces en forma de chistes, puede aportarnos más elementos:
La esposa de Pedro está preocupada porque el cirujano le ha dicho que sólo el 70 % sobrevive a la operación a la que debe someterse su marido. Pero el cirujano la tranquiliza diciéndole: "no se preocupe señora, porque yo este año ya he cubierto mi 30 % de muertes".
Sabiendo que hay una probabilidad entre 10.000 de que exista una bomba oculta en un determinado avión de pasajeros y una probabilidad de 10 billones de que un mismo avión transporte 2 bombas, Juan ha decidido aumentar su margen de seguridad llevando consigo una bomba para el próximo viaje.
Todos, espontáneamente, solemos reír frente a chistes como éstos, cuya gracia se acompaña del sentimiento de lo absurdo, pero vale la pena meditar sobre la forma en que ese absurdo se construye.
Notas
1 El contenido del presente capítulo proviene de un trabajo realizado en un grupo de estudio al cual concurrían los licenciados Dorrit Adamo, Domingo Boari, Cristina Schneer, Ricardo Spivak y Mirta Stisman y la doctora Liliana Barbero. Allí ampliábamos ideas ya expuestas en trabajos anteriores (Chiozza, 1978j; 1981e y 1983b [1982] -décimo capítulo del presente volumen-; Chiozza y colab., 1983a [1981])
2 Adjuntamos un programa escrito en BASIC.
10 PRINT "COMPROBACIÓN ESTADÍSTICA"
15 PRINT "La estadística no se aplica al caso individual"
20 PRINT
21 PRINT "El caso de la ruleta rusa"
22 PRINT "R.5B=Revolver 5B"; "R.1B=Revolver 1 B"
23 PRINT "R.5B=5 balas"; "R.1B=1 bala"
24PRINT "El tambor recargado gira al azar luego de seis disparos"
25 PRINT "Pedro ocupa un lugar al azar en una fila de seis personas"
26 PRINT "SU.5B=suerte de Pedro con R.5B"
27 PRINT "SU.1B=suerte de Pedro con R.1B"
28 PRINT "0=vida", "1=muerte"
29 PRINT
30 F=1
32 T=50
34 L=0
35 U=0
44 X=0
45 GOTO 60
46 REM Para comprobar sólo dos disparos run 48.-
48 X=0
50 GOTO 80
60 FOR N=1 TO 50
70 GOTO 130
80 L=0
90 U=0
100 F=1
110 T=2
120 FOR N=1 TO 2
130 A= INT (RND) (1)X6+1)
140 B= INT (RND) (1)X6+1)
150 C= INT (RND) (1)X6+1)
160 D= INT (RND) (1)X6+1)
170 H=A+C
180 I=B+D
190 IF H>6 THEN H=H6
200 IF H>6 THEN I=I6
210 IF H=1 THEN H=0
220 IF H>1 THEN H=1
230 IF I>1 THEN I=0
240 PRINT N; ""A;C;"SU.5B=";H;""B;D;"SU.1B=";I
250 Z=(H/F)X100
260 Y=(I/F)X100
270 PRINT"R.5B%M=";Z "R.1B%M=";Y
280 IF Z=100 THEN Z=1
290 IF Y=100 THEN Y=1
300 IF Z=1 THEN L=L+1
310 IF Y=1 THEN U=U+1
320 NEXT N
330 PRINT " % TOTAL DE MUERTES"
340 J= (L/T)X100
350 K= (U/T)X100
400 PRINT "R.5B=";J;"%M", "R.1B=";K;"%M"
450 X=X+1
500 IF X <10 THEN GOTO 50
3 Ponemos aquí probabilidad entre comillas ya que, en realidad, no se trata de probabilidad, sino únicamente de posibilidad.
4 Podría suceder, por ejemplo, que los resultados obtenidos homólogamente sobre 100 casos en cada una de ambas ciudades, fueran inversos que los obtenidos más tarde sobre 1.000 casos en cada ciudad. Es decir que, homologando en 100 los casos de ambas ciudades habríamos ganado en coherencia pero no en precisión.
5 Citado por Canteros y Martín (1979).