Monday, August 21, 2006

El error de medición (no muestral) de una elección

En esta elección presidencial la ventaja de FC sobre AMLO es de 1.8 votos por casilla y tiene un error estándar de 0.20--este es el error muestral, por asi decirlo, y nos dice que FC está a casi diez errores estándar de distancia de AMLO: estadísticamente AMLO está lejísimos de su rival.

En su columna de hoy, José Antonio Crespo se refiere a lo que también se conoce como "error de medición" o "error no muestral": una encuesta puede tener una muestra suficiente pero aún así está el error de no respuesta, respuesta  malinterpretada o mal capturada, etc.  Para el caso de una elección escrutada por ciudadanos elegidos al azar lo que preocupa no es el error muestral (130 mil casillas son una muestra igual al universo) sino el error de medición.

Estadísticamente, si el error muestral es mínimo y el margen FC-AMLO es pequeño tenemos que fijarnos en el error de medición que proviene de errores de escrutinio o llenado de actas.  Este error fluctúa entre 1 y 1.5% de las votos de cada casilla (aunque es una medición muy tentativa con datos limitados, ojo).  ¿Es mucho o poco?  Todo depende de cómo está distribuido: si está distribuido de manera aleatoria a lo largo del país, aún si el error de medicion fuese de 5% o 10%, no tendemos mucho problema: todo mundo perdió o ganó un poquito en cada casilla y los errores se cancelan mutuamente.  Pero si el error de medición está sesgado hacia algún lado, tenemos un problema serio.

El TEPJF, a petición de parte, ordenó recontar una muestra muy sesgada de casillas (90% panistas).  Independientemente de lo allí encontrado, de esa muestra sólo podemos inferir el error de medición en cierto tipo de casillas panistas, y no más. Por su parte, la coalición hace cuentas entre alegres con estos errores aduciendo que evidencian irregularidades insoslayables. El problema aquí es que la única forma de saber si este error de medición es alto, bajo o insesgado es comparándolo con una muestra equivalente de casillas perredistas (ie, un grupo de control). Es decir, de un recuento sesgado, como fue el ordenado por el TEPJF, sólo pueden salir inferencias sesgadas.

Algunos juristas  dicen que el TEPJF no extrapolará nada más allá de la evidencia del recuento de casi 12 mil casillas por las mismas razones que no extrapoló los alegatos de AMLO hacia un recuento total--y por tanto no abrirá niguna casilla más... De ser así, un nuevo problema es que en la práctica el TEPJF le estaría dando argumentos al PRD para hacer extrapolaciones sesgadas, que pueden ser falsas, pero sin darle a un observador imparcial elementos para confirmar o desmentir tales extrapolaciones.  Noten que si el PRD lográ anular 4,000 casillas bien seleccionadas (3% del total nacional), la elección se voltearía en favor de AMLO.

Viendo los datos parciales disponibles a la fecha, parece que los errores de medición son tan aleatorios como los errores aritméticos de las actas: pero sin evidencias claras difícilmente el público lo creerá. Curiosamente, las cosas se perfilan hacia que el PAN sea ahora el interesado en un recuento muestral y representativo.  Una vía sencilla de resolver estas dudas sería que el TEPJF recontará una muestra representativa de casillas--como la del conteo rápido del IFE--para verificar si los errores humanos de medición de la elección tuvieron algún sesgo o no.  De no encontrarlo, la coalición difícilmente podría seguir alegando un fraude sistemático en su contra.

No comments: