Monday, July 24, 2006

Analisis del PREP y Computo Distrital

Circulan por internet y en los medios diversos estudios y rumores sobre supuestas anomalías en el flujo de datos del PREP y el cómputo distrital. Usando los datos casilla por casilla del IFE, hice un análisis estadístico (nada sofisticado, ojo) que espero despeje algunas dudas.

Las conclusiones son simples pero merecen recalcarse: el sesgo urbano explica el flujo de datos del PREP, y el sesgo partidista explica el cómputo distrital.

Pueden verlo en esta liga:
http://www.cide.edu/investigadores/aparicio/elecciones/

Si les parece interesante, ojalá puedan difundirlo a sus contactos.

Addendum: la presentación ha sido actualizada (25-julio-2006)

Sunday, July 23, 2006

The secret to wisdom: Strong opinions, weakly held

Some words of wisdom from management-guru Bob Sutton:

"...virtues of wise people – those who have the courage to act on their knowledge, but the humility to doubt what they know – is one of the main themes in Hard Facts. (...) Perhaps the best description I’ve ever seen of how wise people act comes from the amazing folks at Palo Alto’s Institute for the Future.

A couple years ago, I was talking the Institute’s Bob Johansen about wisdom, and he explained that – to deal with an uncertain future and still move forward – they advise people to have “strong opinions, which are weakly held.” They've been giving this advice for years, and I understand that it was first developed by Instituite Director Paul Saffo. Bob explained that weak opinions are problematic because people aren’t inspired to develop the best arguments possible for them, or to put forth the energy required to test them. Bob explained that it was just as important, however, to not be too attached to what you believe because, otherwise, it undermines your ability to “see” and “hear” evidence that clashes with your opinions. This is what psychologists sometimes call the problem of “confirmation bias.”

Here's a somewhat more elegant variation: "Fierce opinions, briefly held, quietly disowned."

Wednesday, July 19, 2006

Especulaciones sobre PREP y Conteo Distrital

Circulan en internet diversos análisis sobre las supuestas anomalías del PREP y del conteo distrital. Sin hacer un juicio sumario sobre la calidad de estos estudios, la mayoría de ellos han sido usados como argumentos para sustentar la hipótesis del fraude cibernético. Celebro estos análisis que explotan la transparencia (a veces tardía, pero transparencia al fin) y los datos divulgados por el IFE. Lo malo del asunto es que ni los medios ni los ciudadanos comunes saben mucho de estadística y entonces es fácil que unos y otros se vayan con la finta... Otro problema no menor es que aún los expertos pueden ver moros con tranchete si parten de supuestos equivocados. Veamos.

¿Anomalías o sesgo urbano y partidista?
Dos hipótesis sugeridas por muchos pero que casi nadie ha puesto a prueba, o de plano la descartan prima facie, es 1) el sesgo urbano en el flujo de datos del PREP y 2) el sesgo partidista en el conteo distrital.

Los datos planos del PREP, hechos disponibles recientemente por el IFE, incluyen una variable donde distinguen entre casillas rurales y urbanas. El PAN aventajó en zonas urbanas y no tanto en las rurales. Ex-post, tambien sabemos en qué estados o distritos ganó FC y en cuáles AMLO. Con tales datos se pueden hacer fácilmente las siguientes pruebas:
  1. Comparar medias de votos PAN/PRD/PRI en casillas rurales y urbanas
  2. Ritmo y velocidad de captura en PREP en casillas rurales y urbanas
  3. Velocidad de captura en CDA en estados donde gano AMLO vs. FC.
Mi pronostico es que los flujos iniciales del PREP provinieron de casillas urbanas, donde se favoreció a FC. El margen sobre AMLO disminuyó paulatinamente conforme llegaron datos mas típicos del resto del país... pero luego volvió a aumentar un poco al llegar las boletas del noroeste y el tardío pero seguro voto rural pro-PRI. Si la ventaja incial de FC era suficientemente amplia, no tendría por qué haber habido cruce... tal como ocurrió.

En cuanto al conteo distrital, pronostico que los computos avanzaron mas rápido en los distritos o estados pro-AMLO, que en los estados pro-Calderón. Esto no es aleatorio, sino fruto de que los comités distritales donde ganó Calderón sostuvieron mayores debates casilla por casilla que los de su rival--lo cual retardó su captura. Al final, si el PREP y el conteo rápido no mintieron, tenia que haber cruce en favor de FC... tal como ocurrió.

(a ver si tengo tiempo de probar estas hipótesis)

Expertos y supuestos equivocados
De manera más general hay que aclarar otras cosas. Muchos expertos han analizado el flujo de datos del PREP y el CDA como si ambos fueran producto de procesos 1) aleatorios, 2) independientes o 3) muestrales. Los tres supuestos son falsos.

NO ALEATORIEDAD. Es obvio que el flujo de datos depende de factores no aleatorios como el huso horario de los estados y la urbanizacion de los distritos y casillas. Además, la capacidad de escrutinio, cómputo y llenado de actas de los funcionarios de casilla tampoco está distribuida aleatoriamente en nuestro país--por las mismas tristes razones que la escolaridad tampoco es uniforme a lo largo del país. Otras cosas si son mas o menos aleatorias: la tasa de participación, si la casilla abrió y cerró a tiempo, si había cola a las 6pm, o si llovía esa noche.

DEPENDENCIA. No se deben analizar los votos o porcentajes de un candidato de manera independiente al de otros. Existen muy claros sesgos partidistas y de participacion que varían entre regiones, estados y distritos. Esto es evidente cuando se comparan los histogramas de frecuencias de FC y AMLO: cuando el voto de un candidato es más disperso el del otro es más concentrado. Por ejemplo, en algunos estados el voto priísta afectó más al PRD que al PAN y viceversa. Incluso el voto por partidos chicos como NA y ASDC a veces afectó o benefició a PAN y PRD.

NO MUESTRAL. Algunos expertos insisten en que debió haber habido múltiples cruces en el PREP y en el CDA, dada la aleatoriedad del proceso. Pero aún en una eleccion reñida como esta, si las condiciones inciales del flujo de datos favorecían suficientemente a un candidato no tiene por qué haber cruces o bien, dado el caso, sólo un cruce (es decir, más que random walks, hubo path dependence en el flujo de datos). Como explique más arriba es posible que el PREP haya comenzado con tal ventaja para Calderón que esta solo se redujera sin revertirse; por otro lado el CDA favoreció inicialmente a AMLO... hasta que hubo uno y sólo un cruce.

Finalmente, poco se ha dicho del conteo rápido--instrumento muestral que, a diferencia del PREP, en efecto estaba diseñado para pronosticar el resultado. El conteo rápido SI fue una muestra aleatoria y representativa de las casillas y, en efecto, mostró muchos cruces conforme las casillas reportaban sus datos--tal y como era obvio esperar.

El conteo rápido hubiera podido detectar un "vencedor probable" el mismo domingo si el margen de diferencia era mayor a 0.6%. Pero los ciudadanos decidieron dar una ventaja ligeramente menor: 0.58%... que dejó mudo al conteo. De nuevo, algunos verán en este hecho una prueba más de la maquinación fraudulenta. Yo lo que veo es una elección apretadísima como las que ocurren de vez en vez a lo largo del planeta.

Tuesday, July 11, 2006

Sólo EL sabe sumar

Federico Reyes Heroles, en Reforma (11/jul/06), lo dice mejor que muchos:

PERDER GANANDO

¿Cuál es el límite? La alianza por el Bien de Todos está en su derecho de impugnar las supuestas irregularidades habidas en la elección. Auténticamente es por el bien de todos: sólo desnudando anomalías y posibles delitos electorales es como podremos arrinconarlas. Todo sistema electoral se perfecciona por actos de tracto sucesivo. En el 88 las actas no quedaban en manos de los partidos. En el 91 los partidos carecían de representantes en un buen número de las casillas. Las zonas alejadas tuvieron que ser cubiertas por un auténtico ejército de observadores. La fiscalía especial es otro paso. Denunciar irregularidades y anomalías es obligado e imprescindible para el avance democrático. Allí no hay discusión. Pero se plantea algo distinto.

¿Cuál es el límite, dónde está la frontera que divide lo que es un acto jurídico responsable de una treta política para desorientar a la opinión pública? ¿De verdad creen que hubo irregularidades intencionales en 50 mil de las 130 mil casillas? De verdad creen que el PREP, el conteo y el cómputo distrital -cuyos resultados coinciden al dedillo- fueron manipulados? Piensan entonces que hubo un silencioso golpe de Estado en el IFE que involucró a cientos de servidores públicos, incluidos científicos de gran renombre, golpe de Estado del cual nadie se dio cuenta, por cierto, ni ellos. Una operación central de ese tipo involucraría a decenas de miles de ciudadanos. Allí el asunto no cuadra. ¿Ignorancia o perversidad? No todas las aventuras que parecen quijotescas terminan bien. Don Quijote leyó novelas de caballería, AMLO encuestas a destiempo.

Convertido en Presidente virtual durante dos años, se vio mucho tiempo en la silla presidencial. Los medios colaboraron a ello mes a mes: 10, 15, 20 puntos de ventaja. Pero, ¿quiénes eran los competidores reales, en qué situación? Faltaba mucho por definir. ¡Voy ganando! Soy indestructible, acabaré con las pensiones de ex presidentes, aumentaré el gasto social, construiré refinerías, trenes, carreteras, abajo los ricos, vivan los pobres, ¡viviré en Palacio!

Convencido por las remotas cifras, inició su marcha a la Presidencia desde el corazón del país que ya gobernaba. Pero había un pequeño problema: las verdaderas campañas comenzaron en enero y, por supuesto, las tendencias se movieron. No iba solo. Ésa realidad ya no gustó: "cuchareadas", "manipuladas". Amañadas las contrarias, válidas las favorables, una grave y delatadora negación de la realidad. Las cifras mostraron una competencia reñida, por eso AMLO estuvo arriba en varias ocasiones y no protestó. También estuvo abajo y fingió demencia. Fue entonces cuando habló de esas encuestas fantasmales que le daban 10 puntos de ventaja. ¿Existían, les creía? Embebido en sus lecturas nocturnas, el caballero cabalgaba hacia la Presidencia. Nada lo detendría.

Llegó el día de la verdad: casi 1 millón de representantes de partidos, más de 900 mil ciudadanos involucrados en las casillas, todos testigos de primera mano; mil 800 consejeros distritales; 24 mil observadores nacionales y, por si fuera poco, casi 42 millones de votantes que saben por quién votaron: 65 de cada 100 no lo hicieron por él. En el camino AMLO arroja lodo a los consejeros electorales del IFE, al padrón electoral, al PREP, al conteo rápido, al cómputo distrital. ¡Todo es una porquería! Los 236 mil votos a favor de Calderón no valen. Nada de que un voto es un voto. Los más de 27 millones que votaron en su contra tampoco, él es el elegido, tiene que serlo. Quien no lo sepa vive en el error. Síganme los valientes ¡Vamos contra todo y todos! ¡Fraude, fraude, fraude!

Es la mejor elección histórica del PRD, hoy es segunda fuerza en el Legislativo. Una vez más, muy holgadamente, se lleva la capital y más de 14 millones de votos para la Presidencia. Pero el caballero andante declara fraude generalizado, llama "traidor" a Fox y "pelele" a Calderón y, en pocas palabras, se regresa a la política cerril que cuestiona al marco institucional. Como la realidad no me gusta, abro lanzas contra todos. De los costos para el PRD mejor ni hablamos: pueden perder habiendo ganado.

Es hora de definiciones. Esperemos y que el tribunal haga su trabajo. Si AMLO gana, todos a defenderlo. Pero como dice el dicho, no se puede mamar y dar de topes: o el PRD se define como una oposición leal o regresaremos a la duda válida sobre su lealtad institucional que tan malos resultados les dio en las urnas. ¡Ha sido un gran triunfo del PRD! ¿Qué va primero: las imaginerías o las instituciones que el PRD ayudó a construir durante décadas? Si no se corrige el rumbo y se convoca a la descalificación a priori, sin pruebas, de las instituciones estaremos ante uno de los más grandes retrocesos de la vida política del país. Los auténticos demócratas no pretenden subvertir las instituciones, no mienten a sabiendas del daño general que causan.

Ahora resulta que no vale el sufragio de decenas de millones de mexicanos; tampoco las actas firmadas por decenas de miles de ciudadanos; ni los números a los que arribaron miles, ni los ojos vigilantes de otros tantos. "Respeten nuestros resultados" fue la consigna de AMLO el 2 de julio. Sólo él conoce la verdad. Sólo él sabe lo que es justicia. Sólo él accede a los deseos de los mexicanos. Sólo él se preocupa por los pobres. Sólo él puede ser el próximo Presidente. Sólo él es demócrata. Sólo él es honesto y, finalmente, sólo él sabe sumar.

Friday, July 07, 2006

Elecciones competidas

La elección presidencial de 2006 tuvo un margen de 0.58% equivalente a 243,934 votos. 
 
El marco institucional y la cultura política (whatever that means) de algunos países aguanta pequeños márgenes de victoria sin mucho aspaviento. 
 
En la elección presidencial de 2000 en los Estados Unidos el margen en el voto popular fue de 0.51% equivalente a 543,816 votos--a favor de Al Gore.  Pero el margen de Florida, estado decisivo para el colegio electoral que favoreció a Bush, fue aún menor: 537 votos, es decir 0.01%.
En algunos países márgenes tan pequeños producen un recuento de manera automática.  Ahora bien, aún cuando no haya prácticas fraudulentas, los recuentos a menudo cambian las cifras definitivas porque revelan gran cantidad de "errores humanos" al contar, validar o anular ciertos votos.  El error humano al contar papeletas es tan común que por ello muchos países han optado por métodos más precisos como tarjetas perforadas o, más recientemente, votos electrónicos.
 
Si el error humano al contar papeletas es aleatorio, el resultado de un recuento no cambiara el resultado final.  Pero si existe un mínimo sesgo en el error de conteo en favor de cualquier candidato, no es difícil revertir el resultado final. 
 
Preguntas incómodas:
¿Quién tiene más probabilidades de contar mal los votos, un jefe de casilla del sur o del norte, urbano o rural? 
¿Quién tiene más probabilidades de haber intentado inflar los votos de su candidato, el PRD, el PAN, o el PRI?
 

Tuesday, July 04, 2006

Conteo rapido IFE

Esta es una de las estimaciones del conteo rápido del IFE--mismo que no se difundió el domingo en la noche. Las líneas sólidas son las estimaciones de FC y AMLO, y las líneas puntueadas son el intervalo de confianza al 95%. Cuando la muestra era pequeña, los intervalos se traslapan y no sabemos quién va arriba. Sin embargo, la tendencia en favor de Calderón era clara desde alrededor de las 9pm: noten como los intervalos de confianza se despegan y estabilizan a partir de esa hora.


El comité técnico del IFE hizo tres estimaciones distintas para su conteo rápido. Como había un traslape en los intervalos de confianza en dos de tres estimaciones, el consejo prefirió no declarar un ganador más probable.

Tal postura fue conservadora y me parece lo más recomendable en una elección cerrada como esta. Hoy el PRD dice que este silencio fue cómplice de un fraude cibérnetico y que el PREP estaba amañado. Sobra decir que es virtualmente imposible amañar un método muestral como el conteo rápido a la par de un método censal como el PREP y hacer que ambos lleguen al un resultado tan similar. Si hacemos una lectura integral del PREP, del conteo rápido del IFE así como las encuestas de salida de otras casas encuestadoras creo que la evidencia es clara en favor de Calderón--AMLO perdió por otras razones.

Una explicación más amplia del conteo rápido del IFE está disponible en:

http://pac.ife.org.mx/download/08/pac_down_informe_Comite-ConteoRapido.pdf