Las elecciones federales en México en 2012, y en particular la presidencial, derivaron en un intenso, pero disperso, debate respecto del papel que desempeñan las encuestas en los procesos electorales y sobre su regulación. Por ello, recuperar el marco regulatorio y la narrativa de las encuestas publicadas no cumple sólo una función de arqueología, en el sentido de Foucault, sino que abre la posibilidad de una revisión a la crítica expresada, con miras a establecer alcances y limitaciones de estos ejercicios. En este ensayo, se intentará determinar si existe evidencia de sesgos sistemáticos, si este fenómeno es inusual, si es viable y sencillo evitarlo, y si puede considerarse como producto de una intencionalidad de los investigadores.
Mexico's federal elections in 2012, and in particular the presidential, resulted in an intense, but dispersed, debate over the role of polls in electoral processes and their regulation. Therefore retrieve the regulatory framework and the narrative of the published polls do not act only as a function of archeology in Foucault's sense, but it opens the possibility of a revision to the criticism expressed, in order to establish scope and limitations of these exercises. This essay will attempt to see if there is evidence of systematic biases, whether this phenomenon is unusual, if feasible avoid it simple and can be considered as the product of an intention of the researchers.
2012 será recordado como el año en que las encuestas desempeñaron, por vez primera, un papel protagónico en unas elecciones presidenciales en México, dada la cantidad de estimaciones que fueron difundidas y su condición de referente casi universal para discutir sobre el estado de la competencia e incluso sobre su resultado.
Un análisis de las encuestas durante este proceso debiera observar al menos tres momentos distintos: el establecimiento de las normas para la publicación de encuestas; el período de difusión de encuestas, durante las campañas y en la jornada electoral, y el período del debate sobre los resultados de las elecciones y de las propias encuestas.
Ello debe tener como orientación responder a una pregunta central en el debate y para el conocimiento del campo demoscópico: ¿cuáles son los alcances y limitaciones de los ejercicios de medición a través de encuestas por muestreo y qué papel desempeñan en los procesos electorales en general y, en específico, en el caso mexicano? La respuesta a la que se llega a partir del recuento histórico es que, si bien existe evidencia de un sesgo sistemático, no se sustenta por ello que este fenómeno sea inusual, que evitarlo sea sencillo ni mucho menos que sea producto de una intencionalidad de los investigadores.
El marco regulatorio1Para reflexionar sobre si y cómo regular las encuestas electorales, debe tenerse en cuenta que “tanto la medición como las diversas técnicas cuantitativas (…) sirven para que se manifiesten las anomalías serias e indicarle a los científicos cuándo y dónde buscar un nuevo fenómeno. La medición no indica cuál es ese nuevo fenómeno sino que únicamente se aparta de los resultados esperados de la teoría”.2
Luego de la disputa respecto del resultado de la elección presidencial de 2006 y del cuestionamiento respecto de la eficacia de las normas electorales vigentes en ese momento, para 2007 se hace necesaria, según el parecer de los actores políticos, una nueva reforma en la materia. En el terreno de las encuestas, lo anterior llevó a cambios significativos, aunque su regulación, en el Código Federal de Instituciones y Procedimientos Electorales, se mantuvo en el capítulo destinado a las campañas electorales, donde se ubica, desde hace prácticamente dos décadas, la redacción del artículo 237 que reglamenta las encuestas. En su fracción 6, se dispusó la reducción (de ocho a tres días previos a la elección) del período de prohibición a la publicación o difusión de encuestas; en la fracción 7, explicitó que los criterios generales de carácter científico que emita en su oportunidad el Consejo General del Instituto Federal Electoral (IFE) deberían definirse, previa consulta, con los profesionales del ramo o con las organizaciones en que se agrupen, regulando así lo que venía siendo una práctica desde años antes. Además, mantiene la disposición de que quien solicite u ordene la publicación de cualquier encuesta o sondeo de opinión sobre asuntos electorales, que se realizara desde el inicio de las campañas hasta el cierre oficial de las casillas el día de la elección, debería entregar copia del estudio completo al Secretario Ejecutivo del Instituto Federal Electoral (IFE), si la encuesta o sondeo se difundía por cualquier medio.3
Con esta nueva legislación se arriba a la elección presidencial de 2012. Para reglamentar las encuestas en este proceso —previa consulta con las agrupaciones gremiales—, el Consejo General del IFE expide el 14 de diciembre de 2011 el acuerdo CG411/2011, por el que se establecen los lineamientos, así como los criterios generales de carácter científico que deberán observar las personas físicas y morales que pretendan ordenar, realizar y/o publicar encuestas por muestreo, encuestas de salida y/o conteos rápidos durante el proceso electoral 2011-2012.4
Luego del reciente proceso electoral, resurgió la confrontación entre, por un lado, la visión liberal —hoy predominante en la mayoría de las democracias—, que asume que las encuestas han de estar presentes sin restricciones como medio para que los electores puedan informarse sobre qué piensan los demás (esto les ayudará a tomar decisiones sobre el sentido de su voto) y, por otro lado, la visión que apela a una mayor regulación y restricción al advertir un efecto perverso en el elector, derivado de la difusión indiscriminada de encuestas.5 Esta perspectiva restrictiva apela a establecer una mayor regulación, incluso a la prohibición, como fórmula para supuestamente proteger al elector de la manipulación, esencialmente mediática, de sus preferencias. La regulación tendría como objetivo impedir que estos ejercicios, escasamente confiables desde esta opinión, atiborren el espacio informativo con datos que confundan al ciudadano y le hagan creer que las contiendas están decididas de antemano.
Sin embargo, se carece de evidencia sólida que sustente los juicios que apoyan esta visión restrictiva: una eventual prohibición de publicar encuestas durante las campañas electorales sólo redundaría en una menor calidad de nuestra democracia, pues afectaría el derecho de los electores a acceder a información relevante para su toma de decisiones, información a la que sí tendrían acceso las élites que puedan ordenar y pagar estudios para su consumo privado. En el caso de la regulación, por más exhaustiva que se pretenda, la evidencia muestra que no garantiza mayor precisión ni mucho menos evita yerros; en todo caso, puede servir para imponer “barreras de entrada” que restrinjan la participación diversa en la actividad.
La persistencia de un enfoque liberal cobra mayor importancia si se considera que nuestro sistema electoral, multipartidario, ha mostrado una elevada volatilidad, en que las encuestas desempeñan un papel clave como orientadoras del público general, ayudándole a construir su realidad política al dotarlo de un contexto para entender lo que ocurre. ¿De dónde, si no de las encuestas, los electores sacarían información sobre quienes disputarán finalmente la presidencia (o las gubernaturas y alcaldías, en su caso)? No de los datos electorales previos, ya que se dan giros de entre quince y veinte puntos en cada ocasión. La única fuente cierta de lo que ocurre han sido los estudios demoscópicos, que dan cuenta correcta del sentido de los cambios que se suscitan, al reportar con anticipación a los comicios buena parte de la volatilidad que luego se constatará, aun cuando tiendan a diferir en la magnitud precisa (de dicha volatilidad).
Por lo anterior, resulta poco recomendable adoptar una legislación que fije los datos mínimos requeridos para la publicación de una encuesta, como pretende una iniciativa presentada en el Senado de la República,6 debido a que el dinamismo mostrado por el mecanismo de regulación vía acuerdos expedidos por la instancia administrativa electoral, hoy nacional, permite suponer que resulta preferible mantener la flexibilidad vigente. Desde esta lógica, hay que reconocer la pertinencia de realizar cambios a los criterios que se establezcan en cada oportunidad, sin la rigidez que impondría una definición en la ley secundaria. De hecho, luego del debate, se añadió un requerimiento eficiente para eludir la simulación y divulgación sin autorización de datos de encuestas: la entrega de copia de las facturas expedidas para pagar los estudios que corroboren responsables y monto del patrocinio.7
2. Las encuestas presidenciales en 2012En total, fueron 320 los estudios por encuesta registrados ante la autoridad administrativa federal durante el proceso electoral 2011-2012.8 Si se compara con procesos anteriores en el país, es indudable que ello representó un aumento significativo en la cantidad de encuestas de las que dispuso el público, puesto que seis años antes se registraron ante la autoridad administrativa únicamente 131 estudios. Tan sólo para la elección presidencial, el número de estudios difundidos alcanzó una cifra cercana a los doscientos. Este hecho propició una polémica sobre si fue adecuada o excesiva la cantidad de encuestas publicadas en 2012. Al respecto, si se compara la cantidad de estudios publicados en México con lo difundido en Estados Unidos este mismo año, no sería un exceso. Allá, durante las últimas tres semanas de campaña, se publicaron más de 540 encuestas nacionales distintas,9 doce veces más que en México, donde fueron apenas 45 publicaciones originales con datos de alcance nacional. El incremento del número de estudios registrados ante el IFE fue producto de diversos fenómenos, como el aumento en la proporción de encuestas reportadas a la autoridad respecto de las realizadas y, lo más relevante: la mayor cantidad no significó mayor diversidad de proveedores de información, dado que el volumen de casas encuestadoras que han difundido estimaciones en cada proceso electoral federal se ha mantenido relativamente constante. Lo que ha variado es la frecuencia en que algunas encuestadoras realizan mediciones. En 2012, por vez primera, se contó con dos series de mediciones semanales y se difundió un ejercicio pionero de seguimiento diario de carácter público, que por sí sólo tuvo cerca de un centenar de estimaciones, alrededor de la mitad del total reportado. Esta serie diaria, junto con las semanales, generó tantas estimaciones diferentes como lo publicado seis años antes.
Durante el primer semestre de 2012 y hasta el día de la elección, el IFE, por medio de su Secretaría Ejecutiva, dio seguimiento al cumplimiento del acuerdo en informes mensuales al Consejo General.10 Conforme éstos, la inmensa mayoría de los estudios nacionales publicados durante el proceso electoral 2011-2012 adoptó los criterios emitidos por la autoridad. Conforme al recuento oficial, de los estudios publicados y reportados sobre la elección presidencial, 87% adoptó los criterios aprobados por el IFE. Asimismo, cabe declarar que no existió un problema de opacidad en el financiamiento de las encuestas electorales.11
Igualmente, las encuestas difundidas sobre la elección presidencial detectaron correctamente cierres de brechas y relevos en el orden de los contendientes y, en mayor o menor medida, todas las series nacionales tendieron a mostrar un movimiento similar y simultáneo en las preferencias. Se tiene así una historia coherente y consistente de la elección presidencial 2012 contada por las encuestas, si bien con incertidumbre respecto del margen real de distancia entre el primer lugar y los dos contendientes que disputan el segundo sitio durante una importante etapa del proceso.
Una primera lectura de los resultados de las encuestas preelectorales durante 2012 muestra un balance favorable: por vez primera la totalidad de los estudios acertaron al detectar como líder de la contienda al candidato que resultó ganador. En 2000 y 2006, menos de la mitad de las encuestas publicadas en fecha próxima a la elección estimaba un ordenamiento entre los contendientes conforme al resultado.12 Empero, en promedio, las encuestas presentaban un sesgo hacia la sobreestimación del ganador, en detrimento de sus oponentes. Si lo que se observa es la diferencia en la distancia medida por las encuestas entre los dos primeros lugares, la brecha en 2012 fue de doce puntos; entre las encuestas que midieron la menor distancia, de ocho puntos efectivos, y entre las que midieron más, veinte puntos. Esta divergencia fue menor a la registrada en 2000, cuando la brecha iba de diez puntos de ventaja para quien resultó ganador a cinco puntos de desventaja (quince puntos), aunque mayor que la observada en 2006, cuando hubo mediciones que daban cuatro puntos de ventaja para quien ganaría, y hasta cinco puntos de desventaja en el extremo opuesto (nuevo puntos de punta a punta). Estadísticamente, estas variaciones en la magnitud de las distancias entre encuestas no son significativas, dado el escaso número de observaciones disponibles en cada ocasión.
No es la primera vez que se presenta un error sistemático en las encuestas previas a una elección presidencial en México. De hecho, la magnitud del equívoco en la estimación de la distancia entre los dos primeros lugares es prácticamente de igual magnitud al observado en 2000, pero con la diferencia de que en aquella ocasión se subestimó al ganador y en 2012 el sesgo fue el inverso. En 2006 también hubo divergencias que derivaron en diferentes ordenamientos, lo que generó incertidumbre sobre quién era el líder en el cierre de campañas.
En estadística, precisión y exactitud no son conceptos equivalentes,13 aunque estén relacionados. La precisión es una medida de la dispersión del conjunto de valores obtenibles en repetidas mediciones de una magnitud determinada: a menor dispersión, mayor precisión. Luego, refiere a la magnitud escalar con la que se mide la proximidad de los resultados de una muestra para reproducir los resultados que se obtendrían de un recuento completo llevado a cabo con las mismas técnicas. La exactitud es una medida de la proximidad entre los valores medidos y los reales (aquellos resultantes si se hubiera realizado un censo con los mismos procedimientos que la encuesta). Cuando la diferencia es distinta de cero, mide el sesgo de una estimación: a menor sesgo, mayor exactitud. Luego, refiere a la magnitud escalar con la que se mide la proximidad del estimador producto de una muestra respecto del parámetro objetivo. Para medir la exactitud de las encuestas electorales respecto de los resultados, suele usarse como escala la diferencia entre las proporciones arrojadas por un estudio y las proporciones oficialmente computadas en una elección. Ello supone tomar como parámetro los resultados y calcular el error absoluto, como se hace entre cualquier medición y un valor considerado como el verdadero. En particular, para sistemas multipartidarios, se emplea la desviación media en puntos porcentuales entre lo previsto y lo oficial para todos los contendientes, sin tener en cuenta el signo, asignando los indefinidos según las proporciones para los definidos, con el fin de evitar un incremento artificial del error y dar un tratamiento homogéneo a los datos. Este cálculo corresponde a uno de los diversos métodos para calcular el error de las encuestas, analizados en el estudio clásico sobre el tema.14 Cabe mencionar que “algunos científicos creen que los valores verdaderos no existen separados del proceso de medida a utilizar”;15 de asumirse tal lógica, el estimador pertinente del verdadero parámetro poblacional sería el promedio de los estimadores centrales de las repetidas mediciones que se realicen. Luego, la exactitud de una estimación particular debiera calcularse por la diferencia contra la media del conjunto de estimaciones disponibles.16 No obstante, esta lógica implica reducir las propiedades que se demanda de una medición a su fiabilidad, o al grado de consistencia y estabilidad de las puntuaciones obtenidas a lo largo de sucesivos procesos de medición con un mismo instrumento. Al asumirse como “verdadero” el valor medio de las estimaciones, se descarta la posible existencia de errores sistemáticos que afecten al conjunto de estimaciones realizadas, lo que supone una petición de principio que, si bien es sustentable desde un punto de vista estrictamente estadístico, evade el asunto clave de la validez de los ejercicios: la determinación de la capacidad del instrumento de medición para cuantificar de manera significativa y adecuada el rasgo para cuya medición fue diseñado, mediante su contrastación con evidencias empíricas externas al propio acto de medición.
La existencia de divergencias entre magnitudes y percepciones del error en las encuestas electorales no es reciente ni algo privativo de México. El ejemplo clásico de este desencuentro es la elección presidencial de los Estados Unidos en 1948. Después de dicha experiencia, el estadístico Samuel S. Wilks apuntó que “el fracaso de las encuestas de opinión para predecir correctamente el resultado de las elecciones presidenciales (…) creó amplia confusión y recelo acerca de la fiabilidad de las encuestas. La reacción del público osciló entre acusaciones de fraude absoluto a expresiones de simpatía personal hacia los encuestadores. Las reacciones de los expertos oscilaron entre la condena por negligencia, parcialidad involuntaria, errores de juicio y uso de técnicas anticuadas, a la determinación de aprovechar esta experiencia para ampliar nuestro conocimiento del comportamiento político y mejorar la metodología de las encuestas”.17 La revisión realizada por Frederick Mosteller le lleva a afirmar, sin embargo, que “en la elección presidencial de 1948, esencialmente por el mismo tipo y magnitud de errores que ocurrieron en el pasado, las encuestas han sido irracionalmente criticadas por predecir incorrectamente el resultado de la elección”.18
El error medio de las encuestas finales en la elección de 2012 fue similar al observado en otras ocasiones durante este siglo, pues se ubicó en 2.6 puntos, el mismo valor al registrado en 2000 y apenas superior a los 2.3 puntos observados en 2006. Estos niveles de inexactitud son significativamente menores que los registrados en elecciones presidenciales a fines del siglo pasado, pues en 1994 el error promedio de las encuestas finales alcanzó casi los cuatro puntos porcentuales.19 Es menester aclarar que estos cálculos corresponden al error promedio de las encuestas, que difiere del cálculo del error del promedio de las encuestas, donde sobreestimaciones de unos ejercicios y subestimaciones de otros para un mismo candidato se compensan al menos parcialmente entre sí. El error del promedio de encuestas en las últimas tres elecciones presidenciales ha ido en ascenso, aunque no de manera significativa: desde 1.9 puntos registrados en 2000 a 2.2 puntos registrados en la más reciente ocasión.
Ahora bien, la exactitud relativa de las encuestas orientadas a la medición de preferencias respecto del resultado de las elecciones presidenciales recientes en México obliga a preguntarse si este nivel es reducido, adecuado o excesivo. Esto es: al margen de ser o no ser formalmente un pronóstico (que no lo son), ¿han cumplido o no las encuestas previas a elecciones con un objetivo de “anticipación” del resultado de los comicios?
Aunque se disponga de estimaciones homogéneas y normalizadas para detectar el error de las encuestas respecto del resultado, sería impropio asumir estas estimaciones como pertinentes para un cotejo directo entre elecciones de distinto tipo, por diferentes cargos, y menos aún entre distintas naciones; ello, dadas las características particulares que presenta la competencia electoral en cada nivel, tipo, nación o estado. Estas diferentes condiciones de competencia pudieran estimarse mediante el empleo de indicadores agregados y la determinación de la capacidad de las encuestas para detectar los cambios en las preferencias del electorado. Lo anterior resulta más relevante en un caso como el mexicano, en el que se presentan muy elevados niveles de volatilidad, que durante el presente siglo han alcanzado una media próxima a los 18 puntos, más de cinco veces superior de lo que se registra en Estados Unidos. El propio Mosteller realiza este ejercicio respecto de las estimaciones por encuestas para las elecciones presidenciales de Estados Unidos durante la primera mitad del siglo pasado y concluye que las encuestas no fueron mucho mejor estimador que la previsión a partir de los resultados electorales anteriores.20
Sería luego adecuado estimar la proporción del cambio en el voto que prevén las mediciones por encuesta publicadas antes de unas elecciones versus el cambio en el sentido del voto registrado conforme los resultados oficiales. Ello supondría retomar el estimador de volatilidad propuesto por Pedersen,21 que calcula el saldo de las ganancias y pérdidas acumuladas entre todos los contendientes, y compararlo con la volatilidad promedio implícita en las estimaciones por encuesta. Al realizar este ejercicio en las últimas tres elecciones presidenciales en México, se observa que las encuestas han detectado en promedio 70% de la volatilidad efectivamente registrada, proporción superior a la registrada en Estados Unidos durante el mismo periodo.22
De acuerdo con la narrativa producida por las encuestas sobre la elección presidencial, entendidas en conjunto, desde el inicio de campañas, e incluso desde mucho antes, se situó como líder quien resultara ganador, pero con una distancia mayor a la que se observara finalmente. El cierre de la brecha con quien terminaría en un cercano segundo lugar se dio en mayo, paralelamente a los eventos que derivarían en una movilización estudiantil. Hacia finales de ese mes, la detección de una menor distancia para el líder y el desplazamiento al tercer lugar de la candidatura del partido gobernante, lleva a un viraje en las estrategias de campaña, que logra detener el avance del único contendiente con tendencia al crecimiento y capacidad competitiva, quien a pesar de ello logra evitar una victoria contundente de quien resultó finalmente ganador. Lo anterior es lo que reflejaron las encuestas: si conforme a los reportes oficiales en abril de 2012 la distancia media medida por éstas entre quien resultaría ganador y quien sería segundo lugar fue de 28 puntos, esta distancia se redujo a 21 puntos en mayo. A mediados de ese mes, las encuestas comenzaron a coincidir en un relevo en el segundo lugar, y registraron a partir de entonces un orden que correspondería al definitivo. La brecha entre los punteros se cierra en las mediciones de junio a una media de 16 puntos, y en las encuestas finales el promedio se ubicó en torno a los catorce puntos.
Luego de que la totalidad de mediciones había establecido una distancia entre los primeros lugares de dos dígitos, hacia fines de mayo y principios de junio se difunden encuestas que miden una brecha menor a diez puntos entre los dos primeros lugares, lo que en parte quebró la certidumbre del electorado respecto de la diferencia prevaleciente. Cuando se mira el cambio en estrategias de los equipos de campaña ocurrido en esos momentos, se constata que “las encuestas electorales sí influyen en la toma de decisiones de los estrategas de los partidos políticos”, por lo que si bien “las restricciones a la publicación de encuestas no se justifican por el efecto que causan en el electorado y sí afectan su derecho a la información”, se puede advertir que “el efecto de las encuestas sobre los estrategas seguirá existiendo y la no publicación sólo consigue que sean unos cuantos privilegiados los que puedan tener acceso a la información”.23 A lo anterior, pudiera agregarse el impacto potencial, de difícil medición, que tienen las encuestas en el ánimo de los equipos de campaña, en el clima de opinión de las élites altamente informadas y en los patrones de respaldo y financiamiento a los contendientes.
El análisis de la información aportada por las encuestas durante esta elección presidencial permite asimismo rebasar el análisis agregado de los resultados y observar las diferencias entre éstas. Al hacerlo, se detectan divergencias entre las distintas series de mediciones, con brechas mayores al principio que al final de las campañas, por lo que se da, al menos parcialmente, la esperable confluencia entre estimaciones que suele reflejarse al final de un proceso electoral. Si se estima la desviación estándar de las estimaciones por candidato disponibles en cortes diarios en las diez series nacionales con observaciones desde antes del arranque de las campañas y hasta el cierre, se registrarían desviaciones estándar promedio de las proporciones para Josefina Vázquez Mota de 2.2 en abril, 1.9 en mayo y 1.3 en junio; para Enrique Peña Nieto de 3.9 en abril, 3.5 en mayo y 2.4 en junio, y para Andrés Manuel López Obrador de 2.8 en abril, 2.5 en mayo y 2.0 en junio. Así, la media de las desviaciones estándar por candidato habría sido de 2.9 en abril, 2.6 en mayo y 1.9 en junio.
La pluralidad de fuentes de información por encuesta deriva así, como ocurre en prácticamente cualquier democracia, en la disposición de resultados distintos, incluso cuando el momento de medición sea coincidente, producto de diferencias en diseños de muestra, métodos de selección de entrevistados, instrumentos de recuperación, controles de calidad y análisis de datos, entre otras razones. Los ejercicios de lectura a partir de promedios hacen tabla rasa de estas diferencias, y muestran constancias artificiosas al asumir que todas las encuestas son mediciones agregables, pues buscan determinar el mismo parámetro.24
A pesar de los claros avances en la regulación de las encuestas y del éxito en la detección del orden de los contendientes, al final la mayoría de las mediciones detectan, entre los principales contendientes, una distancia mayor de la que oficialmente se registró. Acorde con los especialistas, en su sentencia al juicio de inconformidad presentado por el Movimiento Progresista, el TRIFE advierte que “medir el margen de error de una encuesta a partir de las brechas entre el primero y segundo lugares es inusual y metodológicamente impreciso. Los estimadores sobre los que se calculan los márgenes de error estadístico se aplican para las preferencias electorales de cada candidato, no así para la diferencia entre estos de acuerdo con el resultado de la elección”.25 En un caso como el mexicano, una reducción de esta naturaleza impacta en mayor medida las estimaciones, ya que se trata de un sistema multipartidario.
3. La argumentación críticaDespués de las elecciones presidenciales de 2012, el debate sobre las diferencias percibidas entre encuestas y resultados se convirtió en una discusión polarizada que no alcanzó a arribar a explicaciones comunes para los diversos interesados.
Se argumentó que la mayoría de las encuestas se equivocó por un amplio margen, lo que afectó no sólo la credibilidad en los estudios, sino la equidad de la elección. El supuesto impacto negativo de la diferencia entre las estimaciones por encuesta respecto de los resultados de la elección presidencial no se ha respaldado con evidencia empírica. De hecho, los datos disponibles muestran que la credibilidad de los ciudadanos hacia las encuestas luego de la experiencia electoral de 2012 no ha variado de manera significativa.26 Sin embargo, si la (in)exactitud de las encuestas previas a la elección presidencial de 2012 en México fue similar a la observada en las ocasiones anteriores, y el sesgo observado no puede considerarse un evento peculiar, ¿por qué el juicio negativo sobre las encuestas en la elección presidencial de 2012?
Lo anterior tiene explicaciones plausibles, pero diferenciadas según el actor del que se trate. Uno es el caso de los actores políticos supuestamente afectados por el equívoco: en 2012 el sesgo registrado por las encuestas preelectorales fue contra un candidato que no pudo alcanzar al líder.27 A diferencia, en las dos ocasiones anteriores se subestimó a quienes resultarían finalmente ganadores. ¿Para qué habrían cuestionado las encuestas luego de la elección, si finalmente obtuvieron la victoria?
El hecho de que la subestimación haya afectado a quien quedó en segundo lugar propicia una reclamación pública hacia los estudios, pues “desea tiempos extra y alargar los segundos, más cuando existe una fuerte voluntad de poder”, por lo que “continuará su lucha fuera de los tiempos, instituciones y límites legales”, usando toda arma posible, y las encuestas serán “parte de su arsenal”.28 El tema es asunto sujeto a debate en una sesión ordinaria del Consejo General del IFE posterior a los comicios,29 en la que —ante cuestionamientos a las encuestas por parte de representantes partidarios—, el Consejero Presidente del IFE, Leonardo Valdés, expresó su confianza en que los ciudadanos mexicanos no se dejan influir mayormente por las encuestas electorales que se publican en los medios de comunicación, y el Consejero Benito Nacif manifestó su convicción de que las encuestas no son instrumentos que permitan anticipar el resultado de una elección, menos aún cuando existen restricciones para publicar los tres días previos a la elección. En contraparte, el Consejero Lorenzo Córdova apuntó que las encuestas se han convertido recientemente en objeto de debate y eventualmente en fuente de incertidumbre, cuando eran un elemento que inyectaba certeza a los procesos electorales, mientras que el Consejero Alfredo Figueroa propuso establecer criterios de auditoría para el levantamiento de encuestas.
Este diferendo derivó en su inclusión como uno de los elementos en la inconformidad presentada ante la autoridad jurisdiccional por el contendiente que quedó en segundo lugar. A dicho recurso legal correspondió un exhaustivo análisis legal y una resolución contundente del Tribunal Electoral del Poder Judicial de la Federación (TRIFE):30 para la autoridad jurisdiccional, aun si “el resultado de las encuestas generó un efecto de apoyo al ganador (…) ello, por sí mismo, no es una situación que actualice una irregularidad, si las encuestas cumplieron con los criterios exigidos por la autoridad y su difusión respetó los límites impuestos a la libertad de expresión”.31
Pero el debate de las encuestas en 2012 no se cierra en el alegato jurídico, ni los únicos críticos son los contendientes. De hecho, inmediatamente después de conocerse el resultado de la elección presidencial, se alzaron voces de comentaristas mediáticos y analistas políticos que señalaron lo equívoco del escenario perfilado por las encuestas.
La argumentación crítica, que parte de un hecho incontrovertible: la existencia de una diferencia entre las estimaciones por encuesta y los resultados de la elección presidencial, se transforma en lo que Taleb llama una falacia narrativa,32 donde “los acontecimiento recientes y el contexto actual tienen el máximo peso en el momento de optar por una interpretación”.33 Para ello, lo primero que se hace es afirmar que lo ocurrido es inusitado e incrementar artificiosamente la magnitud del error;34 luego, se desatiende todo intento de explicación emitida por los especialistas y, finalmente, se supone que el equívoco en el evento concreto es característico y afectará toda medición futura, a menos que algo se modifique radicalmente. Esta actitud tiene una etiología conocida: se trata de un fenómeno denominado sesgo cognitivo,35 que refiere a alteraciones en la mente humana difíciles de eliminar y que llevan a una distorsión de la percepción, a un juicio impreciso o a una interpretación ilógica. Se trata de un fenómeno psicológico principalmente involuntario que sesga el procesamiento de la información. Estos sesgos suelen ser complejos, pues se alimentan de distintas fuentes para generar las distorsiones: el sesgo por resultados, o tendencia a juzgar una decisión por su resultado final, en lugar de juzgarla por la calidad o acierto de la decisión cuando fue realizada; la tendencia al anclaje, que toma sólo una parte de la información disponible; la de arrastre, que lleva a creer algo porque otros lo hacen; la de encuadre, que interpreta según si la cuestión está enmarcada para concentrarse en las pérdidas o en las ganancias; la de confirmación, que favorece la información que apoya presupuestos o hipótesis propias, sin importar si es verdadera; la de autoservicio, que ignora pruebas o hechos en contra de la postura adoptada; la de último evento, que otorga más importancia a los eventos recientes que a los alejados; la de retrospección, que valora eventos pasados más positivamente que como lo fueron en su momento; la de disconformidad, que realiza un escrutinio de la información cuando contradice creencias propias, pero que acepta sin crítica la información congruente con ellas; la de punto ciego, o no darse cuenta de los propios prejuicios cognitivos, o verse a sí mismo como menos sesgado que los demás, entre otras. También recurre a falacias como la de inducción apresurada o del hecho aislado, que llegan a una generalización inducida basada en pocas evidencias; la de falsa vivencia, denominada también crítica destructiva, que usa la descripción de un acontecimiento, incluso si es un suceso excepcional y muy poco probable, a fin de convencer de que hay un problema, lo que es posible debido al sesgo cognitivo llamado disponibilidad heurística.
4. La argumentación vindicativaDel lado de los investigadores, las advertencias sobre la eventualidad de un sesgo en las mediciones se manifestaron públicamente aun antes de los comicios. Como ejemplo, en un encuentro celebrado en El Colegio de México el 27 de junio, último día en que podían publicarse encuestas antes de la elección, al menos dos de los responsables de encuestas públicas apuntaron la inadecuación entre el promedio de las encuestas previas con los resultados en las dos anteriores elecciones presidenciales, y uno de ellos advertía la clara presencia de dos grupos de estimaciones que diferían entre sí.36
En los días subsecuentes a la elección, encuestadores responsables de estudios publicados ocuparon diversos espacios mediáticos para analizar, discutir y responder críticas relacionadas con la (in)exactitud de las mediciones. Dejando de lado las mesas en medios electrónicos y los foros académicos, el recuento de publicaciones impresas permite constatar dos hechos: primero, el reconocimiento generalizado de la existencia de un sesgo que alejó estimaciones de resultados, fenómeno que no es inusual, no sólo en el caso mexicano, sino también en muy distintas democracias e incluso con mayor relevancia, puesto que no solamente se ha tratado de sesgos estadísticos, sino de equívocos en el orden de los contendientes, como ocurrió en México en 2000, lo que llevó a Felipe Noguera37 a afirmar que lo sucedido en México no hubiera sido sujeto de crítica en buena parte del mundo, pero que “los mexicanos están mal acostumbrados a tener muy buenas mediciones”;38 de hecho, Durand39 concluyó que “algo debe ser peculiar de un proceso electoral donde haya un fallo que difiera de lo característico en otros procesos, donde no se presenta un yerro”. Y segundo, la pronta detección de evidencias que permitieron caracterizar y explicar el sesgo registrado, a la vez que eliminar otras posibles fuentes de error. Lo anterior, sin embargo, no permite conclusiones categóricas sobre las causas de las diferencias registradas, puesto que ello será siempre materia de análisis, debate y revisión científica.
En principio, “el objeto de la discusión crítica de una teoría es intentar refutarla, o al menos poner en evidencia que no es capaz de resolver un determinado problema que pretende solucionar”.40 Por ende, “todo desvelamiento de un error constituye un avance real de nuestro conocimiento (…) la crítica parece ser la única forma de detectar nuestros errores y de aprender de ellos de forma sistemática (…) muchos resultados científicos tienen el carácter de hipótesis, es decir, de enunciados para los que la evidencia no es concluyente; y que por tanto son susceptibles de revisión en cualquier momento”.41
Un primer elemento evaluado es la posibilidad de un sesgo regular y constante hacia un partido determinado. Cuando se ve el error por partido en las encuestas para las elecciones presidenciales recientes, pareciera registrarse una sobreestimación regular del PRI en detrimento de otras opciones. Sin embargo, esta lectura no es necesariamente la única posible, pues bien puede encontrarse una proclividad a medir por encima al contendiente con tendencia descendente y por debajo a quien muestra una tendencia ascendente, lo que hablaría de un rezago en el ajuste de las estimaciones respecto de los resultados. Lo reducido de los casos que sirven de evidencia hace imposible, por lo pronto, resolver cuál es la lectura correcta de estos datos.42
Algunos encuestadores apuntaron hacia el muestreo como posible fuente de divergencias entre estimaciones y resultados. Unos se pronunciaron por el abandono de todo “método de cuotas” y la adopción de métodos “estrictamente probabilísticos”.43 No obstante, la evidencia disponible no permite sustentar este elemento como factor explicativo sólido del sesgo observado, dado que la medición más próxima conforme al estimador del error adoptado (M3) fue un ejercicio que adoptó un método por cuotas. Lo anterior, acorde con la lógica —que prevalece aún en diversas naciones— de identificar la muestra más como una “miniatura de la población” que como un proceso de selección objetivo utilizado para obtener estimaciones. Esto deriva en la adopción de mecanismos intencionales para el balanceo de los casos en muestra, sobre todo en la última etapa de selección, conforme a las características consideradas relevantes. Otra objeción a este argumento es la imperfección entre el diseño y su realización en los estudios que pretenden adoptar un muestreo “estrictamente probabilístico”. Aunque estos aspectos suelen repararse, es inevitable la posible presencia de sesgos por imputación, pues “estrictamente hablando, una muestra probabilística obtenida incompletamente deja de ser probabilística, aunque se continúe llamándola así”.44
Otros manifestaron que “los esquemas de muestreo convencionales, utilizados en México desde hace varios lustros para encuestas electorales, resultan insuficientes para la complejidad que vivimos en este país”.45 Un punto particular respecto de lo tratado en esta ponencia es que no existe evidencia de que los diseños utilizados para los seguimientos cotidianos deban estar basados en selecciones independientes y no en selecciones aleatorias iniciales que después se van rotando en campo, puesto que un diseño y otro enfrentan distintos problemas. Si se recurre a sistemas de rotación, la variación entre tomas de muestra día y día disminuye; por lo tanto, la serie es más estable, pero el sesgo puede ser sistemático; si no lo es, de ser exacta la última medición, se valida la serie. Con muestras independientes, de la exactitud de la última medición no se infiere la de otras mediciones seriadas. Empero, como se podrá corroborar por los reportes entregados al IFE, las distintas encuestadoras utilizaron los más diversos métodos de muestreo, simples y complejos. Ello no altero el resultado: unos estuvieron próximos y otros lejanos al resultado, sin vínculo claro con el diseño adoptado, según se ha constatado en estudios realizados a partir de la revisión de la información sobre las encuestas en 2012, hecha del dominio público por la autoridad administrativa electoral.46
No existe entonces evidencia de que se tenga que aumentar tamaños de muestra o dispersión, o que se tenga que recurrir a nuevas estrategias de diseño, aunque seguramente se probaran nuevas opciones. Lo que es más: diversas casas encuestadoras realizaron, posteriormente a la elección, ejercicios de simulación de conteos de votos en las unidades primarias, que tuvieron en sus muestras para las encuestas preelectorales. No se detectó la presencia de sesgos significativos entre el patrón de votación registrado en las secciones donde se efectuaron observaciones y el resultado nacional.
Tampoco existe evidencia sólida que permita sustentar, como fuente primordial de las divergencias entre estimaciones y resultados, asuntos relacionados con el control de calidad o con la supervisión de los estudios. A pesar de la afirmación inicial de Adrián Villegas, en el sentido de que “no fue sólo uno, sino muchos los factores que hicieron que las mediciones de la mayoría de las encuestadoras y los resultados de los comicios difirieran”,47 entre los que lista el diseño y la aplicación del cuestionario, el periodo de levantamiento y el diseño muestral, la evidencia no permite considerar a todos estos elementos como igualmente relevantes para fines de explicación. Este es el caso de aspectos vinculados a la aplicación de los instrumentos de recuperación informativa: en los ejercicios para las elecciones de 2012, varias encuestadoras adoptaron controles inusualmente rigurosos y verificables a fin de garantizar la veracidad de los datos compilados; por ejemplo, la encuesta nacional de seguimiento diario de GEA-ISA para Milenio mantuvo un registro automatizado del momento y geo-localización de cada una de las entrevistas realizadas.
La existencia de ejercicios de una misma encuestadora, con similares tecnologías y métodos de trabajo, pero realizados para distintos procesos, con saldos muy distintos —en términos de proximidad— al resultado, permite advertir que aspectos como los procedimientos de muestreo, los instrumentos de acopio de datos, los sistemas de trasmisión y procesamiento, los esquemas de supervisión en campo y el control de calidad, no parecieran ser la fuente primordial de errores en esta ocasión.48 Ejemplos de ello son la diferencia entre los resultados de la encuesta nacional de seguimiento diario para la elección de presidente de la República, encuesta que llevó a cabo GEA-ISA para Milenio. Hubo un error medio de 3.8 puntos, con el resultado de la encuesta de seguimiento diario para la elección de Jefe de Gobierno del Distrito Federal, realizada por la misma encuestadora para el mismo patrocinador, con la misma metodología, que tuvo un error medio de apenas 1.3 puntos. Igualmente, la exactitud mostrada por la medición de Buendía y Laredo para El Universal en la encuesta previa a la elección para gobernador de Chiapas, contra la divergencia observada entre la última medición para la elección presidencial de esta encuestadora para el mismo medio.49 Sin embargo, habría que considerar otros elementos técnicos, como los mencionados por Jorge Buendía,50 y que lo llevan a afirmar que “la forma de medir las preferencias electorales influye en las estimaciones. La hipótesis es que se obtienen resultados diferentes si se preguntan las preferencias electorales con boleta y urna simulada, y cuando se preguntan de manera verbal”. Este investigador ha puesto también atención en aspectos relacionados con el voto múltiple, no detectado por las encuestas, que es consecuencia directa de las reformas electorales más recientes y que constituye una potencialmente novedosa fuente de error en la investigación de preferencias electorales.
Francisco Abundis, cuya empresa trabajó para la Organización Editorial Mexicana durante el proceso de 2012, apuntó de inmediato dos posibles explicaciones para explicar la diferencia entre las encuestas preelectorales y el resultado de la elección: error de medición o cambio en la decisión del elector. Se inclinó por la segunda explicación, para lo cual disponía de evidencia, producto de un ejercicio realizado por su empresa el día previo a los comicios.51 Ulises Beltrán, responsable de encuestas para Excélsior, alegó asimismo a favor de la perspectiva de un cambio en las preferencias como una de las posibles razones de incompatibilidades y apuntó los perniciosos efectos de las restricciones legales a la publicación de encuestas en los días inmediatamente previos a los comicios.52 Jorge Buendía, cuyas encuestas publicó El Universal, opinó que parte de las diferencias entre las mediciones previas y los resultados electorales pudiera estar relacionada con electores que toman su decisión en el último momento.53 En este mismo tenor se pronunció Roy Campos, de Consulta Mitofsky, quien afirmó que “las encuestas midieron bien cómo estaban las preferencias, pero no pudieron adelantar los cambios finales el día de la elección”.54 En esta misma línea argumentativa, para Enrique Alduncin se presencia “una situación paradójica: nunca se habían realizado tantas encuestas y tan bien hechas (…) y nunca se habían cuestionado tanto sus resultados ni se había acusado tanto a las casas encuestadoras de participar en una maniobra política para engañar a la opinión pública y promover a un candidato”. En opinión de este encuestador, la situación “surge del hecho de que las mediciones son correctas pero su lectura es equivocada”, y uno de los elementos de este equívoco es la correlación entre sobrestimación de un candidato y subestimación de otro, que pareciera indicar “un cambio masivo en la preferencia de un partido por otro en el último momento de la elección (…) consecuencia de la intención y el propósito de las campañas y de la conducta de los votantes”, que sin embargo fue una “reversión incompleta”, ya que le faltó mayor fuerza, contundencia y tiempo.55
Una de las posibles fuentes de error inicialmente apuntadas, que fue perdiendo peso al paso de los días y la disposición de mayor información y análisis de los diversos estudios, fue la existencia de un cambio de último momento en la decisión de voto de los electores.
El autor de este estudio, por su parte, en consonancia con la opinión que luego expresara Héctor Aguilar Camín,56 advirtió que era “poco lógico pensar que se haya dado un giro en los últimos días”,57 al apuntar desde un principio a un problema de detección de los votantes reales respecto del conjunto de entrevistados: “todas las encuestadoras registraban proporciones de ciudadanos con intención de votar superiores a las que se dieron en las urnas, pero con diferencias distintas según contendiente (…) La no realización del sufragio por Peña Nieto de una proporción mayor de informantes pudiera ser consecuencia de diversos factores: que quienes tenían menor interés en el proceso eran más proclives a afirmar que votarían por él; o que la creencia en su triunfo desincentivó su concurrencia a las urnas”.58 Asume así la hipótesis de que “la mayoría de las encuestas estaban reflejando eficientemente la distribución de preferencias en el momento en que tomaron los datos, para la población observada, pero esta población no se correspondía con la relevante para fines de anticipación del resultado”.59 “Para el cálculo de las ‘preferencias efectivas’ (se) asumieron dos supuestos: que quienes no definían una intención de voto tenían una elevada probabilidad de abstenerse y que el segmento definido reflejaba adecuadamente las preferencias de quienes irían a votar (…) Este último supuesto resultó falso: votantes y abstencionistas con preferencia declarada no tuvieron una distribución similar”. Y aunque “algunas casas advertían este problema y recurrieron a modelos de ‘votantes probables’ (…) solamente una tuvo éxito en su tarea; lamentablemente, fue la misma casa que seis años antes, con un ejercicio aparentemente similar, resultó la menos próxima en sus estimaciones previas”, aunque ello pudo realizarse con diferencias en los procesos de “calibración” para el tratamiento de los casos con inconsistencias (entendiendo por calibración al “conjunto de operaciones que establecen, bajo condiciones especificadas, la relación entre los valores de magnitudes indicados por un instrumento o sistema de medición, o valores representados por una medida materializada o un material de referencia y los correspondientes valores aportados por patrones)”.60
En apoyo a esta lectura, Ulises Beltrán y Alejandro Cruz, de BGC, anotaron la existencia de diferencias entre la intención declarada de ir a votar y el número de votantes reales.61 El propio Beltrán aporta un razonamiento respecto del empleo de “filtros o ponderaciones para obtener o dar mayor peso a las preferencias de quienes se cree que cuentan con significativa probabilidad de ir a votar”, y advirtió que “las técnicas usadas en México con la finalidad de encontrar sólo a los probables votantes no han asegurado siempre una mejor estimación de las cifras”.62
Pareciera que no hay suficiente evidencia empírica para afirmar que quienes no manifiestan su intención de voto en una encuesta tendrán una distribución similar a la de aquellos que sí manifestaron su preferencia, o que dicha proporción de no respuesta presumiblemente no votará.63 Sobre este mismo punto, el periodista Francisco Báez,64 uno de los pioneros en la realización de encuestas electorales en México, anota que tal vez haya “que hacer una depuración para distinguir el votante posible del votante probable” y adelanta una hipótesis: “una parte de los entrevistados, que finalmente no fue a votar, se decantó en las encuestas preelectorales por quien percibía iba adelante en las preferencias”, y afirma “su pertenencia al cluster social de sus familiares, amigos y conocidos” en una elección en que se había generado una percepción diáfana de quién resultaría el ganador.
Algunos de los encuestadores se inclinaron por favorecer una explicación que vincularía el sesgo observado con una suerte de “espiral del silencio”, teoría propuesta por Elisabeth Noëlle-Neumann65 que ve a la opinión pública como una forma de control social en que los individuos adaptan su comportamiento a las actitudes predominantes sobre lo que es aceptable, conforme a un clima de opinión definido principalmente por los medios, que decanta las tendencias hacia una determinada opción y se cristaliza en opiniones y votos. No obstante, las argumentaciones que buscan establecer este puente no parecieran ser del todo coincidentes con la definición teórica y el esquema para la detección empírica del fenómeno.66 En esta misma línea de razonamiento, Beltrán atiende a las “opiniones socialmente aceptadas”: “la percepción extendida en un entorno social de que un candidato es el mejor y que va a ganar lleva a un porcentaje de los electores a expresar preferencia por ese aspirante, aunque realmente no sea la opción que realmente se quiere”.67
Por su parte, el especialista en métodos cualitativos Guido Lara aventura tres hipótesis sobre las divergencias entre encuestas y resultados:68 la presencia en el país de un clima generalizado de desconfianza; la sobresimplificación del complejo fenómeno de la decisión del voto que impone la herramienta por sus propias características, que puede dar cuenta de “por quién se inclinan a votar los electores pero muchas veces se quedan cortas en entender el porqué”, simplificación favorecida por los medios, que demandan solamente un seguimiento de la “carrera de caballos”69 y no un esfuerzo de comprensión del proceso, y la “atomización de las emociones sociales”, frente a las cuales la metodología estadística no permite identificar aspectos relacionados con estados de ánimo y contagios sociales.
Pero no solamente los investigadores de la opinión pública han defendido un punto de vista que aboga por la mesura en la interpretación de datos producto de encuestas y han adelantando elementos explicativos respecto de las inconsistencias entre mediciones y resultados. En ocasión del foro de evaluación de las encuestas en 2012 organizado por el IFE, el periodista y académico Raúl Trejo Delarbre70 apuntó la hipótesis de que la menor exactitud registrada en diversas latitudes por las encuestas pudiera responder a una creciente complejidad de las sociedades, donde los ciudadanos tienen experiencias, intereses y contextos variados, con fuentes de información y espacios de socialización diversos y cambiantes, que reconstruyen permanentemente las opiniones. Para Trejo, las encuestas habrían sido víctimas de su propio éxito, pues siendo ejercicios para entender la realidad (…) habrían enfrentado una politización excesiva, al hacerse parte del litigio político. Las encuestas ayudan a entender el presente, mas no anticipan el futuro, sino que pueden registrar definiciones y modificaciones en la actitud de los ciudadanos acerca de los asuntos públicos, tendencias que pueden traducirse en decisiones. Los medios, que han contribuido a difundir la cultura de las encuestas, les han también adjudicado capacidades predictivas que no tienen, a lo que contribuyen los encuestadores, y luego sobreviene una irracional condena a las encuestas.
5. Discusión final: para prevenir sesgosLas encuestas electorales son mediciones sobre las preferencias manifiestas de una muestra de población específica en un momento determinado y, cabe insistir, no constituyen en sí mismas un pronóstico. En los estudios realizados mediante encuesta, además de los consabidos y reconocidos errores muestrales, superiores a los típicamente reportados propios de muestreos aleatorios simples, existen muy diversas fuentes de error no muestral, como el fraseo de preguntas, efectos no anticipados de preguntas previas o posteriores a otras preguntas en el cuestionario, y contingencias que se presentan durante el levantamiento de campo, que pueden generar sesgos incluso de carácter no sistemático que afecten la calidad de la estimación. Lo anterior es conocido y reconocido por los profesionales del campo.
A ello pueden añadirse fenómenos de la conciencia humana en general que afectan las mediciones por encuesta:
Aquello de lo que diríamos ser conscientes con respecto a un tema concreto cambia constantemente. No somos conscientes de algo y entonces lo decimos, sino que en cierto sentido nos hacemos conscientes al decirlo, ya que aquello que se encuentra en la conciencia en un determinado momento es simplemente un intento de fijar un contenido del continuo flujo de cambios que se están produciendo en todo momento en distintos lugares del cerebro (…) En consecuencia, el investigador que interrogue a un sujeto para saber de qué es consciente éste deberá tener en cuenta que el momento en el que decida hacer la pregunta estará influyendo en la respuesta del sujeto, pues estará interrumpiendo la competición entre los distintos discursos posibles (…) Esto por supuesto no significa que ese discurso sea el contenido «final» o «definitivo» de la conciencia, pues seguirá siendo modificado en la memoria (…) Pero todavía más chocante es que esto tampoco implica que hubiese un contenido «primero» o «original» de la conciencia a partir del cual se haya ido degradando la información. Siempre hay multitud de fragmentos narrativos en distintos espacios y tiempos en el cerebro siendo procesados a la vez, y la pregunta por el contenido «original» en la conciencia carece de sentido.71
Dicho de manera llana: el fenómeno de intercepción en la conciencia de un individuo al momento de aplicarle una encuesta no conlleva un cierre definitivo de un proceso decisorio complejo con el que el individuo seguirá lidiando luego de ser entrevistado y hasta el momento en que efectúe realmente el acto de sufragar o tome la decisión de no acudir a votar.
A pesar de todo lo anterior, es cierto y pertinente que se espere que un ejercicio realizado en fecha cercana a una elección arroje datos próximos a lo que se registre en las urnas y que, con ello, valide la historia que narró. Pero también es cierto que la noche anterior a una elección, ningún encuestador, político, comentarista, analista o elector en general sabe con certidumbre el resultado; nadie tiene seguridad de cuál estimación por encuesta fue la más “atinada” y cuál, si la hubo, estuvo fuera de foco. Este es el límite de las encuestas, pero también la victoria de la democracia como procedimiento de elección: no se puede sustituir la voluntad ciudadana por un ejercicio demoscópico.
Ya desde mediados del siglo pasado, el Premio Nobel de Economía Herbert Simon72 apuntaba que el elector conoce qué candidatos tienen un fuerte apoyo mediante encuestas; conforme al modelo construido por este autor, es esperable que éstas aporten pronósticos correctos, aun cuando los conozcan los votantes. Sin embargo, décadas después, Karl Aubert,73 al suponer que toda reacción posible ante una encuesta es igualmente probable, calcula en 63 por ciento la probabilidad de que la estimación producto de una encuesta se ubique dentro de una brecha mínima donde pueda coincidir con el resultado. Desde un punto de vista estrictamente teórico, es de esperar que las encuestas fallen puntualmente como anticipadores del resultado de una elección en una proporción no despreciable de casos.
El dilema que ahora se enfrenta, que no resulta significativamente distinto al que se ha enfrentado desde antaño, es a qué público atender al reportar los resultados de las investigaciones por encuesta sobre preferencias electorales: ¿a quienes demandan apego a los datos observados, aunque sólo sean fotografías de un momento, o a quienes piden un esfuerzo de prognosis, aunque suponga distanciarse del dato obtenido?
Hay quienes defienden el diagnóstico por muchas razones, entre otras porque no es científico “andar de adivinador y más cuando el futuro no solo depende de la serie observada sino del comportamiento (de) actores políticos que influyen en las elecciones con su campaña o su movilización, o del nivel de participación que no conoceremos sino hasta después de la jornada electoral”, mientras que otros “más ligados a las ciencias sociales y a los medios y alejados de la estadística, aducen que la principal función de las encuestas es adelantarnos quién ganará una elección”.74 Recientemente, Roy Campos se pronunció por mejorar, no el método de realización, sino la comunicación de los resultados de las encuestas, diferenciándolas de los pronósticos que habría que desarrollar, pero para lo cual se requiere que las leyes no restrinjan la creatividad.75 Por su parte, Ulises Beltrán se pregunta si convendría utilizar modelos, votantes probables, filtros, ponderaciones para proyectar, a lo que responde que el que quiera hacerlo lo especifique claramente.76
Lo que es una verdad ineludible es que hoy, en México, los encuestadores carecen de un modelo probado de filtrado de casos o ponderación por probabilidad de concurrencia que sistemáticamente arroje estimaciones que aproximen al resultado. Esto tiene que ver con las características propias del sistema electoral: una democracia reciente, multipartidaria y con elevada volatilidad, sin un patrón definido, pues como advierte el propio Beltrán, si los sesgos fueran constantes y consistentes ya se habrían incorporado en modelos de proyección. La evidencia obliga a reconocer entonces que las encuestas preelectorales en México son actualmente una herramienta científica con alcance limitado, si lo que se pretende de ellas es anticipar la distribución esperable de la votación. Si bien pueden informar del reparto de preferencias de la ciudadanía en el momento de su realización y, sobre todo, el ordenamiento de los contendientes, no pueden aproximar las orientaciones del voto.77
Reconocido el límite, queda la tarea de buscar y probar un modelo que satisfaga este requisito, si es que existe, recordando que “hace falta una gran cantidad de teoría antes de que pueda esperarse siquiera que los resultados de la medición adquieran sentido”.78 De no tener un modelo validado, las encuestas públicas electorales debieran privilegiar el reporte de lo observado, tal cual fue tomado, sin asumir supuesto alguno,79 y que cada lector realice el ejercicio de interpretación que desee de los datos aportados, reafirmando el carácter no pronosticador de las encuestas.80
Lo anterior, sin embargo, no puede dejar de lado un fenómeno que, en el agregado de las encuestas previas a elecciones presidenciales en México, se ha presentado con notable regularidad a lo largo del tiempo: la existencia de errores en las estimaciones, medidos en términos de desviaciones estándar de la estimación puntual informada respecto del resultado oficial reportado, superiores a la media estadísticamente esperada. Si teóricamente los datos debieran distribuirse dentro de una curva normal, con una media teorética de poco más de 1.5, se encuentra una desviación media, en términos estandarizados, que supera los tres puntos porcentuales. Solamente la mitad de las estimaciones puntuales se encuentra dentro del rango teóricamente esperado de dos desviaciones estándar, sin que la distribución de las inexactitudes siga una curva normal, sino en todo caso una curva tal vez estable, pero con amplias colas.
Esto da la idea de que las fuentes de error no estrictamente estadístico, además de los efectos de diseño, alejan las estimaciones puntuales reportadas por las encuestas preelectorales en prácticamente el doble del puntaje esperado. Ello puede deberse a múltiples fenómenos vinculados a la incertidumbre de los entrevistados, propia de un proceso decisorio no cerrado, a lo artificioso del proceso usual de aproximación al informante, a efectos del instrumento de recuperación informativa en su redacción específica y el orden de los reactivos, a equívocos en los procesos de toma de información en campo o de su traslado a la base de datos en fases de codificación o digitalización, entre otros motivos de diversa índole. No obstante, lo real es que la aproximación que logran las encuestas es más burda que lo que la estadística explicaría por sí misma.
¿Debe entonces cambiarse un método que ha sido adecuado para aportar exactitud a las mediciones por encuesta en la mayoría de casos? Los productores de información electoral, mediante encuestas por muestreo, podemos comenzar por 1) reconocer explícitamente que los niveles reportados de error estadístico máximo corresponden a un cálculo como si fuera un muestreo aleatorio simple, lo que no es seguido por los ejercicios, desde luego, y reportar los efectos de diseño a los que están sometidas las estimaciones puntuales; 2) advertir de las posibles fuentes de sesgo no estadístico involucradas en las estimaciones mediante encuestas por muestreo, lo que ya se viene haciendo por diversas encuestadoras, y 3) repetir hasta el cansancio que las estimaciones por encuesta no constituyen pronósticos, sino agregaciones de lo declarado por individuos consultados en específicas circunstancias y en un momento determinado.
Pero ello no debe soslayar un hecho constatado por la narración previa: en las encuestas para la elección presidencial de 2012, se presentó un sesgo de carácter sistemático. Empero, ello no es un fenómeno peculiar en estas mediciones, ni en la historia de las encuestas en nuestro país, y menos si se toma la experiencia internacional en este tipo de ejercicios.
Por ello, pudiera pensarse que en la mañana del día siguiente de una elección, políticos, comentaristas y analistas estarán cuestionando las estimaciones por encuesta, si éstas estuvieron alejadas del resultado en las urnas. Y en la mañana de otro día, tras una jornada electoral, los mismos políticos, comentaristas y analistas dirán que no saben bien lo que hicieron los encuestadores, pero que algo habrán hecho bien, porque ahora sí le “atinaron”. Desconozco qué ocurrirá primero, pero ambos juicios serán injustos, pero seguramente se darán.
Sin embargo, allá afuera, el mundo existe y las encuestas son un instrumento falible. Como todo científico, los encuestadores aprenden más de los “fallos” que de los “aciertos”, pues la ciencia es siempre un proyecto inacabado. El problema es cuando se cruza un hacer científico con pretensiones mediáticas. Una estrategia profesional y éticamente adecuada sería convencer al público de que las encuestas son sólo guías y que hay que verlas como información relevante, con el debido respeto, pero también con el debido cuidado y recelo. Esta debiera ser una tarea común y consciente de los propios encuestadores, pero acompañados de analistas y comentaristas que, más allá de la crítica trivial, pudieran coadyuvar en un esfuerzo educativo del y para el electorado.
Estimaciones reportadas, errores absolutos y errores estándar de las encuestas finales sobre la elección presidencial de México, 2012
Fuente: Cálculos del autor con base en: El papel de las encuestas en las elecciones federales. Memorias del Taller Sumiya 2000, Instituto Federal Electoral - Asociación Mexicana de Agencias de Investigación de Mercado y Opinión Pública - Colegio Nacional de Actuarios, México, 2001.
Estimaciones reportadas, errores absolutos y errores estándar de las encuestas finales sobre la elección presidencial de México, 2012
Fuente: Cálculos del autor con base en: Memorias del seminario: encuestas y elecciones 2006, Instituto Federal Electoral - Asociación Mexicana de Agencias de Investigación de Mercado y Opinión Pública - Asociación Mundial de Investigadores de la Opinión Pública - Consejo de Investigadores de la Opinión Pública, México, 2010.
Estimaciones reportadas, errores absolutos y errores estándar de las encuestas finales sobre la elección presidencial de México, 2012
Fuente: Cálculos del autor con base en: Séptimo Informe que presenta la Secretaría Ejecutiva al Consejo General del Instituto federal Electoral respecto del cumplimiento del Acuerdo C G411/2011, por el que se establecen los lineamientos así como los criterios generales de carácter científico que deberán observar las personas físicas y morales que pretendan ordenar, realizar y/o publicar encuestas por muestreo, encuestas de salida y/o conteos rápidos durante el Proceso Electoral 2011-2012, Instituto Federal Electoral, México, 26 de julio de 2012.
Sociólogo por la Universidad Nacional Autónoma de México (unam). Actualmente es Presidente Ejecutivo, desde 2008, de Indagaciones y Soluciones Avanzadas, s.c. (isa), y miembro del Consejo de Investigadores de la Opinión Pública.
Este apartado retoma datos e ideas contenidas en un ensayo reciente sobre el tema: Ricardo de la Peña y Verónica Ortiz, “Sobre la regulación federal de las encuestas electorales en México”, Justicia electoral, Revista del Tribunal Electoral del Poder Judicial de la Federación, núm. 11, México, primer semestre de 2013, pp. 171-206.
Esta visión parte de diversos supuestos sobre la información generada durante el proceso electoral: que dicha información es peligrosa, pues determina la decisión de voto, difumina el papel de las campañas electorales, medios de comunicación, activismo político y prácticas clientelistas; que la ciudadanía es manipulable, sin capacidad para entender o discriminar la calidad de la información; que es posible y deseable controlar la difusión de información, pero no su generación, dejando que sólo unos pocos tengan acceso a ella. Se acepta además una teoría de la conspiración en la que “existe el mismo nivel de responsabilidad entre generadores de información y medios, porque se asume una coordinación entre ambos actores”. Francisco Abundis, “La regulación deseable de estudios preelectorales”, ponencia presentada en la mesa Encuestas: las iniciativas poselectorales y su regulación deseable, en el Foro: Las encuestas electorales, la experiencia de 2012, Instituto Federal Electoral-Asociación Mexicana de Agencias de Investigación de Mercados y Opinión Pública-Asociación Mundial de Investigadores de la Opinión Pública-Consejo de Investigadores de la Opinión Pública, México, 23 de noviembre de 2012.
Instituto Nacional Electoral, Acuerdo ine/cg220/2014del Consejo General del Instituto Nacional Electoral por el que se establecen los lineamientos así como los criterios generales de carácter científico que deberán observar las personas físicas y morales que pretendan ordenar, realizar y/o publicar encuestas por muestreo, encuestas de salida y/o conteos rápidos que tengan por fin dar a conocer preferencias electorales, así como preferencias sobre consultas populares, durante los procesos electorales federales y locales, México, 22 de octubre de 2014.
Edmundo Jacobo, “Encuestas en el proceso electoral 2012¿cumplieron con la ley?”, ponencia presentada en la mesa ¿Cumplieron con la ley?, en el Foro: Las encuestas electorales, la experiencia de 2012, Instituto Federal Electoral-Asociación Mexicana de Agencias de Investigación de Mercados y Opinión Pública-Asociación Mundial de Investigadores de la Opinión Pública-Consejo de Investigadores de la Opinión Pública, México, 22 de noviembre de 2012.
Fueron siete los Informes que presenta la Secretaría Ejecutiva al Consejo General delInstituto Federal Electoral respecto del cumplimiento del Acuerdo cg411/2011, por el que se establecen los lineamientos así como los criterios generales de carácter científico que deberán observar las personas físicas y morales que pretendan ordenar, realizar y/o publicar encuestas por muestreo, encuestas de salida y/o conteos rápidos durante el Proceso Electoral 2011-2012, con anexos en http://www.ife.org.mx/documentos/proceso_2011-2012/EncuestasConteosRapidos. Para el recuento de las encuestas publicadas y reportadas al ife durante la campaña electoral 2012, véase el Cuarto informe, 25 de abril de 2012; el Quinto informe, 31 de mayo de 2012; el Sexto informe, 28 de junio de 2012, y el Séptimo informe, 26 de julio de 2012.
Durante el periodo de campaña, la totalidad de los estudios nacionales en vivienda reportó al ife la fuente de su patrocinio. En 84% de los casos, el financiamiento correspondió a un medio de comunicación; 13% de los estudios fue pagado por la propia encuestadora; en tres casos lo hizo un partido político, y en uno más, el financiamiento fue de particulares. La mayoría de las casas encuestadoras ha recurrido ocasional o regularmente a esquemas de autofinanciamiento de estudios hechos públicos, y la mayoría de medios que han patrocinado estudios ha cubierto solamente costos en muchos casos. Las encuestadoras no viven de los estudios públicos, sino que éstos son un recurso promocional que emplean las propias agencias. Al respecto, cfr.Ricardo de la Peña, “Las encuestas electorales en México, 2012: mitos y realidades”, ponencia presentada en el encuentro Las encuestas de opinión: ¿ejercicios científicos o estrategia política?, El Colegio de México-Instituto Internacional para la Democracia y la Asistencia Electoral, México, 31 de agosto de 2012. Disponible en http://www.ricartur.com/contenido/ColMex1208p.pdf.
Respecto de los resultados de las encuestas electorales publicadas en fecha próxima a las elecciones presidenciales de 2000, 2006 y 2012, véase: El papel de las encuestas en las elecciones federales. Memorias del Taller Sumiya 2000, Instituto Federal Electoral-Asociación Mexicana de Agencias de Investigación de Mercado y Opinión Pública-Colegio Nacional de Actuarios, México, 2001; Memorias del seminario: encuestas y elecciones 2006, Instituto Federal Electoral-Asociación Mexicana de Agencias de Investigación de Mercado y Opinión Pública-Asociación Mundial de Investigadores de la Opinión Pública-Consejo de Investigadores de la Opinión Pública, México, 2010, y Séptimo informe, op. cit. Los datos obtenidos por cada medición se presentan como anexo.
Cfr.Ulises Beltrán, “La precisión de las encuestas preelectorales en 2012”, ponencia presentada en la mesa ¿Qué pasó en 2012? Los encuestadores y los partidos políticos, en el Foro: Las encuestas electorales, la experiencia de 2012, op. cit.
Cfr.Ricardo de la Peña, “Las encuestas después de 1994”, El Cotidiano, núm. 65, Universidad Autónoma Metropolitana-Azcapotzalco, División de Ciencias Sociales y Humanidades, México, noviembre de 1994, pp. 123-134.
En 2012, las encuestas previas a la elección presidencial en México estimaron correctamente 68% de la volatilidad, la misma proporción que la estimada en 2000, pero inferior al 78% alcanzado en 2006. Para las elecciones presidenciales de Estados Unidos, las encuestas en promedio estimaron correctamente cerca de 60% de la volatilidad en el mismo periodo.
Una lectura más sensata de los datos que van arrojando las encuestas que se difunden es la que resulta de observar los rangos de estimación que derivan de las diversas mediciones. Lo anterior puede lograrse por dos vías: la más sencilla, determinar el máximo y el mínimo estimado para cada contendiente; la más precisa, calcular el intervalo de las estimaciones dentro de un margen de precisión determinado. Cuando se efectúa alguno de estos ejercicios con los conjuntos de encuestas próximas a las elecciones presidenciales en México durante el presente siglo, se observa que los resultados oficiales han quedado invariablemente dentro de los intervalos definidos por las encuestas. Al respecto, cfr.Ricardo de la Peña, “Las encuestas electorales en 2012”, ponencia presentada en el panel de encuestadores del XXIII Congreso Nacional de Estudios Electorales Partidos y Elecciones en la Disputa Nacional, Sociedad Mexicana de Estudios Electorales-Instituto Estatal Electoral de Nayarit-Instituto Federal Electoral-Tribunal Electoral del Poder Judicial de la Federación-Universidad Autónoma de Nayarit-Poder Judicial del Estado de Nayarit, Nuevo Vallarta, Nayarit, 2 de noviembre de 2012.
Un antecedente de este fenómeno son las críticas contra las encuestas en la elección presidencial de Estados Unidos de 1996, cuando se estimó en promedio al cierre una diferencia de doce puntos entre candidatos, con una brecha entre ocho y dieciocho puntos, mientras que la distancia conforme al resultado fue de ocho puntos.
Tribunal Electoral del Poder Judicial de la Federación, op. cit. Para una revisión del contenido de esta sentencia en el punto relativo a encuestas, cfr. Ricardo de la Peña y Verónica Ortiz, op. cit.
Un ejemplo de ello es Carlos Puig, “El futuro de las encuestas electorales”, Milenio, 24 de noviembre de 2012, donde se dice que “al final de la elección presidencial, la mayoría de las empresas encuestadoras estuvieron lejos del resultado electoral. En promedio, sobreestimaron el voto del pri unos siete puntos porcentuales. En algunos casos (…) hasta 11”. Se refieren a la diferencia entre primero y segundo lugar, que no es lo mismo que la sobreestimación de un contendiente particular que no alcanzó los ocho puntos.
Al respecto, véase: Ricardo de la Peña, “La Encuesta Nacional Milenio/GEA-ISA de Seguimiento Diario de las Preferencias Electorales en México, 2012: características, técnicas y resultados”, ponencia presentada en la quinta sesión: Las encuestas y las tendencias electorales del ciclo de seminarios 2012, Año de Elecciones, Año de Reflexiones, El Colegio de México, México, 27 de junio de 2012.
Un recuento de casos de errores en encuestas en otras naciones, en fecha más recientes, como la elección parlamentaria en Alemania de 2005 y la presidencial de Colombia en 2010, se encuentra en: Francisco Abundis, “Elección presidencial 2012: los jóvenes ¿fueron la diferencia en el resultado?”, Congreso amai 2012, 20 Años de Conocimiento como Detonador de Transformación, Asociación Mexicana de Agencias de Investigación de Mercados y Opinión Pública, México, 7 de septiembre de 2012.
Cuando se analiza la relación entre estimaciones por encuesta y resultados para los procesos de elección de ejecutivos locales, se constata la inexistencia de un patrón constante de sesgo hacia una opción electoral definida. Así, una sobreestimación se presentó a favor de un partido gobernante distinto del PRI en Guanajuato y por un partido distinto del PRI y sin condición gobernante en Michoacán en 2011 (cfr. Leo Zuckermann, “¿Quién es quién en las encuestas?”, Nexos, núm. 411, marzo de 2012).
Edmundo Berumen Torres, ponencia presentada en la mesa “¿Qué pasó en 2012? Encuestadores y medios de comunicación”, en el Foro: Las encuestas electorales, la experiencia de 2012, op. cit.
Javier Alagón Cano, “Encuestas electorales en los medios: una visión estadística”, ponencia presentada en la mesa ¿Qué pasó en 2012? Los encuestadores y los medios de comunicación, en el Foro: Las encuestas electorales, la experiencia de 2012, op. cit.
Ricardo de la Peña, “Las encuestas electorales en México, 2012: mitos y realidades”, ponencia presentada en el encuentro Las encuestas de opinión: ¿ejercicios científicos o estrategia política?, El Colegio de México-Instituto Internacional para la Democracia y la Asistencia Electoral, México, 31 de agosto de 2012.
Ricardo de la Peña, “Las encuestas en la elección presidencial 2012”, Milenio, 9 de julio de 2012.
Ricardo de la Peña, “Los límites de las encuestas electorales”, Nexos. Blog de la redacción, 16 de julio de 2012.
Joint Committee for Guides in Metrology, International Vocabulary of Metrology – Basic and general concepts and associated terms (vim), 3ª edición, Joint Committee for Guides in Metrology, versión con menores correcciones, 2008, pp. 21-22.
Esta crítica a la cobertura característica de los medios a los procesos electorales con base en encuestas pudiera ser injusta, si se considera que la atención de una persona tiende a concentrarse en un único aspecto cada vez (Vilayanur S. Ramachandran, Lo que el cerebro nos dice: los misterios de la mente humana al descubierto, Paidós, Barcelona, 2012, p. 305) y que a ello responden los medios al privilegiar un único dato como producto de una encuesta. Superar esta perspectiva no pasa por orientar a los medios a que respondan a condiciones subjetivas del público distintas de las reales, sino por diversificar las fuentes de información y difusión de los estudios.
Raúl Trejo Delarbre, “¿Qué pasó en 2012? Encuestadores y medios de comunicación”, ponencia presentada en la mesa ¿Qué pasó en 2012? Los encuestadores y los medios de comunicación, en el Foro: Las encuestas electorales, la experiencia de 2012, op. cit. Es relevante mencionar que, hace tres lustros, este investigador ya advertía que las encuestas “no nos ofrecen pronósticos, sino diagnósticos de una situación social específica. Son fotografías de un momento determinado, no túneles del tiempo capaces de anticipar o de suscitar, por sí mismas, comportamientos colectivos”. Raúl Trejo Delarbre, “Las peores opiniones. Opinión pública, encuestas, elecciones y medios en México, 1994”, en Roderic Ai Camp (comp.), Encuestas y democracia: opinión pública y apertura política en México, Siglo XXI Editores, México, 1997, p. 53.
Roy Campos, “Encuestas 2012; seguimos sin pronosticar”, Nexos. Blog de la redacción, 16 de julio de 2012.
Roy Campos, “El uso de las encuestas por parte de los medios”, ponencia presentada en la mesa ¿Qué pasó en 2012? Encuestadores y medios de comunicación, en el Foro: Las encuestas electorales, la experiencia de 2012, op. cit.
Una visión liberal, exigente en documentación pero abierta al eclecticismo metodológico y que corresponde en lo fundamental a lo argumentado es la reflejada en Instituto Nacional Electoral.
Cabe recordar que la práctica de eliminación de los casos no definidos para calcular las llamadas “preferencias efectivas” es un modelo también, el más simple posible, que asume como supuesto que las proporciones de sobreestimación en las respuestas observadas por contendiente serán constantes. Lo anterior se lleva a cabo por la mejor razón que puede haber: porque es típico que así suceda, aunque casuísticamente no ocurra. Estos modelos simples “constituyen intentos de solución de problemas que representan condiciones iniciales típicas” y son “supersimplificaciones toscas y esquemáticas. De tal manera, resulta difícil decidir si una discrepancia se debe a la inevitable tosquedad o a un error en el modelo” (Karl R. Popper, “Models, Instruments and Truth. The status of the rationality principles in the social Sciences”, en Karl Popper, The Myth of the Framework. In defense of Science and Rationality, Londres, Routledge, 1994, pp. 165 y 170).
Es posible sustentar el carácter no pronosticador de las estimaciones por encuesta no solamente en las condiciones y límites implícitos a su generación, sino en la existencia de opciones para el tratamiento de la información, que sí constituyen propuestas expresamente orientadas al pronóstico, diferenciadas de las encuestas, aunque puedan partir total o parcialmente de éstas.