¿Cómo se equivocaron las encuestas? Aquí hay algunas teorías

Nate Cohn
·16  min de lectura
Una fila de electores espera para votar el día de las elecciones en Great Falls, Montana. Una posible explicación de los fallos en las encuestas de 2020 tiene que ver con el porcentaje de participación, específicamente de los republicanos, que superó lo que predijeron las encuestas. (Janie Osborne para The New York Times)
Una fila de electores espera para votar el día de las elecciones en Great Falls, Montana. Una posible explicación de los fallos en las encuestas de 2020 tiene que ver con el porcentaje de participación, específicamente de los republicanos, que superó lo que predijeron las encuestas. (Janie Osborne para The New York Times)
† Reflejan estimaciones del Times del margen de voto final una vez que se cuenten todos los votos. * En Maine y Nebraska, dos votos electorales se asignan al ganador del voto popular estatal y el resto de los votos se dan al ganador del voto popular en cada distrito del Congreso. (Maine tiene dos distritos electorales y Nebraska tiene tres). El error de la encuesta en 2016 se calcula utilizando promedios de las encuestas estatales realizadas dentro del margen de una semana del día de las elecciones.
† Reflejan estimaciones del Times del margen de voto final una vez que se cuenten todos los votos. * En Maine y Nebraska, dos votos electorales se asignan al ganador del voto popular estatal y el resto de los votos se dan al ganador del voto popular en cada distrito del Congreso. (Maine tiene dos distritos electorales y Nebraska tiene tres). El error de la encuesta en 2016 se calcula utilizando promedios de las encuestas estatales realizadas dentro del margen de una semana del día de las elecciones.

Los encuestadores pensaron que habían aprendido de los errores de 2016. Tal vez sí, y quizá esta elección planteó nuevas dificultades.

Pedir una autopsia de las encuestas ahora es un poco como preguntarle a un médico forense la causa de la muerte cuando el cuerpo aún se encuentra en la escena del crimen. Hay que esperar a que se realice una autopsia completa.

Pero no hay que equivocarse: no es prematuro decir que la subestimación sistemática del apoyo con el que contaba el presidente Trump fue muy parecido al error de las encuestas de hace cuatro años y que tal vez termine por superarla.

Por ahora no hay excusas. Después de 2016, los encuestadores llegaron a explicaciones plausibles sobre por qué los sondeos subestimaron sistemáticamente a Trump en los estados claves. Una de ellas era que las encuestas estatales no ponderaron adecuadamente a los participantes sin grado universitario. Otra era que había factores más allá del alcance de los sondeos, como la gran cantidad de votantes indecisos que parecieron decantarse abruptamente por Trump en la recta final.

Este año, parecía haber menos causa de preocupación: en 2020 la mayor parte de las encuestas estatales ponderaron por nivel educativo y hubo muchos menos votantes indecisos.

Pero al final, el error de sondeo en los estados fue virtualmente idéntico al fallo de 2016, a pesar de que se tomaron medidas para corregirlo. La guía de The Upshot “Si las encuestas se equivocan tanto como en 2016” resultó ser más útil de lo esperado y acertó las ventajas de un punto o menores en Pensilvania, Georgia y Arizona.

Las encuestas nacionales fueron incluso menos acertadas que hace cuatro años, cuando las firmas encuestadoras más respetadas y rigurosas generalmente encontraron que Hillary Clinton iba liderando por cuatro puntos menos, cerca de su victoria de 2,1 puntos en el voto popular.

Este año, Biden va encaminado a ganar el voto nacional por alrededor de cinco puntos porcentuales; ninguna encuesta nacional telefónica en vivo lo mostraba liderando por menos de ocho puntos porcentuales en el último mes de la contienda.

Las encuestas de The New York Times/Siena College también fueron menos precisas que en 2018 o que hace cuatro años. En 2016, las últimas dos encuestas Times/Siena estuvieron entre un grupo muy pequeño de sondeos que mostraron a Trump empatado o liderando en Florida y Carolina del Norte. Esta vez, casi todas las encuestas Times/Siena sobrestimaron a Biden por alrededor de la misma extensión que las otras encuestas.

En los meses que vienen habrá muchos datos que ayudarán a añadirle contexto a lo que sucedió exactamente en la elección, como los datos finales de participación, los resultados por precinto electoral y los registros actualizados de votantes que participaron o se quedaron en casa. Toda esta información puede añadírsele a nuestras encuestas para precisar en dónde se equivocaron más y ayudar a descubrir el motivo. Pero, por ahora, es muy pronto para contar con una respuesta confiable.

En el sentido más amplio, hay dos modos de interpretar la repetición del error de sondeo de 2016. Uno es que los encuestadores se equivocaron completamente sobre lo acontecido hace cuatro años. Como resultado, las medidas que tomaron para corregir no les ayudó. Otro es que la investigación en sondeos se ha vuelto más compleja desde 2016 y las medidas que los encuestadores tomaron para mejorar en los últimos cuatro años quedaron anuladas por un nuevo conjunto de dificultades.

De ambas, la última interpretación —que las mejoras reales fueron anuladas por nuevos desafíos— es la que tiene más sentido.

“Creo que, de haber empleado una metodología previa a 2016, nuestras encuestas habrían estado incluso peor este año”, dijo Nick Gourevitch de Global Strategy Group, una encuestadora demócrata que se propuso representar mejor a los partidarios de Trump en esta ocasión. “Estas cosas ayudan a que nuestros datos sean más conservadores, aunque claramente no bastaron para solucionar el problema”.

Escucha en inglés nuestro pódcast The Daily, en donde se discuten los errores de las encuestas con el autor de este artículo.

La explicación del error de las encuestas de 2016, aunque no es necesariamente completa o definitiva, no es descabellada. Muchos encuestadores estatales representaron muy mal el número de votantes sin título universitario que respaldaron a Trump en grandes cantidades. Los encuestadores volvieron a sus datos después de 2016 y descubrieron que habrían estado mucho más cerca del resultado de las elecciones de haber aplicado los ajustes educativos estándar que las encuestas nacionales han utilizado desde hace mucho tiempo. Un análisis de The Upshot de las encuestas nacionales encontró que el error al ponderar por nivel educativo le costó a Trump unos cuatro puntos en apoyo en los sondeos, suficiente para cubrir gran parte del error de 2016. Otros encuestadores realizaron hallazgos similares.

Esta vez, la ponderación por nivel educativo no pareció ayudar. Los sondeos estatales y nacionales mostraron consistentemente que Biden tenía más aceptación que Hillary Clinton entre los votantes blancos sin grado universitario. Los resultados de la semana pasada dejaron claro que no era así.

En general, las encuestas finales a nivel nacional de 2020 mostraron que Trump lideraba por un margen de 58 a 37 por ciento entre los votantes blancos sin título universitario. En 2016, mostraban a Trump mucho más adelante, 59-30. Los resultados por condado sugieren que Biden logró pocos avances entre los votantes blancos sin título en todo el país, e incluso tuvo un peor desempeño que el de Clinton en 2016 en muchos estados críticos. En contraste, las encuestas de 2016 sí mostraron un cambio decisivo y radical entre los votantes blancos sin título pero subestimaron este efecto en muchos estados porque no midieron la dimensión del grupo. Muchas encuestas estatales mostraban que los graduados universitarios representaban la mitad del electorado probable en 2016, en comparación con 35 por ciento de los estimados del censo.

Los resultados de las encuestas entre personas de la tercera edad son otro síntoma de un fracaso más profundo en los sondeos de este año. A diferencia de 2016, las encuestas mostraron consistentemente que Biden ganaría con márgenes holgados entre los votantes de 65 años y más. La última encuesta NBC/WSJ mostraba a Biden con una delantera de 23 puntos en ese grupo; la última encuesta Times/Siena mostraba que estaba 10 puntos arriba. En el conteo final, no hay motivos para creer que nada de eso fuera cierto.

Este es un tipo de error más profundo que los de 2016. Sugiere que hay una mala medición fundamental de las preferencias de un gran grupo demográfico, no solo una subestimación de su proporción en el electorado. Dicho de otro modo, los datos brutos subyacentes de la encuesta empeoraron en los últimos cuatro años, anulando los cambios que hicieron los encuestadores para corregir los errores de 2016.

Esto ayuda a explicar por qué las encuestas nacionales resultaron peores que en 2016: sí se ponderaron por educación hace cuatro años e hicieron pocas modificaciones desde entonces. También ayuda a explicar por qué el error está tan correlacionado con lo que sucedió en 2016: se enfoca en el mismo grupo demográfico, incluso si la fuente subyacente del error es bastante distinta.

Hacer encuestas, sin duda, implica desafíos serios. La industria siempre se ha basado en ajustes estadísticos para garantizar que cada grupo, como los votantes blancos sin título universitario, refleje la parte adecuada de la muestra. Pero esto solo sirve si los encuestados resultan ser representativos de los no encuestados. En 2016, parecían ser lo suficientemente representativos para muchos propósitos. En 2020, no lo fueron.

Entonces, ¿cómo fue que las encuestas empeoraron en los últimos cuatro años? Esto es principalmente especulación, pero considera algunas posibilidades:

El presidente (y las encuestas) dañaron las encuestas. No hubo indicios reales de un voto “escondido para Trump” en 2016. Pero tal vez sí lo hubo en 2020. Durante años, el presidente atacó a los medios y a las encuestadoras, entre otras instituciones. Los sondeos en sí perdieron bastante credibilidad en 2016.

Es difícil no preguntarse si los partidarios del presidente se volvieron menos propensos a responder a las encuestas a medida que aumentaba su escepticismo hacia las instituciones, lo que dejó a las encuestadoras en una situación peor a la de hace cuatro años.

“Ahora tenemos que tomarnos en serio alguna versión de la hipótesis del ‘trumpista tímido’”, dijo Patrick Ruffini, encuestador republicano de Echelon Insights. Sería un “problema que las encuestas simplemente no lleguen hasta los grandes sectores de la coalición Trump, lo que hace que se subestime a los republicanos en todos los ámbitos cuando él está en la boleta”.

(Esto es diferente a la teoría típica del ‘trumpista tímido’ que sostiene que los partidarios de Trump no les dicen la verdad a los encuestadores).

Una posibilidad relacionada con este fenómeno es que, durante su mandato, Trump pudo haber logrado avances entre los votantes que tendrían menos probabilidades de responder a las encuestas y es posible que haya perdido terreno entre los electores que tienen más probabilidades de responder a las encuestas. La educación universitaria, por supuesto, es solo uno de los rasgos que predicen si alguien podría respaldar a Trump o responder a un sondeo. También hay otros elementos como si confía en su vecino, si se ofrecen como voluntarios o si están comprometidos políticamente.

Otro indicador es la participación: las personas que votan son más propensas a responder encuestas políticas. Las encuestas del Times/Siena hacen todo lo posible para llegar a los no votantes, que fue una de las principales razones por las que nuestros sondeos fueron más favorables para el presidente que otros estudios de 2016.

En 2020, las personas no votantes contactadas por el Times fueron más favorables para Biden que quienes tenían un historial de participación en elecciones recientes. Es posible que, al final, los datos finales sugieran que Trump hizo un mejor trabajo al atraer a los no votantes. Pero también es posible que no hayamos contactado a los votantes de baja participación idóneos.

La resistencia afectó las encuestas. Está demostrado que es más probable que los votantes comprometidos políticamente respondan a las encuestas políticas, y es evidente que la elección del presidente Trump provocó un aumento del compromiso político de la izquierda. Millones de personas asistieron a la Marcha de las Mujeres o participaron en las protestas de Black Lives Matter. Los activistas progresistas donaron enormes sumas y participaron en un número récord de elecciones especiales que, en otra época, no habrían despertado la atención nacional.

Esta oleada de participación política también podría significar que la resistencia hizo que fuese más probable que se respondiera a las encuestas políticas, signadas por sus características demográficas.

¿A las “mamás de MSNBC” les emociona contestar una encuesta mientras silencian a Rachel Maddow al fondo? Como la mayoría de las otras teorías que presentamos, no hay evidencia sólida, pero encaja con algunos hechos bien establecidos sobre la propensión a responder encuestas.

La participación afectó las encuestas. Los encuestadores políticos suelen asumir que una mayor participación facilita el trabajo de las encuestas porque significa que hay menos incertidumbre sobre la composición del electorado. Quizás no fue así.

De cara a las elecciones, muchas encuestas mostraron algo inusual: a los demócratas les va mejor entre los votantes probables que entre los votantes registrados. Por lo general, los republicanos mantienen el margen de participación.

Tomemos como ejemplo Pensilvania. La encuesta final de CNN/SSRS en ese estado mostró que Biden subió 10 puntos entre los votantes probables, pero solo cinco entre los votantes registrados. Monmouth mostró que el candidato demócrata tenía una ventaja de siete puntos entre los votantes probables en un escenario de “alta participación” (lo que, en efecto, terminó sucediendo), pero solo de cinco puntos entre los electores registrados.

¿Y las encuestas del Marist Institute? Le daban una ventaja de seis puntos entre los votantes probables y cinco puntos entre los registrados. El sondeo de ABC/Washington Post mostró una ventaja de siete puntos para Biden entre los votantes probables y una ventaja de cuatro puntos entre los electores registrados.

Todavía es muy pronto para saber si la participación republicana superó a la demócrata, pero es posible. En Florida, el único estado donde tenemos datos sólidos de participación, los republicanos registrados superaron a los demócratas registrados por unos dos puntos porcentuales entre quienes realmente votaron, aunque los demócratas superan en número a los republicanos entre los votantes registrados por aproximadamente 1,5 puntos en ese estado. Aquí, no hay duda de que la participación fue mejor para el presidente de lo que sugirieron las encuestas, ya sean sondeos privados o la consulta final del Times/Siena, que mostró a los republicanos registrados con una ventaja de 0,7 puntos.

Si a Trump le fue mejor entre los votantes probables que entre los electores registrados en Pensilvania, una falla fundamental en la estimación de la participación podría explicar parte del error.

A diferencia de otras teorías que hemos presentado, esta puede probarse como falsa o verdadera. Los estados eventualmente actualizarán sus archivos de votantes con un registro que muestra si los votantes participaron en las elecciones. Podremos ver la composición exacta del electorado por los registros de cada partido y también podremos ver cuál de nuestros encuestados votó. Quizás los partidarios de Trump eran más propensos a votar. En las próximas semanas podríamos tener datos de Carolina del Norte y Georgia. Otros estados pueden tardar más.

La pandemia afectó las encuestas. ¿Recuerdas esas encuestas del Times/Siena de octubre de 2019 que mostraban que Biden lideraba por poco a Trump? Resultó que estuvieron muy cerca del resultado real, al menos fuera de Florida. Ciertamente estaban más cerca que los sondeos realizados por el Times/Siena desde entonces.

Eso no solo sucedió con las encuestas del Times/Siena antes de las elecciones. En retrospectiva, los resultados de los encuestadores en febrero y marzo parecen casi acertados con Biden liderando por aproximadamente seis puntos entre los votantes registrados en todo el país, y con una ventaja muy estrecha en los estados de la “muralla azul”, incluida una carrera empatada en Wisconsin.

Una posibilidad es que las encuestas fueran tan erradas en octubre de 2019 como en octubre de 2020. Si es así, Trump mantuvo una clara ventaja durante el invierno. Tal vez. Otra posibilidad es que los sondeos hayan empeorado durante el último año. Y algo realmente importante sucedió en la vida estadounidense durante ese tiempo: la pandemia del coronavirus.

“La historia más sencilla es que, después del cierre, los demócratas empezaron a contestar encuestas porque estaban encerrados en casa y no tenían nada más que hacer”, dijo David Shor, un encuestador demócrata que trabajó para la campaña de Obama en 2012. “Casi todo el error de las encuestas nacionales puede explicarse por el salto posterior a la COVID en las tasas de respuesta entre los demócratas”, dijo.

El gráfico siguiente muestra que los votantes de las primarias demócratas fueron más propensos a responder encuestas en 2020.

La evidencia circunstancial es consistente con esa teoría. Sabemos que el virus tuvo un efecto en las encuestas: los encuestadores reportaron un aumento vertiginoso en las tasas de respuesta. Estudios de alto nivel mostraron que Biden estaba ganando en los sitios con altos niveles de contagio de coronavirus, lo que parecía confirmar la suposición de que la pandemia estaba perjudicando al presidente.

Pero, si Shor tiene razón, los estudios no mostraban un cambio en las actitudes de los votantes en los puntos más afectados por la pandemia, más bien, se trató de un cambio en la tendencia de los partidarios de Biden al momento de responder a las encuestas.

Además no hay evidencia de que al presidente le haya ido peor en los lugares afectados por los contagios, lo que contradice las expectativas de los expertos y los estudios. De hecho: a Trump le fue un poco mejor en lugares con altos casos de coronavirus que en sitios con menos contagios, según la demografía, y los resultados preliminares por condado hasta el momento. Esto es más obvio en Wisconsin, uno de los lugares más afectados de la nación y un estado pendular donde las encuestas subestimaron más a Trump. Los sondeos finales en Wisconsin, incluida la consulta final del Times/Siena, proyectaban que Biden ganaba en ese estado, incluso cuando las encuestas de otros lugares mostraban que Trump estaba ganando.

No olvidemos el voto hispano. Hay un estado en particular donde las encuestas fueron mucho más erradas en 2020 que en 2016: Florida, donde Trump logró grandes avances entre los votantes hispanos.

Lo que sucedió en el condado de Miami-Dade fue asombroso. Biden ganó por solo 7 puntos en un condado donde Clinton ganó por 29. Ningún encuestador vio el alcance de esto, ni siquiera los que realizan sondeos en el condado de Miami-Dade o sus competitivos distritos electorales.

La mayoría de las encuestas probablemente ni siquiera estaban en el rango correcto. La última encuesta del Times/Siena de Florida mostró que Biden tenía una ventaja de 55-33 entre los votantes hispanos. Al final, Biden apenas pudo ganar el voto hispano en el estado.

Lo que sucedió en Miami-Dade no solo se trata de los cubanoestadounidenses. Aunque los demócratas consiguieron un escaño en el Senado y lideran la carrera presidencial en Arizona, Trump logró grandes avances en muchas comunidades hispanas en todo el país, desde el Valle Imperial agrícola y las ciudades fronterizas a lo largo del río Bravo hasta las más urbanas de Houston o Filadelfia.

Muchas encuestas nacionales no dan a conocer los resultados de los votantes hispanos porque, por lo general, una encuesta determinada solo tiene una pequeña muestra del grupo. Pasará algún tiempo hasta que los principales encuestadores publiquen sus resultados en el Roper Center, un repositorio de datos detallados de encuestas. Entonces podremos profundizar y ver exactamente lo que mostraron los sondeos nacionales de ese grupo.

Pero lo que Florida puede indicarnos es que, al menos las encuestas nacionales, no vieron la fuerza de Trump entre los votantes hispanos. Parece totalmente posible que los sondeos hayan fallado por 10 puntos en ese grupo. De ser cierto, representaría un porcentaje modesto pero significativo, tal vez una cuarta parte, del margen de error en las encuestas nacionales.

Estas son las conjeturas iniciales. Luego surgirán otras teorías. Con el tiempo, todas serán puestas a prueba. Y entonces sabremos más de lo que conocemos hasta ahora y podremos volver a analizar lo que pasó en las elecciones.

Nate Cohn es corresponsal nacional de The Upshot. Cubre elecciones, encuestas y demografía. Antes de unirse al Times en 2013, trabajó como redactor para The New Republic. @Nate_Cohn

This article originally appeared in The New York Times.

© 2020 The New York Times Company