¿Qué es una correlación espuria? (Definición y ejemplos)

Por el equipo editorial de Indeed

29 de octubre de 2021

Las correlaciones espurias pueden ocurrir en las estadísticas cuando dos o más variables parecen tener una relación de causa y efecto entre sí. Sin embargo, este tipo de correlaciones rara vez tienen una verdadera relación causal, aunque lo parezca. Además, las correlaciones espurias pueden brindarle una mejor comprensión de las características y comportamientos de un conjunto de datos. En este artículo, exploraremos qué es la correlación espuria, cómo se relaciona con la causalidad y cómo identificar una correlación espuria con algunos ejemplos para obtener información adicional sobre esta relación estadística.

¿Qué es una correlación espuria?

Una correlación espuria en estadística representa una conexión entre dos variables que parece ser una relación causal pero en realidad no lo es. Una relación causal describe una relación de causa y efecto entre dos variables donde una variable hace algo que afecta directamente a la otra. Sin embargo, en una correlación espuria, lo que parece ser una relación de causa y efecto entre dos variables es a menudo una relación coincidente o se debe a un tercer factor de confusión que afecta a ambas variables.

Por ejemplo, si observa que aumentan tanto el costo de la educación superior como el costo de vida, este cambio en ambas variables no significa necesariamente que haya una relación causal entre los dos. Esto significa que el aumento en el costo de vida no es necesariamente la causa del aumento en la matrícula de educación superior. En este ejemplo, puede atribuir el cambio en ambos costos al aumento de la inflación u otros factores macroeconómicos, lo que da como resultado una correlación espuria con un factor de confusión.

Aunque las correlaciones espurias parecen tener un factor de conexión, las correlaciones no siempre significan causalidad. Para comprender mejor cómo pueden surgir correlaciones espurias en los estudios estadísticos, es importante comprender la distinción entre una relación correlativa y causal.

Correlación versus causalidad

En estadística, puede analizar las relaciones y los comportamientos de múltiples variables para obtener información sobre su estudio. Las relaciones que surgen entre variables en este sentido son correlativas o causales y pueden estar directamente relacionadas entre sí o no tener ningún vínculo real:

Correlación

Una correlación es una medida de la dirección y el tamaño de dos o más variables en un conjunto de datos. Esto significa que al mirar modelos estadísticos, si una variable cambia o se mueve en una dirección específica, entonces otra variable también lo hace. Cuando aparecen comportamientos como este entre las variables en los estudios, los estadísticos asumen una correlación o vínculo entre las muestras. Tres tipos principales de correlaciones pueden ocurrir en cualquier estudio dado:

  • Las correlaciones positivas representan un cambio positivo en una variable debido a otra.

  • Las correlaciones negativas representan un cambio negativo en una variable debido a otra.

  • Una relación correlativa cero indica que no existe un vínculo aparente entre dos o más variables.

Cuando se producen correlaciones falsas, la relación puede aparecer como cualquier tipo de correlación hasta que identifique la falsedad en la muestra y determine qué la causa.

Causalidad

Las relaciones causales son esencialmente relaciones de causa y efecto. Esto significa que una o más variables afectan directamente a otras variables para causar un resultado. Un excelente ejemplo de una relación causal es un barco que se hunde. Si un bote tiene un agujero, el agujero provoca una fuga y la fuga hace que el bote se llene de agua y finalmente se hunda. Las variables en juego en este ejemplo incluyen el bote, el hoyo y el agua.

El agujero de la embarcación influye directamente en el aumento de agua que se filtra hacia ella, provocando un cambio negativo en la flotabilidad de la embarcación. Esta relación de causa y efecto es un ejemplo simple; sin embargo, es importante comprender que puede atribuir relaciones causales a un factor que afecta directamente a una variable. Las relaciones correlativas solo unen dos o más variables, formando una posible conexión.

¿Qué te dicen las correlaciones espurias?

Una correlación espuria puede informarle sobre las relaciones entre diferentes datos en una muestra. Cuando los estadísticos analizan muestras para probar teorías e hipótesis, buscan cualquier relación de causa y efecto entre las variables que están probando. Si se forman correlaciones espurias, los estadísticos pueden evaluar si la relación entre dos o más variables es una coincidencia o el resultado de un tercer factor de confusión.

Cómo identificar una correlación espuria

Los profesionales que analizan datos en sus carreras buscan continuamente las relaciones entre variables en sus estudios. Esto significa aplicar varios enfoques para detectar y dar cuenta de las correlaciones espurias. Varios métodos que utilizan los estadísticos, los analistas de datos y otros investigadores para encontrar correlaciones falsas incluyen:

1. Garantizar tamaños de muestra adecuados

Los profesionales que trabajan con datos deben asegurarse de obtener tamaños de muestra adecuados. Si el tamaño de una muestra es demasiado pequeño, es más probable que tenga correlaciones falsas porque simplemente no hay suficientes datos para formar una imagen más amplia del comportamiento de las muestras. Este tipo de escenario puede crear sucesos aparentemente relacionados cuando, en una muestra más grande, los datos pueden comportarse de manera diferente.

2. Evaluación de datos para puntos finales arbitrarios

En algunos tipos de estudios, como los estudios médicos o farmacéuticos, los criterios de valoración indican si los resultados probados son beneficiosos. Los puntos finales arbitrarios son resultados que parecen no tener causa o no estar relacionados con el comportamiento de las variables en el estudio. Si surgen estos escenarios, es probable que se trate de una correlación espuria.

3. Control de variables externas

Cuando los estadísticos desarrollan estudios, ensayos u otros experimentos, tienen en cuenta todos los factores que pueden afectar las variables del conjunto de la muestra. Cuando un estadístico analiza datos, evalúa estos factores para tener una idea de cómo afectan los datos. Comprender cómo los factores externos afectan los datos que están estudiando puede ayudar a los estadísticos a determinar si las relaciones entre el comportamiento de las variables son correlaciones viables o correlaciones espurias.

Estos tres enfoques pueden ayudar a los estadísticos, científicos de datos y otros analistas a identificar correlaciones espurias para analizar la verdadera relación entre las variables.

Ejemplos de una correlación espuria

Las correlaciones espurias pueden ser bastante comunes fuera de los estudios estadísticos rigurosos. Sin embargo, algunas correlaciones espurias pueden ocurrir continuamente y con un alto nivel de precisión, aunque los eventos o las muestras no estén relacionados. Aquí hay varios ejemplos de correlaciones espurias relacionadas con eventos cotidianos:

Ejemplo 1

Suponga que un gráfico muestra la tendencia ascendente de las ventas de juegos de realidad virtual y un aumento en la cantidad de estudiantes que se gradúan con una maestría en tecnología durante un año específico. Puede suponer que debido al interés y compromiso de los estudiantes con la tecnología VR, más personas terminaron sus títulos en tecnología.

Sin embargo, esto se convierte en una correlación espuria si los usuarios de los juegos de realidad virtual son estudiantes de secundaria durante el mismo año en que aumenta el número de graduados en tecnología. El factor externo de la edad anula la relación porque es poco probable que los estudiantes que todavía están en la escuela secundaria se gradúen con una maestría al mismo tiempo.

Ejemplo 2

Otro ejemplo de una correlación espuria es una relación entre aumentos en el número de ventas de boletos para parques acuáticos y en el número de ventas de helados en los supermercados. Aunque ambas cifras de ventas están aumentando, es muy poco probable que el aumento de las ventas de helados en los supermercados esté provocando el aumento de las ventas en los parques temáticos. Asimismo, es poco probable que el aumento en la venta de boletos para los parques temáticos se deba a una mayor venta de helados. En este escenario, hay un tercer factor de confusión.

Si este estudio ocurre durante el verano, es probable que la causa de ambos aumentos en las ventas sea el calor. Las temperaturas más altas en el verano probablemente podrían explicar que más personas compren boletos para parques temáticos acuáticos, junto con golosinas frías como helados en sus supermercados.

Similar Posts

Leave a Reply

Your email address will not be published.