Suma de cuadrados: qué es y ejemplos

Por el equipo editorial de Indeed

28 de octubre de 2021

Muchas empresas utilizan análisis de regresión para predecir una variable dependiente continua a partir de un número de variables independientes. Los analistas de datos y los profesionales de las finanzas utilizan el análisis de regresión para determinar la fuerza de los predictores, pronosticar un efecto o pronosticar tendencias. Uno de los primeros cálculos realizados en el análisis de regresión es la suma de cuadrados.

En este artículo, discutimos qué es la suma de cuadrados, la fórmula de la suma de cuadrados, cómo calcular la suma de cuadrados y los diferentes tipos de suma de cuadrados, junto con un ejemplo de cálculo.

¿Cuál es la suma de cuadrados?

La suma de cuadrados (SS) es una herramienta que los estadísticos y científicos emplean para evaluar la variación general de un conjunto de datos de su media. Esta herramienta estadística muestra qué tan bien se ajustan los datos a su modelo, especialmente en el análisis de regresión.

Como uno de los resultados más importantes en el análisis de regresión, SS se usa para mostrar la variación en los datos, de modo que una suma de cuadrados más pequeña muestra un mejor modelo y una suma de cuadrados más grande muestra un modelo menor. Cuanto menor o mayor sea la suma, menos o más puntos de datos individuales fluctúan con respecto a la media. Si la suma es cero, su modelo es un ajuste perfecto.

Por ejemplo, los asesores financieros pueden usar SS para calcular la variación en los valores diarios de las acciones. Cuando el SS es un número grande, significa que los valores de las acciones tienen una gran desviación de la media, lo que demuestra la inestabilidad del mercado. Cuando el SS es un número pequeño, significa que los valores de las acciones tienen una pequeña desviación de la media, lo que demuestra la estabilidad del mercado. La raíz cuadrada de la suma de cuadrados es el Desviación Estándarque también es un número útil para los asesores financieros.

Fórmula de suma de cuadrados

La fórmula de la suma de cuadrados es una forma matemática de encontrar el modelo que varía menos de los datos. Es útil tener en cuenta que los profesionales a veces se refieren a la suma de cuadrados como “la variación”. Aquí está la fórmula utilizada para encontrar la suma total de cuadrados, la variación más común de este cálculo:

\mathrm{TSS}=\sum_{i=1}^{n}(y_{i}-\bar{y})^{2}

En esta ecuación:

  • Yi = El i-ésimo término del conjunto

  • ȳ = la media de todos los elementos del conjunto

Cómo calcular la suma de cuadrados

Estos son los pasos que puede seguir para calcular la suma de cuadrados:

1. Contar el número de medidas

La letra “n” denota el tamaño de la muestraque es también el número de mediciones.

2. Calcular la media

La media es el promedio aritmético de la muestra. Para hacer esto, sume todas las medidas y divida por el tamaño de la muestra, n.

3. Resta cada medida de la media

Si tiene números más grandes que la media, producirán un número negativo, lo cual está bien. Debe tener una serie de n desviaciones individuales de la media.

4. Elevar al cuadrado la diferencia de cada medida con respecto a la media

El resultado de un número al cuadrado siempre es positivo, por lo que si tenía números negativos en el último paso, ahora serán positivos. Debes tener una serie de n números positivos.

5. Sume los cuadrados y divida por (n-1)

En este paso final, debes tener la suma de cuadrados. Esta suma de cuadrados es la varianza estándar para el tamaño de su muestra.

Ejemplo de suma de cuadrados

Aquí hay un problema de ejemplo que sigue los pasos descritos anteriormente para resolver la suma de cuadrados de los números 2, 4 y 6:

1. Contar

Cuente el número de mediciones. El número de mediciones es el tamaño de la muestra y se indica con la letra “n”.

norte = 3

2. Calcular

Sume todas las medidas y divida por el tamaño de la muestra para encontrar la media.

(2+4+6)/3 = 12/3 = 4

3. Restar

Resta cada medida de la media.

4 – 2 = 2

4 – 4 = 0

4 – 6 = -2

4. Cuadrado

Eleva al cuadrado la diferencia de cada medida con respecto a la media para lograr una serie de n números positivos.

22 = 4

02 = 0

(-2)2 = 4

5. Agregar

Sume los cuadrados para encontrar la suma de los cuadrados, también conocida como la varianza estándar para el tamaño de su muestra.

4 + 0 + 4 = 8

Tipos de suma de cuadrados

Hay tres tipos principales de suma de cuadrados: suma total de cuadrados, suma de cuadrados de regresión y suma de cuadrados residual. Aquí hay una breve explicación sobre cada tipo:

Suma total de cuadrados

La fórmula de la suma total de cuadrados, demostrada anteriormente, le dice cuánta variación existe en la variable dependiente y cuantifica la variación total de una muestra.

A veces, los cuadrados reales representan la suma total de cuadrados a lo largo de la línea de regresión de un gráfico. Un diagrama como una línea de regresión en un gráfico es opcional, pero brinda una representación visual del cálculo, lo que lo hace más fácil de entender. Otras veces, la fórmula y = Y – ȳ representa la suma total de cuadrados.

Regresión suma de cuadrados

La suma de cuadrados de regresión muestra si un modelo de regresión hace un buen trabajo representando los datos modelados. La suma de cuadrados se vuelve más complicada cuando los profesionales la usan para calcular la suma de cuadrados en el análisis de regresión. Estas complicaciones hacen que sea muy raro que los profesionales completen este cálculo a mano. En su lugar, utilizan programas de software para calcular los resultados.

Al calcular la suma de cuadrados de regresión, una suma de cuadrados de regresión más alta indica que el modelo no ajusta bien los datos. Una suma de cuadrados de regresión más baja indica que el modelo hace un buen trabajo ajustando los datos.

Suma residual de cuadrados

La suma residual de cuadrados muestra qué parte de la variación de la variable dependiente no explica su modelo. Mide la variación de errores en un modelo de regresión, lo que significa que muestra la cantidad de variación en la variable dependiente. Es la suma de las diferencias al cuadrado entre el valor Y real y el valor Y predicho.

Al calcular la suma de cuadrados residual, una suma de cuadrados residual más baja muestra que el modelo de regresión explica mejor los datos. Una suma de cuadrados de regresión más alta muestra que el modelo de regresión explica mal los datos.

Similar Posts

Leave a Reply

Your email address will not be published.