2 min
Para los estadísticos o ingenieros estadísticos el término de “grados de libertad” es muy conocido, incluso en la mayoría de los libros de estadística y probabilidad es muy utilizado pero no dejan un concepto claro sobre el mismo, siendo uno de los más conocidos “el número de variables menos el número de parámetros a estimar”. En forma práctica presento uno de los ejemplos primarios para entender este concepto: Asumiendo que \(x_i\sim N(\mu,\sigma^2)\), sabemos que \(\overline{x}\sim N(\mu,\frac{\sigma^2}{n})\) y por lo tanto \(\frac{\overline{x}-\mu}{\frac{\sigma}{\sqrt{n}}} \sim N(0,1)\) . Bajo el supuesto que conocemos los parámetros \(\mu\) y $^2 $ se puede notar que el estadístico \(z=\frac{\overline{x}-\mu}{\frac{\sigma}{\sqrt{n}}}\) se obtienen a partir de \(n\) variables independientes \(x_i\). Es decir, como vimos en nuestro curso de algebra lineal, la dimensión de el espacio dimensional es \(n\). Por otro lado supongamos que desconocemos el valor de \(\sigma^2\), el cual sería estimado con \(s^2\), ahora para calcular el valor de \(s^2\) se utilizan \(n\) desviaciones respecto a la media y es fácil verificar que las \(n\) desviaciones no son independientes sino, por lo contrario, la última desviación depende de las \(n-1\) desviaciones restantes ya que la suma de las \(n\) desviaciones tiene que ser igual a 0. Esto produce la pérdida de un grado de libertad y por lo tanto, nuestro estadístico \(t=\frac{\overline{x}-\mu}{\frac{s}{\sqrt{n}}}\) tiene \(n-1\) grados de libertad. En conclusión, cuando se calcula un estadístico con la necesidad de estimar \(k\) parámetros, el número de grados de libertad es \(n-k\). En otras palabras mientras más obligaciones tengas en tu vida, tienes menos grados de libertad. “Y alguien que tiene demasiadas enamoradas casi no tiene grados de libertad porque no va a tener la libertad de movilizarse por donde desee sino que va a tener que evadir la concurrencia a ciertas zonas, para que no lo pillen, perdiendo poco a poco más grados de libertad.” Espero que hayan disfrutado y se incentiven a interpretar su significado tanto en las pruebas de hipótesis multivariadas, regresión, muestreo y otros.