Práctico 7 Tipos de errores cuadrados
Para este capitulo necesitas tener instalado el paquete car, también ayuda tener el paquete broom. Esta clase del curso puede también ser seguida en este link
7.1 Objetivos del práctico
- Entender la diferencia entre los distintos tipos de sumas de cuadrado
- Saber los pro y los contras de cada uno
- Entender cuando usar cada tipo de sumas de cuadrados
7.2 Cuadrados medios esperados
7.2.1 Cuadrados medios de tipo I
Este es el tipo de errores cuadrados por defecto en R, es el ideal para usarlo en modelos anidados
7.2.1.1 Ventajas de error tipo I
La suma de los cuadrados
7.2.1.2 Desventajas del error tipo I
El orden importa, no es igual poner y ~ A*B
que y ~ B*A
:
anova(lm(mpg ~ am*cyl, data = mtcars))
## Analysis of Variance Table
##
## Response: mpg
## Df Sum Sq Mean Sq F value Pr(>F)
## am 1 405.15 405.15 46.8919 1.932e-07 ***
## cyl 1 449.53 449.53 52.0289 7.503e-08 ***
## am:cyl 1 29.44 29.44 3.4073 0.07551 .
## Residuals 28 241.92 8.64
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
anova(lm(mpg ~ cyl*am, data = mtcars))
## Analysis of Variance Table
##
## Response: mpg
## Df Sum Sq Mean Sq F value Pr(>F)
## cyl 1 817.71 817.71 94.6416 1.761e-10 ***
## am 1 36.97 36.97 4.2791 0.04793 *
## cyl:am 1 29.44 29.44 3.4073 0.07551 .
## Residuals 28 241.92 8.64
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Esto es debido a que los errores se van calculando secuencialmente, entonces en el primer caso vemos cual es la variabilidad explicada por am, seguido de cuanto es explicado por cyl dado am y finalmente cuanto es explicado por la interacción dado am y cyl. Esto hace que se preste muy bien para un diseño anidado
7.2.1.3 Cuando usarlo
Diseños anidados
7.2.1.4 Cuando no usarlo
Para diseños factoriales
7.2.2 Cuadrados medios de tipo II
Este es el tipo de errores cuadrados por defecto en R,
7.2.3 Paquete EMSaov
El paquete de R
EMSaov (???) permite calcular de forma presisa y dependiente del diseño los cuadrados medios esperados, lo cual entre otras cosas depende de si las variables son fijas o aleatoreas, recordemos del modluo pasado que:
Variables fijas: Se espera que tengan una influencia predecible y sistemática en sobre lo que queremos explicar. Además usan todos los niveles de un factor (Ejemplo genero)
Variables aleatorias: Se espera que su influencia sea impredecible e idiosincratica. Además no se usan todos los niveles de un factor (todos los individuos)
A = c("a", "a", "a", "a", "b", "b", "b", "b", "b", "b", "b", "b")
B = c("x", "y", "x", "y", "x", "y", "x", "y", "x", "x", "x", "x")
C = c("l", "l", "m", "m", "l", "l", "m", "m", "l", "l", "l", "l")
response = c( 14, 30, 15, 35, 50, 51, 30, 32, 51, 55, 53, 55)
summary(aov(response ~ A + B + C + A:B + A:C + B:C))
## Df Sum Sq Mean Sq F value Pr(>F)
## A 1 1488.4 1488.4 357.687 7.61e-06 ***
## B 1 18.2 18.2 4.380 0.090576 .
## C 1 390.2 390.2 93.761 0.000199 ***
## A:B 1 278.7 278.7 66.972 0.000443 ***
## A:C 1 339.5 339.5 81.591 0.000278 ***
## B:C 1 8.5 8.5 2.044 0.212159
## Residuals 5 20.8 4.2
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
model = lm(response ~ A + B + C + A:B + A:C + B:C)
anova(model) # Type I tests
## Analysis of Variance Table
##
## Response: response
## Df Sum Sq Mean Sq F value Pr(>F)
## A 1 1488.37 1488.37 357.6869 7.614e-06 ***
## B 1 18.22 18.22 4.3798 0.0905765 .
## C 1 390.15 390.15 93.7610 0.0001995 ***
## A:B 1 278.68 278.68 66.9722 0.0004431 ***
## A:C 1 339.51 339.51 81.5909 0.0002778 ***
## B:C 1 8.51 8.51 2.0444 0.2121592
## Residuals 5 20.81 4.16
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
library(car)
Anova(model, type="II") # Type II tests
## Anova Table (Type II tests)
##
## Response: response
## Sum Sq Df F value Pr(>F)
## A 1022.01 1 245.6103 1.923e-05 ***
## B 131.25 1 31.5421 0.0024764 **
## C 278.68 1 66.9722 0.0004431 ***
## A:B 180.01 1 43.2593 0.0012194 **
## A:C 321.01 1 77.1445 0.0003174 ***
## B:C 8.51 1 2.0444 0.2121592
## Residuals 20.81 5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Anova(model, type="III")
## Anova Table (Type III tests)
##
## Response: response
## Sum Sq Df F value Pr(>F)
## (Intercept) 226.71 1 54.4832 0.0007175 ***
## A 1508.03 1 362.4099 7.371e-06 ***
## B 178.46 1 42.8885 0.0012435 **
## C 0.77 1 0.1854 0.6847216
## A:B 180.01 1 43.2593 0.0012194 **
## A:C 321.01 1 77.1445 0.0003174 ***
## B:C 8.51 1 2.0444 0.2121592
## Residuals 20.81 5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1