Práctico 7 Tipos de errores cuadrados

Para este capitulo necesitas tener instalado el paquete car, también ayuda tener el paquete broom. Esta clase del curso puede también ser seguida en este link

7.1 Objetivos del práctico

  • Entender la diferencia entre los distintos tipos de sumas de cuadrado
  • Saber los pro y los contras de cada uno
  • Entender cuando usar cada tipo de sumas de cuadrados

7.2 Cuadrados medios esperados

7.2.1 Cuadrados medios de tipo I

Este es el tipo de errores cuadrados por defecto en R, es el ideal para usarlo en modelos anidados

7.2.1.1 Ventajas de error tipo I

La suma de los cuadrados

7.2.1.2 Desventajas del error tipo I

El orden importa, no es igual poner y ~ A*B que y ~ B*A:

anova(lm(mpg ~ am*cyl, data = mtcars))
## Analysis of Variance Table
## 
## Response: mpg
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## am         1 405.15  405.15 46.8919 1.932e-07 ***
## cyl        1 449.53  449.53 52.0289 7.503e-08 ***
## am:cyl     1  29.44   29.44  3.4073   0.07551 .  
## Residuals 28 241.92    8.64                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
anova(lm(mpg ~ cyl*am, data = mtcars))
## Analysis of Variance Table
## 
## Response: mpg
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## cyl        1 817.71  817.71 94.6416 1.761e-10 ***
## am         1  36.97   36.97  4.2791   0.04793 *  
## cyl:am     1  29.44   29.44  3.4073   0.07551 .  
## Residuals 28 241.92    8.64                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Esto es debido a que los errores se van calculando secuencialmente, entonces en el primer caso vemos cual es la variabilidad explicada por am, seguido de cuanto es explicado por cyl dado am y finalmente cuanto es explicado por la interacción dado am y cyl. Esto hace que se preste muy bien para un diseño anidado

7.2.1.3 Cuando usarlo

Diseños anidados

7.2.1.4 Cuando no usarlo

Para diseños factoriales

7.2.2 Cuadrados medios de tipo II

Este es el tipo de errores cuadrados por defecto en R,

7.2.3 Paquete EMSaov

El paquete de R EMSaov (???) permite calcular de forma presisa y dependiente del diseño los cuadrados medios esperados, lo cual entre otras cosas depende de si las variables son fijas o aleatoreas, recordemos del modluo pasado que:

  • Variables fijas: Se espera que tengan una influencia predecible y sistemática en sobre lo que queremos explicar. Además usan todos los niveles de un factor (Ejemplo genero)

  • Variables aleatorias: Se espera que su influencia sea impredecible e idiosincratica. Además no se usan todos los niveles de un factor (todos los individuos)

A        = c("a", "a", "a", "a", "b", "b", "b", "b", "b", "b", "b", "b")
B        = c("x", "y", "x", "y", "x", "y", "x", "y", "x", "x", "x", "x")
C        = c("l", "l", "m", "m", "l", "l", "m", "m", "l", "l", "l", "l")
response = c( 14,  30,  15,  35,  50,  51,  30,  32,  51,  55,  53,  55)

summary(aov(response ~ A + B + C + A:B + A:C + B:C))
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## A            1 1488.4  1488.4 357.687 7.61e-06 ***
## B            1   18.2    18.2   4.380 0.090576 .  
## C            1  390.2   390.2  93.761 0.000199 ***
## A:B          1  278.7   278.7  66.972 0.000443 ***
## A:C          1  339.5   339.5  81.591 0.000278 ***
## B:C          1    8.5     8.5   2.044 0.212159    
## Residuals    5   20.8     4.2                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
model = lm(response ~ A + B + C + A:B + A:C + B:C)

anova(model)              # Type I tests
## Analysis of Variance Table
## 
## Response: response
##           Df  Sum Sq Mean Sq  F value    Pr(>F)    
## A          1 1488.37 1488.37 357.6869 7.614e-06 ***
## B          1   18.22   18.22   4.3798 0.0905765 .  
## C          1  390.15  390.15  93.7610 0.0001995 ***
## A:B        1  278.68  278.68  66.9722 0.0004431 ***
## A:C        1  339.51  339.51  81.5909 0.0002778 ***
## B:C        1    8.51    8.51   2.0444 0.2121592    
## Residuals  5   20.81    4.16                       
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
library(car)

Anova(model, type="II")   # Type II tests
## Anova Table (Type II tests)
## 
## Response: response
##            Sum Sq Df  F value    Pr(>F)    
## A         1022.01  1 245.6103 1.923e-05 ***
## B          131.25  1  31.5421 0.0024764 ** 
## C          278.68  1  66.9722 0.0004431 ***
## A:B        180.01  1  43.2593 0.0012194 ** 
## A:C        321.01  1  77.1445 0.0003174 ***
## B:C          8.51  1   2.0444 0.2121592    
## Residuals   20.81  5                       
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Anova(model, type="III")
## Anova Table (Type III tests)
## 
## Response: response
##              Sum Sq Df  F value    Pr(>F)    
## (Intercept)  226.71  1  54.4832 0.0007175 ***
## A           1508.03  1 362.4099 7.371e-06 ***
## B            178.46  1  42.8885 0.0012435 ** 
## C              0.77  1   0.1854 0.6847216    
## A:B          180.01  1  43.2593 0.0012194 ** 
## A:C          321.01  1  77.1445 0.0003174 ***
## B:C            8.51  1   2.0444 0.2121592    
## Residuals     20.81  5                       
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1