36 0 799KB
PARCIAL 1 DE DISEÑO DE EXPERIMENTOS Fecha: 20 de Agosto de 2016 Estudiante: STARLIS MARTES MASS 4. Una compañía distribuidora ubicada en los suburbios está interesada en estudiar la
diferencia en costos (tiempo y gasolina) entre las cuatro rutas (A,B,C Y D) que llevan a la zona comercial, más importante para ellos, en el otro extremo de la cuidad. Deciden correr un experimento en cuadro grecolatino controlando los factores de bloque chofer, marca de vehículo (𝛼, 𝛽, 𝛾, 𝛿) y día de la semana. El experimento se repite en dos semanas diferentes, en las cuales no hay festivos ni quincenas. Los costos observados en pesos se muestran en la siguiente tabla:
Chofer Carlos Enrique Genaro Luis
Lunes 825 (D,𝛼) 750 650 (A,𝛾) 725 700 (C,𝛽) 675 475 (B,𝛿) 480
Día Martes 585 (C,𝛾) 610 540 (B,𝛼) 560 650 (D,𝛿) 740 560 (A,𝛽) 615
Miércoles 550 (B,𝛽) 580 580 (C,𝛿) 635 635 (A,𝛼) 540 650 (D,𝛾) 725
Jueves 580 (A,𝛿) 650 850 (D,𝛽) 770 450 (B,𝛾) 550 670 (C,𝛼) 730
a) Haga el análisis de varianza de este experimento Análisis de Varianza para COSTOS - Suma de Cuadrados Tipo III Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P EFECTOS PRINCIPALES A:SUBURBIOS 200221, 3 66740,4 29,20 0,0000 B:CHOFER 13164,8 3 4388,28 1,92 0,1607 C:MARCA DEL VEHICULO 22414,8 3 7471,61 3,27 0,0439 D:DIA DE LA SEMANA 18902,3 3 6300,78 2,76 0,0708 RESIDUOS 43433,6 19 2285,98 TOTAL (CORREGIDO) 298137, 31 El StatAdvisor La tabla ANOVA descompone la variabilidad de COSTOS en contribuciones debidas a varios factores. Puesto que se ha escogido la suma de cuadrados Tipo III (por omisión), la contribución de cada factor se mide eliminando los efectos de los demás factores. Los valores-P prueban la significancia estadística de cada uno de los factores. Puesto que 2 valores-P son menores que 0,05, estos factores tienen un efecto estadísticamente significativo sobre COSTOS con un 95,0% de nivel de confianza.
LOS FACTORES SUBURBIOS Y MARCA DEL VEHICULO TIENEN UN EFECTO SIGNIFICATIVO SOBRE COSTOS YA QUE EL VALOR-P ES MENOR QUE 0.05.
b) Realice las pruebas de comparaciones múltiples para los factores significativos Pruebas de Múltiple Rangos para COSTOS por SUBURBIOS
SUBURBIOS B A C D Contraste A-B A-C A-D B-C B-D C-D
Método: 95,0 porcentaje LSD Casos Media LS Sigma LS 8 523,125 16,9041 8 619,375 16,9041 8 648,125 16,9041 8 745,0 16,9041
Grupos Homogéneos X X X X
Sig. *
Diferencia +/- Límites 96,25 50,0358 -28,75 50,0358 * -125,625 50,0358 * -125,0 50,0358 * -221,875 50,0358 * -96,875 50,0358 * indica una diferencia significativa.
Esta tabla aplica un procedimiento de comparación múltiple para determinar cuáles medias son significativamente diferentes de otras. La mitad inferior de la salida muestra las diferencias estimadas entre cada par de medias. El asterisco que se encuentra al lado de los 5 pares indica que estos pares muestran diferencias estadísticamente significativas con un nivel del 95,0% de confianza. En la parte superior de la página, se han identificado 3 grupos homogéneos según la alineación de las X's en columnas. No existen diferencias estadísticamente significativas entre aquellos niveles que compartan una misma columna de X's. El método empleado actualmente para discriminar entre las medias es el procedimiento de diferencia mínima significativa (LSD) de Fisher. Con este método hay un riesgo del 5,0% al decir que cada par de medias es significativamente diferente, cuando la diferencia real es igual a 0. SE NOTA QUE LAS RUTAS B Y D SON DIFERENTES Y LAS RUTAS A Y C TIENEN CIERTA SIMILITUD.
c) ¿Cuál es la mejor ruta? ¿Cuál es la peor? LA RUTA B YA QUE EN ELLA SE INVIERTE MENOR TIEMPO Y SE GASTA MENOS GASOLINA, O SEA SUS COSTOS SON LOS MENORES ENTRE LAS 4 RUTAS. LA PEOR ES LA RUTA ES LA D YA QUE GASTA MAYOR TIEMPO Y MAS GASOLINA, ES DECIR EL COSTO ES MAYOR. TODO ESTO SE PUEDE VER EN EL ANALISIS DE MULTIPLES RANGOS PARA COSTO QUE ES LA VARIABLE QUE NOS PIDEN ANALIZAR. d) ¿Por qué se evitaron días festivos y quincenas en el experimento? ¿Cuáles otros aspectos se tenían que tomar en cuenta? OTROS ASPECTOS QUE SE PODRIAN TENER EN CUENTA SERIAN LAS HORAS PICOS YA QUE SE SABE QUE ALLI EL TIEMPO SERA MAYOR EN CADA UNA DE LAS RUTAS. e) Verifique los supuestos del modelo.
SnapStat: Análisis de Una Muestra
Histograma
Datos/Variable: RESIDUOS Recuento = 32 Promedio = 0,000003125 Desv iación Estándar = 37,4311 Coeficiente de Variación = 1,1978E9% Mínimo = -63,2813 Máximo = 72,9688 Rango = 136,25 Sesgo Estandarizado = 0,145562 Curtosis Estandarizada = -0,9031
5
frecuencia
4 3 2 1 0 -80
-40
0 40 RESIDUOS
80
Gráfico de Caj a y Bigotes Interv alos de confianza del 95% Media: 0,000003125 +/- 13,4954 [-13,4954, 13,4954] Sigma: [30,0086, 49,7639] Diagnósticos Valor-P de Shapiro-Wilks = 0,5515 Autocorrelación en Retraso 1 = -0,0366226 +/- 0,346477
-70
-40
-10 20 RESIDUOS
50
80
Gráfico Secuencias Cronológicas 80
Gráfico de Probabilidad Normal 99,9 99 95
porcentaje
RESIDUOS
50 20
-10
80 50 20 5
-40
1 -70
0,1 0
10
20 Fila
30
40
-70
-40
-10 20 RESIDUOS
50
80
SEGÚN ESTE ANALISIS Y OBSERVANDO EL VALOR-P DE SHAPIRO WILKS QUE ES 0.5515 ES MAYOR A 0.05 POR LO CUAL EXISTE NORMALIDAD ENTRE LOS DATOS.
Tabla ANOVA para RESIDUOS por SUBURBIOS
Fuente Entre grupos Intra grupos Total (Corr.)
Suma de Cuadrados 3,0559E-10 43433,7 43433,7
Gl 3 28 31
Cuadrado Medio 1,01863E-10 1551,2
Razón-F 0,00
Valor-P 1,0000
La tabla ANOVA descompone la varianza de los datos en dos componentes: un componente entre-grupos y un componente dentro-de-grupos. La razón-F, que en este caso es igual a 6,56674E-14, es el cociente entre el estimado entre-grupos y el estimado dentro-de-grupos. Puesto que el valor-P de la razón-F es mayor o igual que 0,05, no existe una diferencia estadísticamente significativa entre las medias de las 4 variables con un nivel del 95,0% de confianza. Verificación de Varianza Prueba Valor-P Levene's 1,63343 0,204046 Comparación A/B A/C A/D B/C B/D C/D
Sigma1 44,2482 44,2482 44,2482 33,9754 33,9754 30,1314
Sigma2 33,9754 30,1314 46,7406 30,1314 46,7406 46,7406
F-Ratio 1,69614 2,15652 0,896193 1,27143 0,528372 0,415574
P-Valor 0,5024 0,3321 0,8888 0,7594 0,4191 0,2694
Los estadísticos mostrados en esta tabla evalúan la hipótesis nula de que las desviaciones estándar dentro de cada una de las 4 columnas son iguales. De particular interés es el valor-P. Puesto que el valor-P es mayor o igual que 0,05, no existe una diferencia estadísticamente significativa entre las desviaciones estándar, con un nivel del 95,0% de confianza. La tabla también muestra una comparación de las desviaciones típicas para cada par de muestras. P-valores por debajo de 0.05, de los cuales hay 0, indican una diferencia estadísticamente significativa entre las dos sigmas al 5% de nivel de significación.
COMO EL VALOR-P ES MAYOR A 0.05 SE ENTIENDE QUE NO HAY DIFERENCIA ENTRE LAS VARIABLES OBSERVADAS.
1. Se pide a cuatro químicos que determinen el porcentaje de alcohol metílico con cierto compuesto químico. Cada químico hace tres determinaciones y los resultados son los siguientes: (Utilizar α =0.05)
1 84,99 84,04 84,38
Químico 2 3 85,15 84,72 85,13 84,48 84,88 85,16
4 84,20 84,10 84,55
a) Especifique el nombre del diseño. Diseño totalmente aleatorizado b) Escriba la hipótesis para probar la igualdad de medias y el modelo estadístico.
Ho: µ = µ (igualdad de medias)
H1 µ = µ (diferencia de medias)
c) Realice el análisis adecuado para probar la hipótesis e intérprete los resultados Tabla ANOVA – QUIMICO Fuente
Suma de Cuadrados 1,04457
Gl
Cuadrado Medio 0,348189
Razón-F
Valor-P
Entre 3 3,25 0,0813 grupos Intra grupos 0,8582 8 0,107275 Total (Corr.) 1,90277 11 La tabla ANOVA descompone la varianza de ALC en dos componentes: un componente entregrupos y un componente dentro-de-grupos. La razón-F, que en este caso es igual a 3,24576, es el cociente entre el estimado entre-grupos y el estimado dentro-de-grupos. Puesto que el valor-P de la razón-F es mayor o igual que 0,05, no existe una diferencia estadísticamente significativa entre la media de ALC entre un nivel de QUIMICO y otro, con un nivel del 95,0% de confianza . Como el valor-p es mayor a 0.05 se dice que no hay diferencia significativa entre la media de ALCOHOL y el nivel de químico.
d) ¿los químicos difieren significativamente? Teniendo en cuenta el ANOVA anterior los químicos no difieren e) Si el químico 2 es un empleado nuevo, construir un conjunto razonable de contrastes ortogonales que podrían haberse usado al principio del experimento Tabla de Medias para ALC por QUIMICO con intervalos de confianza del 95,0%
QUIMICO Caso Media s 1 3 84,47 2 3 85,053 3 3 3 84,786 7 4 3 84,283 3 Total 12 84,648 3
Error Est. (s agrupada) 0,189099 0,189099
Límite Inferior 84,1617 84,745
Límite Superior 84,7783 85,3617
0,189099
84,4783
85,095
0,189099
83,975
84,5917
ES NOTABLE QUE EL QUIMICO N. 2 PRESENTA UN RENDIMIENTO SUPERIOR A LOS OTROS 3, AUNQUE NO EXISTAN DIFERNECIAS SIGNIFICATIVAS.
Si el químico 2 es un empleado nuevo, construir un conjunto razonable de contrastes ortogonales que podrían haberse usado al principio del experimento Hipótesis 𝐻0 :
I.
Contraste
𝜇1 = 𝜇2
𝐶1 = 𝑦1 − 𝑦2
𝐻0 : 𝜇1 + 𝜇3 = 𝜇4
𝐶2 = 𝑦1 + 𝑦3 − 𝑦4
𝐻0 : 𝜇1 = 𝜇3
𝐶3 = −𝑦1 + 𝑦3
A continuación se muestran para un diseño en bloque al azar
Tratamiento A B C Total
1 13 16 5 Y•1=
2 22 24 4 Y•2=
Bloque 3 18 17 1 Y•3=
4 39 44 22 Y•4=
Total Y1•= Y2•= Y3•= Y••=
a) Complete las sumas totales que se piden en la tabla anterior TRATAMIENTO A B C TOTAL
1 2 13 22 16 24 5 4 450 1076
3 4 TOTAL PROMEDIOS SUMA DE CUADRADOS 18 39 92 23 2498 17 44 101 25,25 3057 1 22 32 8 526 614 3941 225 6081
b) Calcule la suma de los cuadrados correspondientes; SCTRAT, SCB, SCT, y SCE. c) Obtenga la tabla de análisis de varianza. d) Obtenga la diferencia mínima significativa (LSD) para comparar tratamientos en este diseño. EL RESTO ADJUNTO EN EXCEL