Vicerrectoría Académica
Dirección Nacional de Innovación Académica

Capítulo 3 : INFERENCIA ESTADÍSTICA

Inferencia sobre la diferencia de proporciones poblacionales

Supóngase que se tiene dos poblaciones independientes con proporciones desconocidas $P_{1}$ y $P_{2}$, y varianzas conocidas $P_{1}Q_{1}$ y $P_{2}Q_{2}$, respectivamente. Se desea encontrar un intervalo de confianza del $(1-\alpha )100\%$ para la diferencia de las proporciones $P_{1}-P_{2}.$

Sean MATH una muestra aleatoria de $n_{1}$ observaciones tomadas de la primera población y MATH una muestra aleatoria de $n_{2}$ observaciones tomadas de la segunda población. Si $\widehat{p}_{1}$ y $\widehat{p}_{2}$ son las proporciones muestrales, la estadística MATH es un estimador puntual de $P_{1}-P_{2}$. La variable aleatoria

MATH

tiene una distribución normal estándar si las dos poblaciones son normales, o es aproximadamente normal estándar si se cumplen las condiciones del teorema del límite central, respectivamente.

limitecentral.jpg

Esto implica que:

MATH

MATH

La anterior expresión se puede expresar como:

MATH

Por lo tanto, un intervalo de confianza para la diferencia entre $P_{1}-P_{2}$ se obtiene:

MATH

Con el anterior intervalo se puede también probar la hipótesis nula MATH versus la alternativa MATH, donde se rechaza la hipótesis nula si el valor $D$ cae fuera de este intervalo de confianza. Además, para probar esta hipótesis se puede hacer uso del estadístico:

MATH

el cual rechaza $H_{0}$ si MATH

Ejemplo

En una muestra aleatoria de 85 soportes para el cigüeñal de un motor de automóvil, 10 tienen un terminado que es más rugoso de los que las especificaciones permiten. Supóngase que se hace una modificación al proceso de acabado de la superficie y que, de manera subsecuente, se toma una segunda muestra de 85 ejes. El número de ejes defectuosos en esta segunda muestra es de 8. Obtengase un intervalo de confianza del 95% para la diferencia en la proporción de los soportes defectuosos producidos por ambos procesos y pruebe la hipótesis de que la proporción de soportes defectuosos producidos por ambos procesos es la misma.

Solución.

De lo observado en las muestras se obtiene que MATH y MATH. El interés es la diferencia en la proporción de los soportes defectuosos entre $P_{1}-P_{2}$:

$H_{0}:P_{1}=P_{2}$ $vs$ MATH

Un intervalo de confianza del 95% para la diferencia en la resistencia a la tensión promedio es:

MATH

MATH

MATH

MATH

Este intervalo de confianza incluye al cero, así que, con base en los datos muestrales, parece poco probable que los cambios hechos en el proceso de acabado de la superficie hayan reducido el número de soportes defectuosos para cigüeñal producidos por el proceso.

Si se utiliza el estadístico presentado en (1), se encuentra:

MATH

Rechazandose tambien la hipótesis nula, por lo tanto se concluye que los cambios hechos en el proceso de acabado de la superficie no han reducido el número de soportes defectuosos para cigüeñal producidos por el proceso.

Ejercicios

Ejercicio 1 - 7.47 Montgomery  

Se analiza la fracción de productos defectuosos producidos por dos lineas de producción. Una muestra aleatoria de 100 unidades provenientes de la línea 1 contiene 10 que son defectuosas, mientras que una muestra aleatoria de 120 unidades de la línea 2 tiene 25 que son defectuosas. Encuentre un intervalo de confianza del 99% para la veradadera diferencia en fracciones de productos defectuosos producidos por las dos líneas.

Ejercicio 2

Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra la gripe. Se administra la vacuna a una muestra aleatoria de 3000 sujetos, y de este grupo 13 contraen gripa. Como grupo de control se seleccionan al azar 2500 sujetos, a los cuales no se les administra la vacuna, y de este grupo 170 contraen la gripe. Construya un intervalo de confianza del 95% para la diferencia entre proporciones. ¿ La vacuna contra la gripe es efectiva?

Ejercicio 3

Una muestra aleatoria de 5726 números telefónicos de cierta región tomada en marzo de 1992 dio 1105 que no estaban en el directorio, y un año después, una muestra de 5384 dio 980 números que no estaban en el directorio. Pruebe la hipótesis a un nivel de significancia del 10% para ver si hay una diferencia en las verdaderas proporciones de números que no aparecen en el directorio entre los dos años.

 

Inferencia sobre el cociente de varianzas

Supóngase que se tiene interés en dos poblacionales normales independientes, donde las medias y varianzas de la población, MATH y$\ \sigma _{2}^{2}$, son desconocidas. Se desea probar la hipótesis sobre la igualdad de las dos varianzas, MATH, por ejemplo. Supóngase que para ello se tienen disponibles dos muestras aleatorias; una de tamaño $n_{1}$ tomada de la población 1, y otra de tamaño $n_{2}$ provenientes de la población 2, y sean $S_{1}^{2}$ y $S_{2}^{2}$ las varianzas muestrales. Para probar la hipótesis bilateral

MATH
MATH

Recuerde que:

MATH

Además, la cola inferior de una F se calcula mediante

MATH

Por ejemplo, MATH

Para construir un intervalo de confianza para MATH, nótese que:


intervaloconfianza14.jpg

MATH

MATH

La anterior expresión se puede expresar como:

MATH

Con el anterior intervalo se puede también probar la hipótesis nula MATH versus la alternativa MATH, donde se rechaza la hipótesis nula si el valor $1$ cae fuera de este intervalo de confianza. Además, para probar esta hipótesis se puede hacer uso también del estadístico:

MATH

el cual rechaza $H_{0}$ si MATH o si MATH.

Ejemplos

Una empresa ha estado experimentando con dos disposiciones físicas distintas de su línea de ensamble.

MATH

¿ Cuál de las dos disposiciones recomendaría usted?. Usando: a) Un intervalo de confianza del 95%; b) Una prueba de hipótesis bilateral con regla de decisión determinada por la región de rechazo (use un nivel de significancia del 5%);

c) Una prueba de hipótesis bilateral con regla de decisión determinada por el valor p.

Solución.

a) MATH y MATH Luego reemplazando en el intervalo de confianza obtenido para la razón de varianzas, se obtiene que:

MATH

MATH

Puesto que todos los valores en el intervalo (0.1634; 0.9176) son menores de 1, la varianza de la línea de ensamble 2 es más grande que la varianza de la línea 1.

b) Para las siguientes hipótesis,

MATH
MATH

el estadístico de prueba correspondiente es:

MATH

Por lo tanto, se rechaza $H_{0},$puesto que MATH

c)El valor p es igual a P(MATH Puesto que el valor p es menor que 5%, H$_{0}$ es rechazada.

Ejercicios

Ejercicio 1 - 8.68 Montgomery  

Dos compañías se compuestos químicos pueden surtir materia prima. La concentración de un elemento en particular en este material es importante. La concentración promedio de ambos proveedores es la misma, pero se sospecha que la variabilidad en la concentración puede diferir entre las dos compañias. La desviación estándar de la concentración en una muestra aleatoria de tamaño 15 lotes producidos por la compañía 1 es de 4.7 gr/l, mientras que para la compañía 2, una muestra de 20 lotes proporciona una desviación estándar de 5.8 gr/l. ¿ Existe alguna evidencia para concluir que las varianzas de las dos poblaciones son diferentes? Utilice un nivel de significancia del 5%. Encuentre el valor p de esta prueba.

Ejercicio 5

Los niños con neurosis liminar y ligeramente retardados, que asisten a una clínica de evaluación de desarrollo en un hospital, se dividieron en dos grupos con base en presencia o ausencia de un probable factor etiológico que produce el retardo mental. se midió la concentración de plomo en la sangre de cada niño, y se obtuvieron los siguientes datos:

MATH

¿ Indican los datos alguna diferencia en la magnitud de variabilidad de la concentración de plomo en la sangre para los dos tipos de niños?

Utilice un nivel de sinificancia del 10%.

 

Cómo citar este material

La cita para este recurso está presentada en formato APA. Cópiela para su reutilización

Mendoza, H, Bautista, G. (2002). Probabilidad y Estadística. Universidad Nacional de Colombia, http://www.virtual.unal.edu.co/cursos/ciencias/2001065/. Licencia: Creative Commons BY-NC-ND.