Saltar al contenido principal
LibreTexts Español

10.4: Comparando dos proporciones de población independientes

  • Page ID
    150848
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Al realizar una prueba de hipótesis que compare dos proporciones poblacionales independientes, deben estar presentes las siguientes características:

    1. Las dos muestras independientes son muestras aleatorias que son independientes.
    2. El número de éxitos es de al menos cinco, y el número de fracasos es de al menos cinco, para cada una de las muestras.
    3. La creciente literatura afirma que la población debe tener al menos diez o incluso quizás 20 veces el tamaño de la muestra. Esto evita que cada población sea sobremuestreada y cause resultados sesgados.

    Comparar dos proporciones, como comparar dos medias, es común. Si dos proporciones estimadas son diferentes, puede deberse a una diferencia en las poblaciones o puede deberse a la casualidad en el muestreo. Una prueba de hipótesis puede ayudar a determinar si una diferencia en las proporciones estimadas refleja una diferencia en las dos proporciones poblacionales.

    Al igual que en el caso de las diferencias en las medias muestrales, construimos una distribución muestral para las diferencias en las proporciones muestrales:\(\left(p_{A}^{\prime}-p_{B}^{\prime}\right)\) dónde\(p_{A}^{\prime}=X_{\frac{A}{n_{A}}}\) y\(p_{B}^{\prime}=X_{\frac{B}{n_{B}}}\) son las proporciones muestrales para los dos conjuntos de datos en cuestión. \(X_A\)y\(X_B\) son el número de éxitos en cada grupo de muestra respectivamente,\(n_A\) y\(n_B\) son los tamaños de muestra respectivos de los dos grupos. Nuevamente vamos a la Figura Central\(\PageIndex{5}\).

    Figura\(\PageIndex{5}\)

    Generalmente, la hipótesis nula permite probar una diferencia de un valor particular\(\delta_{0}\), tal como lo hicimos para el caso de las diferencias en las medias.

    \[H_{0} : p_{1}-p_{2}=\delta_{0}\nonumber\]

    \[H_{1} : p_{1}-p_{2} \neq \delta_{0}\nonumber\]

    Lo más común, sin embargo, es la prueba de que las dos proporciones son las mismas. Es decir,

    \[H_{0} : p_{\mathrm{A}}=p_{B}\nonumber\]

    \[H_{a} : p_{\mathrm{A}} \neq p_{B}\nonumber\]

    Para realizar la prueba, utilizamos una proporción agrupada,\(p_c\).

    \[\textbf{The pooled proportion is calculated as follows:}\nonumber\]

    \[p_{c}=\frac{x_{A}+x_{B}}{n_{A}+n_{B}}\nonumber\]

    \[\textbf{The test statistic (z-score) is:}\nonumber\]

    \[Z_{c}=\frac{\left(p_{A}^{\prime}-p_{B}^{\prime}\right)-\delta_{0}}{\sqrt{p_{c}\left(1-p_{c}\right)\left(\frac{1}{n_{A}}+\frac{1}{n_{B}}\right)}}\nonumber\]

    donde\(\delta_{0}\) está las diferencias hipotéticas entre las dos proporciones y p c es la varianza agrupada de la fórmula anterior.

    Ejemplo\(\PageIndex{6}\)

    Un banco ha adquirido recientemente una nueva sucursal y así tiene clientes en este nuevo territorio. Están interesados en la tasa de impago en su nuevo territorio. Desean probar la hipótesis de que la tasa de incumplimiento es diferente de su base de clientes actual. Muestrean 200 archivos en el área A, sus clientes actuales, y encuentran que 20 han incumplido. En el área B, los nuevos clientes, otra muestra de 200 expedientes muestra que 12 han incumplido sus préstamos. A un nivel de significancia del 10% ¿podemos decir que las tasas de incumplimiento son iguales o diferentes?

    Contestar

    Solución 10.6

    Esta es una prueba de proporciones. Sabemos esto porque la variable aleatoria subyacente es binaria, por defecto o no por defecto. Además, sabemos que es una prueba de diferencias en proporciones porque tenemos dos grupos de muestra, la base de clientes actual y la base de clientes recién adquirida. Que A y B sean los subíndices para los dos grupos de clientes. Entonces p A y p B son las dos proporciones poblacionales que deseamos probar.

    Variable aleatoria:

    \(P_{A}^{\prime}-P_{B}^{\prime}\)= diferencia en las proporciones de clientes que incumplieron en los dos grupos.

    \(H_{0} : p_{A}=p_{B}\)

    \(H_{a} : p_{A} \neq p_{B}\)

    Las palabras “es una diferencia” te dicen que la prueba es de dos colas.

    Distribución para la prueba: Dado que se trata de una prueba de dos proporciones binomiales de población, la distribución es normal:

    \(p_{c}=\frac{x_{A}+x_{B}}{n_{A}+n_{B}}=\frac{20+12}{200+200}=0.08\)\(1-p_{c}=0.92\)

    \(\left(p^{\prime} A-p^{\prime} B\right)=0.04\)sigue una distribución normal aproximada.

    Proporción estimada para el grupo A:\(p^{\prime}_{A}=\frac{x_{A}}{n_{A}}=\frac{20}{200}=0.1\)

    Proporción estimada para el grupo B:\(p^{\prime}_{B}=\frac{x_{B}}{n_{B}}=\frac{12}{200}=0.06\)

    La diferencia estimada entre los dos grupos es:\(p_{A}^{\prime}-p_{B}^{\prime}=0.1-0.06=0.04\).

    Curva de distribución normal de la diferencia en los porcentajes de pacientes adultos que no reaccionan a los medicamentos A y B después de 30 minutos. La media es igual a cero, y los valores -0.04, 0 y 0.04 están etiquetados en el eje horizontal. Dos líneas verticales se extienden desde -0.04 y 0.04 hasta la curva. La región a la izquierda de -0.04 y la región a la derecha de 0.04 están sombreadas cada una para representar 1/2 (valor p) = 0.0702.

    Figura\(\PageIndex{6}\)

    \[Z_{c}=\frac{\left(\mathrm{P}_{A}^{\prime}-\mathrm{P}_{B}^{\prime}\right)-\delta_{0}}{P_{c}\left(1-P_{c}\right)\left(\frac{1}{n_{A}}+\frac{1}{n_{B}}\right)}=0.54\nonumber\]

    El estadístico de prueba calculado es .54 y no está en la cola de la distribución.

    Tomar una decisión: Dado que el estadístico de prueba de cálculo no está en la cola de la distribución no podemos rechazar\(H_0\).

    Conclusión: A un nivel de significancia de 1%, a partir de los datos de la muestra, no hay evidencia suficiente para concluir que existe una diferencia entre las proporciones de clientes que incumplieron en los dos grupos.

    Ejercicio\(\PageIndex{6}\)

    Se están probando dos tipos de válvulas para determinar si hay una diferencia en las tolerancias de presión. Quince de una muestra aleatoria de 100 de Válvula A agrietada bajo 4,500 psi. Seis de una muestra aleatoria de 100 de la Válvula B agrietada bajo 4,500 psi. Prueba a un nivel de significancia del 5%.


    This page titled 10.4: Comparando dos proporciones de población independientes is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.