9.4: Distribución necesaria para las pruebas de hipótesis

Última actualización
Guardar como PDF

Page ID: 153346

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Anteriormente en el curso, discutimos las distribuciones de muestreo. Distribuciones particulares están asociadas con pruebas de hipótesis. Realizar pruebas de una media poblacional utilizando una distribución normal o una\(t\) distribución de Student. (Recuerde, use una\(t\) distribución de Student cuando se desconozca la desviación estándar de la población y la distribución de la media muestral sea aproximadamente normal). Realizamos pruebas de una proporción poblacional utilizando una distribución normal (generalmente\(n\) es grande o el tamaño de la muestra es grande).

Si estás probando una sola media poblacional, la distribución para la prueba es para medios:

\[\bar{X} - N\left(\mu_{x}, \frac{\sigma_{x}}{\sqrt{n}}\right)\]

\[t_{df}\]

El parámetro poblacional es\(\mu\). El valor estimado (estimación puntual) para\(\mu\) es\(\bar{x}\), la media muestral.

Si estás probando una sola proporción de población, la distribución para la prueba es para proporciones o porcentajes:

\[P' - N\left(p, \sqrt{\frac{p-q}{n}}\right)\]

El parámetro poblacional es\(p\). El valor estimado (estimación puntual) para\(p\) es\(p′\). \(p' = \frac{x}{n}\)donde\(x\) está el número de éxitos y n es el tamaño de la muestra.

Supuestos

Cuando se realiza una prueba de hipótesis de una sola media poblacional\(\mu\) utilizando una\(t\) distribución de Student (a menudo llamada\(t\) prueba), existen supuestos fundamentales que deben cumplirse para que la prueba funcione correctamente. Tus datos deben ser una simple muestra aleatoria que proviene de una población que está aproximadamente distribuida normalmente. Se utiliza la desviación estándar de la muestra para aproximar la desviación estándar de la población. (Obsérvese que si el tamaño de la muestra es suficientemente grande, una\(t\) prueba funcionará aunque la población no esté aproximadamente distribuida normalmente).

Cuando se realiza una prueba de hipótesis de una sola media poblacional\(\mu\) usando una distribución normal (a menudo llamada\(z\) -test), se toma una muestra aleatoria simple de la población. La población que estás probando normalmente está distribuida o el tamaño de tu muestra es suficientemente grande. Se conoce el valor de la desviación estándar poblacional que, en realidad, rara vez se conoce.

Cuando se realiza una prueba de hipótesis de una sola proporción de población\(p\), se toma una muestra aleatoria simple de la población. Debe cumplir con las condiciones para una distribución binomial que son: hay un cierto número\(n\) de ensayos independientes, los resultados de cualquier ensayo son éxito o fracaso, y cada ensayo tiene la misma probabilidad de éxito\(p\). La forma de la distribución binomial debe ser similar a la forma de la distribución normal. Para garantizar esto, las cantidades\(np\) y\(nq\) deben ser tanto mayores a cinco\((np > 5\) y\(nq > 5)\). Entonces la distribución binomial de una proporción muestral (estimada) puede aproximarse por la distribución normal con\(\mu = p\) y\(\sigma = \sqrt{\frac{pq}{n}}\). Recuerda eso\(q = 1 – p\).

Resumen

Para que los resultados de una prueba de hipótesis sean generalizados a una población, se deben cumplir ciertos requisitos.

Al realizar pruebas para una sola población media:

Se debe utilizar una\(t\) prueba de Student si los datos provienen de una muestra simple, aleatoria y la población está aproximadamente distribuida normalmente, o el tamaño de la muestra es grande, con una desviación estándar desconocida.
La prueba normal funcionará si los datos provienen de una muestra simple, aleatoria y la población está aproximadamente distribuida normalmente, o el tamaño de la muestra es grande, con una desviación estándar conocida.

Al probar una sola proporción de población, utilice una prueba normal para una sola proporción de población si los datos provienen de una muestra simple y aleatoria, llenan los requisitos para una distribución binomial, y el número medio de éxitos y el número medio de fallas satisfacen las condiciones:\(np > 5\) y\(nq > 5\) donde\(n\) es el tamaño de la muestra,\(p\) es la probabilidad de éxito, y\(q\) es la probabilidad de un fracaso.

Revisión de Fórmula

Si no hay dado preconcebido\(\alpha\), entonces usa\(\alpha = 0.05\).

Tipos de pruebas de hipótesis

Media poblacional única, varianza poblacional conocida (o desviación estándar): Prueba normal.
Media de población única, varianza poblacional desconocida (o desviación estándar): \(t\)prueba de Student.
Proporción de población única: Prueba normal.
Para una sola media poblacional, podemos usar una distribución normal con la siguiente media y desviación estándar. Medios:\(\mu = \mu_{\bar{x}}\) y\(\\sigma_{\bar{x}} = \frac{\sigma_{x}}{\sqrt{n}}\)
Una sola proporción poblacional, podemos usar una distribución normal con la siguiente media y desviación estándar. Proporciones:\(\mu = p\) y\(\sigma = \sqrt{\frac{pq}{n}}\).

Glosario

Distribución binomial: una variable aleatoria discreta (RV) que surge de los ensayos de Bernoulli. Hay un número fijo,\(n\), de juicios independientes. “Independiente” significa que el resultado de cualquier ensayo (por ejemplo, el ensayo 1) no afecta los resultados de los siguientes ensayos, y todos los ensayos se realizan en las mismas condiciones. En estas circunstancias, el binomio RV XY se define como el número de éxitos en los\(n\) ensayos. La notación es:\(X \sim B(n, p) \mu = np\) y la desviación estándar es\(\sigma = \sqrt{npq}\). La probabilidad de exactamente\(x\) éxitos en los\(n\) ensayos es\(P(X = x) = \binom{n}{x} p^{x}q^{n-x}\).

Distribución Normal: una variable aleatoria continua (RV) con pdf\(f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{\frac{-(x-\mu)^{2}}{2\sigma^{2}}}\), donde\(\mu\) es la media de la distribución, y\(\sigma\) es la desviación estándar, notación:\(X \sim N(\mu, \sigma)\). Si\(\mu = 0\) y\(\sigma = 1\), el RV se llama la distribución normal estándar.

Desviación estándar: un número que es igual a la raíz cuadrada de la varianza y mide qué tan lejos están los valores de los datos de su media; notación:\(s\) para la desviación estándar de la muestra y\(\sigma\) para la desviación estándar de la población.

T -Distribución de Student

investigado y reportado por William S. Gossett en 1908 y publicado bajo el seudónimo de Student. Las principales características de la variable aleatoria (RV) son:

Es continuo y asume cualquier valor real.
El pdf es simétrico sobre su media de cero. Sin embargo, está más extendido y más plano en el ápice que en la distribución normal.
Se acerca a la distribución normal estándar a medida que\(n\) se hace más grande.
Hay una “familia” de\(t\) distribuciones: cada representante de la familia está completamente definido por el número de grados de libertad que es uno menos que el número de elementos de datos.