Saltar al contenido principal
LibreTexts Español

2: Obtención de pruebas útiles

  • Page ID
    150470
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Un papel primordial de la estadística es usar evidencia de poblaciones estocásticas para mejorar nuestra comprensión del mundo. Decidir qué pruebas se recogerán es una parte esencial del proceso. El diseño de investigación es aquella porción del proceso estadístico en la que se realiza la planeación para que las conclusiones se extraigan con confianza y puedan apoyarse bajo escrutinio.

    Hay tres diseños de investigación que exploraremos en este capítulo, estudios observacionales, experimentos observacionales y experimentos manipuladores. El tipo de investigación que se realiza depende del objetivo de la investigación. En los casos en que el objetivo es comprender una población o comparar poblaciones, es apropiado realizar estudios observacionales. En los casos en los que queremos determinar si existe una relación causal entre dos variables, realizamos un experimento. Una relación causal (relaciones de causa y efecto) implica la existencia de dos variables. La variable que es la causa debe suceder primero. La primera variable se llama una variable explicativa, la variable que se ve afectada es una variable de respuesta.

    En experimentos, la variable explicativa es un tratamiento o intervención que se impone a personas o elementos de una población. De los dos experimentos, observacional y manipulador, este último es mejor para mostrar una relación causal. En experimentos manipuladores el investigador puede asignar aleatoriamente el tratamiento o intervención mientras que para los experimentos observacionales, el tratamiento o intervención es impuesto por alguien que no sea el investigador.

    Antes de aclarar cada uno de estos diseños de investigación, algunos ejemplos podrían ser útiles.

    Ejemplos de Estudios Observacionales

    • Un investigador podría realizar una encuesta a estadounidenses para comparar la proporción de demócratas que apoyan los esfuerzos para reducir las emisiones de carbono con la proporción de republicanos que quieren reducir las emisiones de carbono.
    • Se podrían tomar muestras de agua en el Puget Sound para determinar el nivel de contaminación de PCB.
    • A los estudiantes se les podría dar un examen sin previo aviso sobre una habilidad matemática que habían aprendido a principios del año escolar para ver cuánto retenían.

    Ejemplo de experimentos de observación

    • Dado que algunos estados han legalizado el uso recreativo de la marihuana, es posible determinar si realmente se trata de una droga de entrada al ver si hay un cambio en el uso de drogas más duras.
    • Cuando algunos estados incrementan el salario mínimo, es posible determinar si elevar el salario mínimo tiene un efecto en el número de personas que están empleadas en el estado comparándolos con estados que no elevan el salario mínimo.
    • Cuando un desastre natural golpea una zona, es posible determinar el efecto en las donaciones a organizaciones como la Cruz Roja.

    Ejemplo de experimentos manipuladores

    • Un entrenador asigna aleatoriamente a algunos corredores a un programa de entrenamiento con pesas y no permite que otros corredores levanten pesas, pero de lo contrario todos los corredores tienen el mismo programa de entrenamiento, entonces el entrenador puede determinar el efecto del entrenamiento con pesas en la mejora de carrera.
    • Las hogazas de pan casero se pueden hornear a diferentes temperaturas para determinar el efecto de la temperatura en el pan.
    • Una empresa puede probar diferentes anuncios de internet para ver si hay algún efecto en las ventas de su producto.

    Aleatoriedad

    Cada diseño de investigación incorpora una aplicación de aleatoriedad. En el caso de estudios observacionales y experimentos observacionales, se realiza una selección aleatoria de la población. Esto puede ser difícil para algunos experimentos de observación. Por ejemplo, no hay suficientes estados que hayan legalizado la marihuana para seleccionar aleatoriamente. En experimentos manipuladores, el investigador asigna aleatoriamente a los participantes a diferentes grupos, por ejemplo, a los grupos que reciben un tratamiento y a los que no lo reciben. Los métodos utilizados para la selección aleatoria y asignación aleatoria se discuten más adelante en este capítulo.

    Distinguir entre diseños de investigación

    Puede ser un desafío determinar qué diseño de investigación se está utilizando. Las siguientes preguntas pueden guiar su decisión.

    1. ¿El investigador busca el efecto de un tratamiento o intervención?
    2. Si la respuesta a la primera pregunta es sí, entonces ¿puede el investigador asignar aleatoriamente participantes a diferentes grupos?

    El diagrama de flujo que sigue utiliza estas preguntas para determinar el tipo de diseño de investigación.

    Diagrama de flujo de tipos de investigación

    2019-05-06 3.16.00.png

    Experimentos

    Los formuladores de políticas, los gerentes de negocios, los médicos, los educadores, los científicos y los entrenadores suelen tener un resultado que les gustaría lograr, pero quieren tomar una decisión basada en evidencia para lograr el resultado. Es decir, quieren saber qué variable pueden cambiar para que el cambio tenga un efecto en una variable diferente. Por ejemplo,

    Un formulador de políticas puede preguntarse qué variable debe cambiarse para reducir la pobreza.

    Un gerente de negocios puede preguntarse qué estrategia publicitaria conducirá al mayor incremento en las ventas.

    Un médico puede preguntarse qué medicamento curará a una persona.

    Un educador puede preguntarse qué estrategia de enseñanza conducirá a la mayor cantidad de aprendizaje para los estudiantes.

    Para las relaciones causales, ya se ha afirmado que una causa debe proceder un efecto, pero hay otro criterio de importancia. En una relación causal, un tratamiento produce un resultado particular mientras que no proporcionar el tratamiento significa que no se produce un resultado particular. Así, el simple hecho de mostrar que se produjo una cierta respuesta cuando se brindó un tratamiento no prueba que el tratamiento causó la respuesta. Podría haber otro factor que provocara esa respuesta particular. Para probar la causalidad, la investigación debe diseñarse para mostrar que una respuesta ocurre con el tratamiento y no ocurre sin el tratamiento y que es poco probable que haya otra variable que esté causando la respuesta. Esto requiere tener al menos dos grupos, uno (o más) que recibe el tratamiento y otro que no recibe el tratamiento. Al grupo que no recibe el tratamiento se le llama grupo control.

    Cuando se realizan experimentos en no humanos, es posible tener un grupo control que no reciba ningún tratamiento. Un ejemplo serían los investigadores agrícolas que podrían fertilizar algunos cultivos pero no otros. Sin embargo, cuando se realiza un experimento en humanos, puede haber complicaciones. En experimentos típicos que implican la prueba de nuevos medicamentos en una persona con una enfermedad, no es suficiente simplemente darle a algunas personas el medicamento que se está probando y no dárselo a otras. Los humanos pueden tener efectos psicosomáticos —cambios físicos que son resultado de las expectativas de un cierto efecto de la medicina, atribuido a las interacciones mente-cuerpo. Para abordar este problema, se acostumbra dar un medicamento inerte, llamado placebo, a algunos de los participantes. Es importante que los sujetos no sepan si están recibiendo el medicamento real o el placebo. También es importante que el investigador que examina los temas tampoco lo sepa. Esto se logra haciendo un experimento doble ciego. En este tipo de experimentos, los sujetos son asignados aleatoriamente al grupo de tratamiento o al grupo placebo, pero no se les dice en qué grupo se encuentran. Tampoco se le dice al médico.

    Sin embargo, se ha observado un problema con este tipo de experimento de doble ciego. Ese problema se llama ciegos y es causado porque hay que advertir a los sujetos sobre los posibles efectos secundarios del medicamento. En consecuencia, quienes experimentan los efectos secundarios pueden adivinar que están tomando el medicamento real y aquellos que no los experimentan concluyen que están tomando el placebo. En algunos experimentos, más del 80% de los médicos y sujetos identificaron correctamente si un sujeto estaba en el grupo de tratamiento o grupo placebo. Dado que una suposición correcta sobre el grupo debería ocurrir alrededor del 50% del tiempo, es probable que los efectos secundarios, o posiblemente otras pistas, conduzcan al mayor valor de identificación correcta. Para ayudar a minimizar este problema, algunos investigadores utilizan un placebo activo en lugar de la píldora de azúcar más típica. Un placebo activo produce efectos secundarios similares a la medicina real, pero no proporciona una cura para la afección médica. (“Escuchando Prozac, Pero Escuchando Placebo”. Las nuevas drogas del emperador: explotando el mito antidepresivo. Filadelfia: Libros Básicos, 2010. 7-20. Imprimir.)

    En estudios médicos, además de tener un grupo de tratamiento y un grupo placebo, es apropiado tener un grupo control que no reciba ningún tratamiento en absoluto. Esto a menudo se logra porque algunas personas que solicitan estar en el experimento no son aceptadas. Debido a que las enfermedades pueden pasar por ciclos (días buenos, días malos) y las personas suelen esperar hasta sentirse muy mal para recibir tratamiento, entonces comparar los resultados del tratamiento con personas que no reciben ningún tratamiento puede ser útil para mostrar si algo que no sea el ciclo normal de síntomas está ocurriendo como resultado de el tratamiento.

    Variables de respuesta, variables explicativas, niveles y confusión

    Se explicarán las variables de respuesta y explicativas utilizando como ejemplo a los profesores. Un resultado ideal para un maestro sería que toda la clase de alumnos tuviera éxito en la clase. Al docente le gustaría saber qué estrategias de enseñanza (pedagogía) conducirán al mayor éxito para los alumnos. Observe en este ejemplo, hay dos variables, la estrategia docente y el éxito estudiantil. Dado que la enseñanza debe ir antes de evaluar el éxito del estudiante, entonces la estrategia docente es la variable explicativa y el éxito del estudiante es la variable de respuesta.

    Sin embargo, la variable de respuesta es bastante vaga. ¿Qué significa el éxito estudiantil? Hay muchos aspectos del aprendizaje, como la memorización de hechos, la capacidad de calcular, las habilidades en el laboratorio, las habilidades de escritura, la capacidad de pensar críticamente, la capacidad de pensar creativamente, etc. Un investigador necesita tener claro la variable de respuesta. Por ejemplo, dado que este libro se usa para una clase de estadística, entonces un resultado de particular interés es si los estudiantes pueden probar correctamente una hipótesis. Un resultado diferente podría ser si los estudiantes pueden crear gráficas adecuadas para los datos.

    Existen muchas posibilidades para la variable explicativa de las estrategias de enseñanza. Estas posibilidades se llaman niveles. Ejemplos de niveles incluyen conferencias, aprendizaje activo, aprendizaje de descubrimiento, software de enseñanza por computadora, etc. Los niveles son ejemplos específicos de la variable explicativa.

    Si bien la enseñanza de la pedagogía es una variable explicativa que un profesor puede modificar, no es la única variable que puede afectar la variable de respuesta del éxito estudiantil. Otras variables incluyen el interés y motivación del estudiante, el texto, el tiempo de estudio, las distracciones (falta de comida o refugio, despliegue de un cónyuge, divorcio, enfermedad, etc.). Estas otras variables, que podrían ser utilizadas como variables explicativas en diferentes investigaciones, se denominan variables de confusión. Las posibles variables de confusión deben identificarse durante la etapa de diseño de la investigación para que puedan controlarse en el experimento asegurándose de que estén distribuidas equitativamente en los diferentes grupos experimentales.

    Para que la práctica identifique los diferentes elementos de la investigación, se le darán historias que explican un proyecto de investigación. A partir de la historia, tu objetivo es identificar los elementos clave, incluyendo la pregunta de investigación, las variables, el parámetro y el tipo de investigación. Estos se organizarán en una mesa de diseño de investigación. Al completar esta tabla, piense usted mismo en las posibles variables de confusión ya que generalmente no se incluyen en la historia.

    Mesa de diseño de investigación
    Pregunta de investigación:
    Tipo de Investigación Estudio Observacional Experimento
    Observacional Experimento
    Manipulativo
    ¿Cuál es la variable respuesta?
    Cuál es el parámetro que se calculará Proporción media
    Enumerar posibles variables de confusión.
    Agrupación/Variables explicativas 1 (si están presentes)




    Niveles:

    Algunos de los ejemplos a continuación contienen palabras subrayadas, otros no. El propósito de subrayar es ayudarte a identificar las palabras clave de la historia. En última instancia, es necesario identificar estas partes sin que estén subrayadas.

    Ejemplo 2.1 ¿Existe una diferencia en el número de artículos electrónicos en los hogares de las personas que nacieron y se criaron en EU en comparación con las personas que emigraron a EU y han vivido en EU por lo menos 5 años?

    Para responder a esta pregunta, el estatus de residencia de las personas se clasificará como nativo o inmigrante de 5 años. Se tomarán muestras aleatorias de residentes nativos e inmigrantes que hayan estado en EU por lo menos 5 años. Todos los artículos electrónicos se contabilizarán individualmente (por ejemplo, teléfonos celulares, computadoras, televisores, radios). El objetivo es determinar si el número medio de elementos electrónicos es diferente para los dos grupos.

    Mesa de diseño de investigación
    Pregunta de investigación: ¿Hay alguna diferencia en el número de artículos electrónicos en los hogares de las personas que nacieron y se criaron en EU en comparación con las personas que emigraron a EU y han vivido en Estados Unidos por al menos 5 años?
    Tipo de Investigación Estudio Observacional Experimento
    Observacional Experimento
    Manipulativo
    ¿Cuál es la variable respuesta? número de artículos electrónicos
    ¿Cuál es el parámetro que se calculará? Proporción media
    Enumerar posibles variables de confusión. Ingresos, riqueza, edad, tamaño de la familia
    Agrupación/Variables explicativas (si está presente) Estado de

    residencia
    Niveles:
    nativo

    Inmigrante de 5 años

    Sesión informativa 2.1 Pie Descalzo

    En 2011, Vintage Books publicó el libro “Born to Run: A hidden Tribe, Superatletas, and the Greatest Race the World Have Never Seen”, de Christopher McDougall. Uno de los temas tratados fue el concepto de correr a pie desnudo. El autor argumentó que correr descalzo (o con una protección mínima entre la planta del pie y el suelo) conduce a un estilo de carrera en la parte delantera del pie que lleva a menos lesiones que quienes corren con zapatos acolchados y usan un golpe de curación.

    A un entrenador de running de secundaria le gustaría saber si los nuevos corredores que usan zapatos minimalistas que conducen a un estilo de carrera en la parte delantera del pie tendrán menos lesiones que los corredores nuevos que usan zapatos acolchados que conducen a sanar los golpes. El entrenador usa un flip de monedas para asignar aleatoriamente el tipo de zapato que debe usar un corredor nuevo. El entrenador registrará esta elección de calzado y mantendrá un registro de lesiones para cada atleta. En definitiva, el entrenador determinará si existe una diferencia en la proporción de corredores de cada grupo que se lesionen. Solo se incluirán nuevos corredores porque sería difícil y quizás inapropiado cambiar el estilo de carrera de corredores experimentados.

    Mesa de diseño de investigación
    Pregunta de investigación: ¿El estilo de carrera marca la diferencia en las lesiones?
    Tipo de Investigación Estudio Observacional
    bservacional Experimento
    Manipulativo Experimento
    ¿Cuál es la variable respuesta? lesión
    ¿Cuál es el parámetro que se calculará? Proporción media
    Enumerar posibles variables de confusión. Experiencia previa al correr, lesiones previas, estado físico general
    Agrupación/Variables explicativas (si las hay)

    Tipo de zapato
    Niveles: zapatos
    minimalistas

    Zapatos acolchados

    Ejemplo 2.3 ¿El aumento de la tasa impositiva para los ricos resolverá el problema de la deuda nacional?

    Cada vez que se cambia una ley el país realiza un experimento. Se asumiría que los legisladores reflexionan cuidadosamente sobre las posibles consecuencias de cualquier cambio en la ley que aprueben. El país se enfrenta ahora a una gran deuda nacional que tiene a algunos legisladores preocupados y que ocasionalmente atrae el interés de los inversionistas. También existe un debate ideológico que persiste sobre los beneficios o consecuencias de subir impuestos o recortar gastos. Una recomendación popular de algunos es aumentar los impuestos a los ricos.

    Información 2.2 Tasa Impositiva Marginal

    Los paréntesis impositivos se utilizan para mostrar la cantidad de impuestos pagados por cada dólar ganado. Las tasas impositivas marginales para 2013 se muestran en la tabla de la página siguiente para las personas casadas que presentan una declaración conjunta. (taxfoundation.org/article/us-... usted-brackets visto 7/08/13)

    Una persona que gana 80 mil dólares pagaría 10% de impuestos sobre los primeros $17,488, 15% de impuestos sobre el dinero entre $17,488 y $71,030, y 25% sobre la cantidad superior a $71,030.

    La gráfica a continuación muestra el cambio en la tasa impositiva marginal sobre los estadounidenses más ricos y la Deuda Nacional. A partir de esta gráfica vemos que la deuda nacional comenzó a subir mucho a finales de los setenta y ochenta. También notamos que esta subida estuvo precedida por grandes caídas en las tasas impositivas marginales superiores durante la administración Reagan.

    2019-05-06 3.41.05.png

    La información de esta gráfica no puede ser utilizada para probar la teoría de que bajar las tasas impositivas conduce a un aumento de la deuda nacional (o viceversa) porque las teorías no pueden probarse con la evidencia que se utilizó para crear la teoría en primer lugar. Por lo tanto, si un economista quería probar la teoría sobre el efecto de las tasas impositivas marginales sobre la deuda nacional, necesitará obtener datos diferentes. Sería poco realista esperar que cualquier país aceptara participar en un experimento en el que un economista investigador les hiciera cambiar sus tasas impositivas. No obstante, los países sí cambian las tasas impositivas por su cuenta, por lo que un investigador podría observar lo que sucede después de cada cambio de este tipo Se podría determinar la deuda nacional antes del cambio de tasa y 5 años después. Si el objetivo es establecer una relación de causa y efecto, también será necesario identificar cambios en la deuda nacional para países que no cambien sus tasas impositivas. Se podría hacer una comparación de los cambios en la deuda nacional para ambos grupos. Otros aspectos importantes de la deuda nacional incluyen la cantidad de gasto que se realiza así como la cantidad de preocupación que tienen los legisladores por mantener equilibrado el presupuesto.

    Mesa de diseño de investigación
    Pregunta de investigación: ¿Bajar las tasas impositivas conduce a un aumento de la deuda nacional?
    Tipo de Investigación Estudio Observacional Experimento
    Observacional Experimento
    Manipulativo
    ¿Cuál es la variable respuesta? Cambios en la deuda nacional 5 años después del cambio de tasa
    ¿Cuál es el parámetro que se calculará? Proporción media
    Enumerar posibles variables de confusión. Estado de la economía, número de personas en cada nivel económico, prioridades presupuestales gubernamentales
    Agrupación/Variables explicativas (si las hay) Variación

    marginal de la tasa
    Niveles:
    Control (no cambió las tasas impositivas)

    Impacto (tasas impositivas reducidas)

    Muestreo

    Los estudios observacionales y algunos experimentos observacionales requieren un muestreo aleatorio de una población. El siguiente paso en el proceso de diseño de la investigación es determinar cómo se tomará una muestra de la población para que sea representativa de la población. El objetivo es evitar sesgos. El sesgo es prejuicio sistemático en una dirección. Recordemos las distribuciones de muestreo que se discutieron en el Capítulo 1. La mitad de las estadísticas en la distribución muestral fueron menores que el parámetro y la mitad fueron más, por lo que la probabilidad de obtener una estadística mayor o menor que el parámetro fue la misma. Si el muestreo no se realiza correctamente, es fácilmente posible terminar con resultados sesgados. Eso significa que las muestras tienen más probabilidades de ser menores que el parámetro o que tienen más probabilidades de ser mayores que el parámetro. Por ejemplo, si quieres determinar qué deporte piensa la gente que es el más emocionante, el fútbol profesional o el fútbol profesional y solo muestras a personas en una ciudad con un equipo de la NFL, es probable que obtengas resultados sesgados a favor del fútbol profesional. Por otro lado, si realizas tu encuesta en una ciudad como Londres, es probable que obtengas resultados sesgados a favor del fútbol. De cualquier manera, estás obteniendo resultados sesgados, lo que significa que cualquier conclusión que sacas no es válida.

    Se obtienen resultados sesgados al realizar muestreo voluntario y muestreo de conveniencia. El muestreo voluntario ocurre cuando las personas aceptan voluntariamente participar en una encuesta, como una encuesta en línea o una encuesta de televisión donde las personas pueden enviar su respuesta por mensaje de texto. El muestreo de conveniencia ocurre debido a obtener respuestas de personas que son convenientes. Es posible que estas personas compartan una opinión y consecuentemente se agrupen, dando como resultado resultados sesgados.

    El mejor muestreo se logra utilizando métodos de muestreo probabilístico. Los cuatro métodos que se discutirán son:

    1. Muestreo aleatorio simple
    2. Muestreo estratificado
    3. Muestreo sistemático
    4. Muestreo en raci

    Muestreo aleatorio simple

    El muestreo aleatorio simple cumple con dos criterios deseables. Primero, cada individuo o unidad de la población tiene las mismas posibilidades de ser seleccionado y segundo, cada colección de unidades seleccionadas tiene las mismas posibilidades de ser seleccionadas. Las distribuciones de muestreo que subyacen a las pruebas de hipótesis se basan en muestreo aleatorio simple con reemplazo. Eso significa que una vez seleccionada, una unidad se vuelve a poner en la piscina y se puede seleccionar de nuevo. En consecuencia, la información de la misma unidad se puede utilizar más de una vez.

    El ejemplo más simple de una muestra aleatoria simple es sacar nombres de un sombrero. Es decir, todos en un grupo pueden tener su nombre escrito en una hoja de papel y luego ponerlo en un sombrero u otro recipiente. Alguien mezcla los trozos de papel y luego saca un nombre. Esto es muy parecido a sorteos que hacen las organizaciones.

    Poner nombres en una hoja de papel rápidamente se vuelve inmanejable con poblaciones más grandes y por lo tanto se necesita una estrategia diferente. En su lugar, a cada persona o unidad se le da un número y luego se seleccionan los números. Luego se recogen datos de la persona o unidad con el número seleccionado. Se proporcionarán tres métodos diferentes para hacer una muestra aleatoria simple. Estos métodos hacen uso de una tabla de dígitos aleatorios, la calculadora TI83 o TI84, y el sitio web llamado Random.Org. Los dos primeros métodos se conocen como pseudo-aleatorios, lo que significa que si bien se usa un proceso aleatorio para generar los números, es un proceso repetible. A continuación se explicarán. Los números aleatorios generados en Random.Org son verdaderamente aleatorios ya que se basan en el ruido atmosférico. Visita el sitio web y selecciona generador de enteros para probar su proceso de selección.

    Tabla de Dígitos Aleatorios

    Una tabla de dígitos aleatorios consta de los dígitos 0 — 9 que han sido seleccionados aleatoriamente, con reemplazo. Se agrupan con 5 dígitos juntos para mayor comodidad visual. Las filas y columnas están numeradas.

    Para utilizar la tabla, determinar el tamaño de la población de la que se extraerá una muestra. Asignar un número a cada persona o unidad de la población. La forma más fácil de hacerlo es asignarle un 1 a la primera persona (unidad), un 2 a la segunda persona (unidad), etc. sin embargo, esta no es la única estrategia. Es posible que las personas o unidades ya tengan un número (por ejemplo, número de identificación de estudiante, número de producción), que se puede usar. El número de dígitos que se seleccionarán al mismo tiempo corresponde al número de dígitos en el mayor número asignado. Si la selección se va a hacer a partir de una población de tamaño 89 unidades, entonces como 89 es un número de 2 dígitos, entonces los números asignados serán 01, 02,... 89 y todas las selecciones serán de 2 dígitos. Si el tamaño de la población es 745, ya que se trata de un número de 3 dígitos entonces los números asignados serán 001, 002,... 745.

    Tabla de dígitos aleatorios
    Fila Col 1-5 Col 6-10 Col 11-15 Col 16-20 Col 21-25 Col 26-30 Col 31-35 Col 36-40
    1 05902 75968 00100 12330 92481 64625 83012 90763
    2 53365 25560 86425 45946 67093 36638 71740 16878
    3 69363 06820 49676 25363 96300 94376 65819 19636
    4 37520 54955 31507 70745 41817 86606 97766 44989
    5 10390 12738 54072 03238 08294 89479 03156 24217
    6 98735 90798 96609 18368 74876 17403 33783 85101
    7 79609 87687 77178 39784 76983 05689 84023 24804
    8 00348 58777 90570 09114 99677 08126 76132 19334
    9 98367 93351 08246 81492 57876 04366 21851 28620
    10 34588 88493 61188 29234 32565 82010 07425 37173
    11 74198 34943 64557 20118 25540 50014 29338 87231
    12 00621 86824 81204 71923 03600 69080 31712 36599
    13 44684 53902 86099 98640 86347 88061 60420 54118
    14 43526 09310 21922 40743 64742 12780 88432 41496
    15 37335 98934 61403 85336 76356 22349 31498 34136
    16 25488 41567 32833 56973 04039 57733 88677 44817
    17 45327 69347 85698 03248 60079 64469 71406 19478
    18 47458 08093 94256 14305 42728 676159 35991 13527
    19 91622 23621 91124 08233 54571 73527 29012 31534
    20 77630 37356 85498 21296 14880 24981 70976 64922

    Por ejemplo, ¿cuáles serán los números de las primeras 3 personas que serían seleccionadas de una población con 6890 personas? A las personas se les asignan números como 0001, 0002,... 6890. La selección comenzará en la fila 16, que se reproduce a continuación. Se seleccionarán cuatro dígitos seguidos. Si son menores o iguales a 6890 se seleccionarán (se muestran con subrayado). Si son mayores de 6890, serán ignorados.

    16 25488 41567 32833 56973 04039 57733 88677 44817

    Los tres primeros números que se seleccionan son 2548, 6732 y 0403.

    La calculadora Texas Instrument TI84 es capaz de generar enteros aleatorios. Un proceso que es análogo a elegir una fila en una tabla de dígitos aleatorios es sembrar la calculadora. La calculadora se siembra y luego se seleccionan números enteros aleatorios. Por ejemplo, si el número semilla es 38, entonces las pulsaciones de tecla en la calculadora serían:

    38 sto math prb 1 rand enter. 38 deben aparecer en la pantalla.

    Para generar el número aleatorio, las pulsaciones de tecla son:

    matemáticas prb 5 randint, enter. La función randint espera la entrada de tres números, el bajo, el alto y el número de valores que cree que encajarán dentro de la ventana de la pantalla. Si seguimos con el ejemplo de 6890 personas, entonces como se trata de un número de 4 dígitos podríamos esperar que 3 de esos números quepan en la pantalla, así entraríamos: randint (1,6890,3). Si necesitamos más de 3 números, entonces podemos simplemente empujar enter de nuevo tantas veces como sea necesario.

    Los números que se seleccionan en este ejemplo son: 2283, 3612, 3884.

    Muestreo estratificado

    Hay momentos en los que se puede esperar que partes de la población produzcan datos diferentes a los de otras partes. Por ejemplo, podría esperarse que la concentración de un químico tóxico en el Puget Sound sea mayor cerca de áreas industriales que en ubicaciones alejadas de esas áreas industriales. Dado que el muestreo aleatorio puede resultar en áreas omitidas, entonces se puede realizar un muestreo estratificado. En este enfoque, se definen áreas, siendo cada área un estrato. Luego se utiliza un proceso de muestreo aleatorio simple dentro de cada estrato.

    Como ejemplo separado, un grupo que busca ampliar el transporte público en un estado puede preguntarse cuánto apoyo habría para una iniciativa. Podrían esperar que el apoyo al transporte público sea sustancialmente diferente para las personas que usan el transporte público que para las personas que nunca lo usan. En consecuencia, pueden hacer un muestreo aleatorio simple de cada uno de estos grupos.

    Cabe señalar que la estratificación se basa en el supuesto de que habrá diferencias entre los estratos aunque esto puede no ser algo que se haya probado. Esto es diferente a tener realmente una hipótesis sobre la diferencia entre los estratos, en cuyo caso cada estrato se considera una población diferente, en lugar de diferentes partes de la misma población.

    Muestreo sistemático

    Una estrategia de muestreo que resulta particularmente útil para el muestreo de datos de series de tiempo es el muestreo sistemático. Este es un método de muestreo de 1 en k en el que cada k\(^{\text{th}}\) unit is selected. Since the value of data in one year may be influenced by the previous year (or more), the data are not independent. For example, this year’s cost of tuition is closely related to last year’s cost. Suppose that a sample is to be taken from time series data that is serially dependent when the data are 1,2 and 3 years separated but not when they are separated by 4 years. In this case, sampling every 4t\(^{\text{th}}\) year would be appropriate. Suppose that data is available from 1961 to the present and a 1 in 4 systematic sampling method is used. What will be the first year in which data are selected? Since every year has to have a chance of being selected, then it will be necessary to randomize the initial value. This will be done by randomly selecting one number between one and k. To find successive numbers, add k to the number selected. For example, if a TI84 calculator is seeded with the number 42, then randint(1961,1964,1) will produce the number 1962. To this will be added 4 repeatedly until a sample of the desired size has been selected. The table below shows the years that will be selected.

    1961 1962 1963 1964 1965 1966 1967 1968 1969 1970
    1971 1972 1973 1974 1975 1976 1977 1978 1979 1980

    The value of k is dependent upon the size of the population (N) and the size of the sample (n)and is found by dividing the former by the latter: \(K \thickapprox N/n\).

    Cluster Sampling

    Collecting data can be time consuming and expensive, neither of which is a trivial factor for any organization that needs the data. When data must be collected from different locations and there is not an assumption that the locations will cause the variation in the data, then cluster sampling can be used. For example, a community college may want to sample the student body about charging students a technology fee so that a new student computer lab can be built. Because students take many different classes and these classes are not likely to have a major impact on their preference about the fees, then different classes can be selected and all the students in those classes can be asked their preference on the fees. If a college has 450 classes, they can be numbered from 1 to 450 and a simple random sampling process can be used to select the desired number of classes. If the goal is to select 8 classes and a seed value of 16 is use, then on the TI84, the function Randint(1,450,4) will give the class numbers of 419, 313, 273, 229, 445, 162, 127, 428.

    These methods are often confused. The following guidelines may help clarify the differences. Simple Random Sample – Random Sampling is done from the entire population.

    Stratified Sampling – The entire population is divided into strata then simple random sampling is done from each strata. The samples from each strata are combined before being analyzed.

    Systematic Sampling – One number is randomly selected from the first k numbers. The numbers of the other data are found by adding k to the last number that was selected.

    Cluster Sampling – The entire population is divided into groups or clusters, which are given numbers. The groups are randomly selected and every unit within the group becomes part of the sample.

    Chapter 2 Homework

    Complete the design-layout tables. Use underlined words when available.

    1. A student would like to know which of two possible routes is faster for the daily trips to school. Route 1 is shorter but has many traffic lights. Route 2 is a little longer but doesn’t have traffic lights. Each morning, a coin flip will be used to determine the route taken to school. The time it takes for the commute will be measured with a stopwatch. After approximately 15 trials on each route, the average time for each will be compared.
      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:
    2. Suppose researchers wanted to know if the opinion people had about the future was influenced by the amount of news they consume (watched, listened to, or read). The researchers categorized news consumption into three categories: 5-7 days/week, 1-4 days/week, less than 1 day/week. They then asked the people their opinion of the future (if they expected the future to be better or worse than the present). They will compare the proportion of optimistic people in each group.
      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:
    3. Because so many species are becoming extinct, scientists would like to know how to increase biodiversity. There are two approaches to improve biodiversity in the world. The hands-off approach is one in which no one makes any deliberate changes to the environment with the intent of improving biodiversity. The deliberate approach is to deliberately introduce species that will reshape the environment, using surrogate species when necessary (e.g. use elephants instead of woolly mammoths, which are extinct). Examples of the first approach include the DMZ between North and South Korea. An example of the second includes the creation of a Pleistocene park in northeast Siberia by ecologist Sergei Zimov. Whether they occur by accident or design, there is no central planning organization that will randomly determine the approach that will be taken, so researchers can only look at the evidence after ecosystems have been engineered. A comparison will also be made with similar areas (control groups) that do not receive either the hands-off or deliberate approach. The researchers might record data on the increase in the number of species and determine if the average increase in number of species is different for the two approaches and the control groups. (Brand, Stewart. Whole Earth Discipline: An Ecopragmatist Manifesto. New York: Viking, 2009. Print.)
      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:
    4. 屏幕快照 2019-05-08 下午2.16.22.pnga. It has been hypothesized that a lack of flexibility of the hamstring muscles can contribute to poor posture. To determine if that is the case, a group of adults was randomly selected. The group was divided into two, those with good posture and those with poor posture. The flexibility of their hamstrings was measured using a sit and reach test.(http://silbergen564s15.weebly.com/. Viewed 4/8/2017) The further a person can reach, the greater their hamstring flexibility.





      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:

      b. Two types of stretching can be done to improve flexibility, static stretching and dynamic stretching. Static stretching involves stretching a muscle and holding it in a stretched position for about 30 sec. Dynamic stretching involves stretching while moving through a range of motion. To determine which type of stretching resulted in improvement, the group of people with poor hamstring flexibility were randomly assigned to one of three groups. One group did static stretching daily for one month. Once group did dynamic stretching daily for one month. The third group was the control group, which did not do any stretching. Afterwards, the subjects were retested and categorized as improving or not improving since their first test.

      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:
    5. Researchers want to know the proportion of acres of forest in the state that show evidence of the brown beetle infestation.
      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:
    6. A teacher wants to know the mean amount of time community college students spend doing homework each night.
      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:
    7. A fisheries biologist want to know the average weight of Coho Salmon returning to spawn.
      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:
      1. In Chapter 2, you were introduced to sampling distributions. Understanding these distributions proves challenging for many but since they form the bases upon which p-values are determined and therefore conclusions are drawn, knowing how the distributions are created and what they mean is helpful for your understanding of statistics. Sampling distributions are really theoretical in nature because they would be extremely difficult to make in reality, but having the experience of partially making one should give you greater insight into what one would really be like. In this problem, you are given a set of data, which is considered the entire population. Each data value has been numbered. You will then practice the various sampling methods multiple times, using different seed values. In each case, you will determine the statistic of the sample, which in this case will be a sample proportion. You will then fill in one box in the distribution that is provided. The first box you put in should be considered the one and only sample that you would have taken. Use a different color for shading the box. The remaining samples you take will represent other possible samples that you would have gotten with a different seed number.

        The population consists of all the berths in a harbor. Each dock has room for 20 boats. In this problem, each cluster is a different dock. The two strata are the west side of the harbor and the east side. Yes means there is a boat at the berth, no means that it is vacant.

        West Side of Harbor East Side of Harbor
        Cluster 1 Cluster 2 Cluster 3 Cluster 4 Cluster 5 Cluster 6 Cluster 7
        1 Yes 21 No 41 Yes 61 No 81 101 121
        2 Yes 22 No 42 No 62 No 82 Yes 102 122 Yes
        3 No 23 No 43 No 63 No 83 103 Yes 123
        4 Yes 24 No 44 Yes 64 No 84 104 Yes 124
        5 No 25 No 45 No 65 No 85 Yes 105 Yes 125 Yes
        6 Yes 26 Yes 46 Yes 66 No 86 Yes 106 No 126 No
        7 No 27 No 47 No 67 Yes 87 No 107 No 127 Yes
        8 Yes 28 No 48 No 68 No 88 No 108 Yes 128 No
        9 No 29 No 49 No 69 No 89 Yes 109 No 129 Yes
        10 No 30 No 50 No 70 Yes 90 No 110 No 130 No
        11 No 31 No 51 Yes 71 No 91 No 111 No 131 No
        12 Yes 32 No 52 Yes 72 Yes 92 Yes 112 Yes 132 Yes
        13 Yes 33 No 53 Yes 73 Yes 93 No 113 No 133 No
        14 Yes 34 No 54 Yes 74 Yes 94 Yes 114 No 134 Yes
        15 35 Yes 55 No 75 Yes 95 No 115 No 135 No
        16 36 Yes 56 No 76 Yes 96 No 116 No 136 No
        17 Yes 37 Yes 57 No 77 No 97 Yes 117 Yes 137 Yes
        18 Yes 38 Yes 58 No 78 Yes 98 No 118 Yes 138 No
        19 No 39 No 59 Yes 79 No 99 No 119 Yes 139 Yes
        20 No 40 No 60 No 80 No 100 No 120 Yes 140 Yes

        For each sampling method, 20 samples will be taken. Sample with replacement, which means the same number can be selected more than once. Determine the proportion of samples that are Yes. On each line, write the number selected and a Y for yes or N for no (e.g. 8Y)

    8. a. Use a simple random sample. The seed number for what will be considered the official sample is 5.

      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,

      Sample Proportion ______

      The following are alternate sample results you could get if you had used different sampling methods and seed numbers.

      b. Use a stratified sample with a seed number of 10 for the West and 11 for the East.
      West ______, ______, ______, ______, ______,______, ______, ______, ______, ______,______,
      East _______, _______, _______, _______, _______,_______, _______, _______, _______

      Sample Proportion ______

      c. Use systematic sampling with a seed number of 15. Let k = 7.
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,

      Sample Proportion ______

      d. Use a cluster sampling method with a seed number of 20.
      Which cluster is selected? ___________ Sample Proportion _________8e. Use a simple random sample with a seed number of 25.

      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,

      Sample Proportion ______

      f. Use a stratified sample with a seed number of 30 for the West and 31 for the East.
      West ______, ______, ______, ______, ______,______, ______, ______, ______, ______,______,
      East _______, _______, _______, _______, _______,_______, _______, _______, _______

      Sample Proportion ______

      g. Use systematic sampling with a seed number of 35. Let k = 7.
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,

      Sample Proportion ______

      h. Use a cluster sampling method with a seed number of 40.
      Which cluster is selected? ___________ Sample Proportion _________

      i. Use a simple random sample with a seed number of 45.

      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,

      Sample Proportion ______

      j. Use a stratified sample with a seed number of 50 for the West and 51 for the East.
      West ______, ______, ______, ______, ______,______, ______, ______, ______, ______,______,
      East _______, _______, _______, _______, _______,_______, _______, _______, _______

      Sample Proportion ______

      k. Use a cluster sampling method with a seed number of 55. Which cluster is selected? ___________ Sample Proportion _________

      l. Use systematic sampling with a seed number of 60. Let k = 7.
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,
      _______, _______, _______, _______, _______, _______, _______, _______, _______, _______,

      Sample Proportion ______

      m. Fill in a square in the appropriate column, starting at the bottom row (that does not contain the numbers). The first sample proportion you get (from problem 8a) should be shaded differently than the rest of the sample proportions.

      0.00
      0.05
      0.10
      0.15
      0.20
      0.25
      0.30
      0.35
      0.40
      0.45
      0.50
      0.55
      0.60
      0.65
      0.70
      0.75
      0.80
      0.85
      0.90
      0.95
      1.00

      n. Find the parameter by finding the proportion of all the 140 responses that are yes. Show this on the chart in 8m. How do the sample proportions compare to the population proportion?
    9. The first graph shows the change in employment when the Federal minimum wage has been increased. This graph shows a comparison in the number of people employed 6 months after the increase, compared to six months before the increase. The numbers on the x-axis represent millions of people (e.g. 1000 x 1000) with positive numbers reflecting an increase in employment. Notice that most of the time, minimum wage went up, so did employment. However, this graph does not provide solid evidence that raising the minimum wage leads to an increase in employment. This is because there is no comparison. It could be that jobs were increasing or decreasing anyway, because of bigger economic changes, and that the minimum wage had only minor effect.

      A better way to determine the effect of raising the minimum wage is to compare states that raise it with states that don’t since states have the ability to raise the minimum wage above the Federal level. The average after – before change in annual unemployment can be compared between these groups of states. For example, if the minimum wage in a state is increased in 2003, then the unemployment rate in 2002 can be subtracted from the unemployment rate in 2003. If the 2003 rate is lower than the 2002 rate, it means the unemployment rate went down and the difference would be a negative number. (Note: while the graph above was about the number of employed people, the graphs that follow are about the number of unemployed people).

      a. Complete the Research Design table.

      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:

      Hypotheses and the level of significance are to be established before data is collected. The hypotheses for this question are that the average after-before difference in annual unemployment rates is different in the states that raise their minimum wage compared to states that don’t.

      \(H_0: \mu_{\text{Raise}} = \mu_{\text{Not Raise}}\)

      \(H_1: \mu_{\text{Raise}} \ne \mu_{\text{Not Raise}}\)

      \(\alpha = 0.05\)

      From the table at http://www.dol.gov/whd/state/stateMinWageHis.htm, minimum wage data is available for consecutive years from 2000 to 2013, with an indication of rate changes beginning in the year 2001. Sampling from this set of data will be done by selecting 3 different years and using all the data from those years.

      b. What is the name of the sampling method that is being used? ________________________

      Which three years will be selected if your TI84 calculator is seeded with the number 42 and the years 2001 thru 2012 can be selected? These years were chosen because there is minimum wage increase data for these years and unemployment records for the year of, and the year before the unemployment rate increased, are available. Unemployment rates are found at http://www.bls.gov/lau/tables.htm.

      c. Which years are selected? _______, ________, _________

      The two graphs below are of the actual After-Minus-Before change in unemployment rates for the various states in the years that were randomly selected.
      屏幕快照 2019-05-08 下午2.46.29.png

      d. Do the graphs appear to support the null hypothesis or the alternate hypothesis better?

      e. Both graphs are based on the same data. Which graph do you think shows the data better? Why?

      屏幕快照 2019-05-08 下午2.47.46.pngOne additional graph is shown to the right. It includes concepts that will be discussed near the end of the book, but because this topic is of interest to the many people working at minimum wage, the graph is being included here. Each line is for a different year. The mean for each year is in the center of the vertical bar. The vertical bars on the left show the change in unemployment for the states that raised their minimum wage and the vertical bars on the right are for the states that did not. The bars represent the confidence interval. Since decreasing unemployment is viewed as desirable, then this graph shows that in two of the years (2004 and 2012), the states that raised their minimum wage reduced their unemployment rate more than the states that didn’t raise their rates. In 2006, the states that didn’t raise their minimum wage reduced their unemployment rate more than the states that did raise their rates.









      f. The table below shows the average change in unemployment rates for all the data combined. Which hypothesis do these statistics support?

      States Raised Minimum Wage States Did Not Raise Minimum Wage
      Mean -0.615 -0.519
      n 26 105

      g. The p-value for a comparison of the two means is 0.286. Write a concluding sentence in the style used in scholarly journals (like you were taught in Chapter 1).

      h. Suppose you were in a class in which this topic was being discussed. What would you say to a classmate who argued that the minimum wage should not be raised because it will lead to more unemployment?

      What would you say to the classmate who argued that the minimum wage should be raised because it means the poorer people will have more money to spend which means businesses will do better and have to hire more people thereby causing unemployment to drop even more?

    10. Why Statistical Reasoning Is Important for a Nursing Student and Professional Developed in collaboration with Becky Piper, Pierce College Puyallup Nursing Program Director This topic is discussed in NURS 112.
      This problem is based on An Analysis of Falls in the Hospital: Can We Do Without Bedrails?

      by H.C. Hanger, M.C. Ball and L.A. Wood. the American Geriatrics Society, 47:529-531.

      There was a time when women who helped the sick and injured were poorly regarded. However, in 1844, Florence Nightingale, daughter of a British banker, started visiting hospitals and learning about the care of patients. She eventually provided leadership to the British field hospitals during the Crimean War of 1853-56.(http://en.Wikipedia.org/wiki/Crimean_War) While her efforts helped improve the quality of the hospitals, it was after the war that she reflected about results she considered disappointing. She sought the assistance of William Farr who had recently invented the field of medical statistics. To help Florence understand the reasons for all the deaths in the hospital, he suggest that “We do not want impressions, we want facts.” One of her theories had been that many of the deaths were the result of inadequate food and supplies. The statistics lead to a rejection of this theory and instead pointed to lack of sanitation as a cause.(https://www.sciencenews.org/article/...e-statistician) Nightingale was also known for her use of graphs as a way of showing her analysis. Because of Florence Nightingale, the profession of Nursing is inextricably linked with statistics. In the modern context, it is called “evidence-based practices”.

      Because hospital patients, particularly the elderly, have physical and possible cognitive problems that required placement in a hospital or nursing home, there is a need for nurses to keep the patients safe. One problem for these patients is falls, including falling out of bed. A standard practice for facilities has been to use bedrails so that a patient doesn’t accidently roll out of bed.

      The researchers who wrote the article could find no evidence that bedrails prevented falls, so they conducted their own experiment. They instituted a policy at their hospital (in Christchurch, NZ) to discontinue the use of bedrails unless there was a justifiable reason for their use that was documented and approved. Their experiment was to compare the average number of falls per 10,000 bed days after the implementation of the policy to before its implementation. If the bedrails helped reduce falls, the number of falls should increase after they are removed.

      \(H_0: \mu_{\text{after}} = \mu_{\text{before}}\)

      \(H_1: \mu_{\text{after}} > \mu_{\text{before}}\)

      \(\alpha = 0.05\)

      a. Complete the experiment design table

      Research Design Table
      Research Question:
      Type of Reserach Observational Study
      Observational Experiment
      Manipulative Experiment
      What is the response variable?
      What is the parameter that will be calculated? Mean Proportion
      List potential confounding variables.
      Grouping/explanatory Variable (if present) Levels:

      b. Before implementing the policy, the average number of falls per 10,000 bed days was 164.8 (S.D. = 20.6). After the new policy was implemented, the average number of falls per 10,000 bed days was 191.7 (S.D. = 40.7). The p-value was 0.18. Write a complete concluding sentence.

      c. An additional part of the experiment was to compare the severity of the falls. Falls were classified as serious injury, minor injury or no injury. The table below shows the distribution of the injuries.

      Pre-policy Post-policy
      Serious injury 33 18
      Minor injury 43 60
      No injury 110 154

      There is a significant difference in the injuries (p = 0.008). Explain what the difference is and give a possible reason for the difference.

      d. If you were a nurse, would you suggest that bedrails be required or be removed? Why?


    This page titled 2: Obtención de pruebas útiles is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Peter Kaslik via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.