5.2: Criterios para determinar el tamaño del ensayo

Última actualización
Guardar como PDF

Page ID: 124169

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\id}{\mathrm{id}}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\kernel}{\mathrm{null}\,}\)

\( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\)

\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\)

\( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)

\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)

\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vectorC}[1]{\textbf{#1}} \)

\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

2.1 Medidas de precisión del efecto

Para seleccionar el tamaño de muestra apropiado, es necesario decidir cuánto error de muestreo en la estimación del efecto de la intervención es aceptable y seleccionar el tamaño de muestra para lograr esta precisión. Cuando se analizan los datos, la cantidad de error de muestreo se representa por el ancho del intervalo de confianza alrededor de la estimación del efecto. Cuanto más estrecho sea el IC, mayor será la precisión de la estimación y menor será la cantidad probable de error de muestreo. Al diseñar un ensayo, es necesario, por lo tanto, decidir el ancho de un IC aceptable en torno al efecto de intervención elegido. Habiendo tomado esta decisión, el método para seleccionar el tamaño de prueba requerido se da en la Sección 3.

2.2 Poder del juicio

Un enfoque alternativo es elegir un tamaño de prueba que dé la potencia adecuada para detectar un efecto de una magnitud dada. El foco se centra entonces en el resultado de la prueba de significancia que se realizará al final del ensayo. La prueba de significancia evalúa la evidencia frente a la hipótesis nula, la cual establece que no hay verdadera diferencia entre las intervenciones en comparación. Un resultado estadísticamente significativo indica que los datos entran en conflicto con la hipótesis nula y que hay motivos para rechazar la hipótesis de que no hay diferencia en los efectos de las intervenciones en estudio sobre los resultados de interés.

Debido a las variaciones resultantes del error de muestreo, nunca es posible estar seguro de obtener un resultado significativo al final de un ensayo, aunque exista una diferencia real. Es necesario considerar la probabilidad de obtener un resultado estadísticamente significativo en un ensayo, y esta probabilidad se denomina poder del ensayo. Así, una potencia del 80% para detectar una diferencia de un tamaño especificado significa que, si el ensayo se realizara repetidamente, se obtendría un resultado estadísticamente significativo cuatro veces de cada cinco (80%) si la verdadera diferencia fuera realmente del tamaño especificado. El poder de un ensayo depende de los factores mostrados en el Recuadro 5.1.

El poder también depende de si se va a realizar una prueba de significancia unilateral o unilateral (ver Capítulo 21, Sección 2.3) y de la variabilidad subyacente de los datos. En la Sección 4 se explica cómo se puede calcular la potencia para valores dados de estos parámetros.

Al diseñar un ensayo, el objetivo es asegurar que el tamaño del ensayo sea lo suficientemente grande como para dar alta potencia si el verdadero efecto de la intervención es lo suficientemente grande como para ser de importancia para la salud pública.

2.3 Elección del criterio

La elección de qué criterio (precisión o potencia) debe utilizarse en cualquier ensayo en particular depende de los objetivos del ensayo. Si se sabe inequívocamente que la intervención tiene algún efecto (relativo al grupo de comparación (control)), tiene poco sentido probar la hipótesis nula; más bien el objetivo puede ser estimar la magnitud del efecto y hacerlo con alguna precisión especificada aceptable.

En los ensayos de nuevas intervenciones, a menudo no se sabe si habrá algún impacto en absoluto de la intervención en los resultados de interés, y lo que se requiere es 'prueba de concepto'. En estas circunstancias, puede ser suficiente para asegurar que habrá buenas posibilidades de obtener un resultado significativo si efectivamente hay un efecto de alguna magnitud especificada. No obstante, hay que recalcar que, de adoptarse este curso, las estimaciones obtenidas pueden ser muy imprecisas. Para ilustrar esto, supongamos que se planea comparar dos grupos con respecto a la media de alguna variable, y supongamos que la verdadera diferencia entre las medias del grupo es D. Si se elige el tamaño del ensayo para dar 90% de potencia (de obtener una diferencia significativa con p<0.05p<0.05en una prueba de dos caras) si el diferencia es D, se espera que el IC 95% sobre D se extienda aproximadamente de 0.4 D a 1.6 D. Este es un rango amplio e implica que la estimación del efecto de la intervención será imprecisa. En muchas situaciones, puede ser más apropiado elegir el tamaño de la muestra estableciendo el ancho del CI, en lugar de depender de cálculos de potencia.

Recuadro 5.1 La potencia del juicio depende de:

El valor de la verdadera diferencia entre los grupos de estudio, es decir, el verdadero efecto de la intervención. Cuanto mayor sea el efecto, mayor será el poder para detectar el efecto como estadísticamente significativo para un ensayo de un tamaño dado.
El tamaño de la prueba. Cuanto mayor sea el tamaño de la prueba, mayor será la potencia.
El nivel de probabilidad (valor p) en el que una diferencia será considerada como 'estadísticamente significativa'.

2.4 Ensayos con múltiples resultados

La discusión en las Secciones 2.1 a 2.3 se refiere a factores que influyen en la elección del tamaño del ensayo, con respecto a una medida de resultado particular. En la mayoría de los ensayos, se miden varios resultados diferentes. Por ejemplo, en un ensayo sobre el impacto de los mosquiteros tratados con insecticida en la malaria infantil, puede haber interés en los efectos de la intervención sobre las muertes, muertes atribuibles a la malaria, episodios de malaria clínica, tamaños de bazo al final de la temporada de malaria, PCV al final de la temporada de malaria, y posiblemente otras medidas.

En el Capítulo 12, Sección 2, se destaca la importancia de definir de antemano el resultado primario y un número limitado de resultados secundarios de un ensayo. Para decidir sobre el tamaño del ensayo, el investigador primero debe centrar la atención en el resultado primario, ya que los resultados de este resultado tendrán el mayor peso al informar los hallazgos del ensayo, y es esencial que el ensayo sea capaz de proporcionar resultados adecuados para este resultado. Los métodos de este capítulo pueden utilizarse para calcular el tamaño de ensayo requerido para el resultado primario y cada uno de los resultados secundarios.

Idealmente, el resultado que da como resultado el mayor tamaño de ensayo se utilizaría para determinar el tamaño, ya que entonces, para otros resultados, se sabría que se lograría una precisión o potencia mejor que la requerida. A menudo se encuentra, sin embargo, que uno o más de los resultados requerirían un ensayo demasiado grande para los recursos que probablemente estén disponibles. Por ejemplo, detectar cambios en la mortalidad, o mortalidad por causa específica, a menudo requiere ensayos muy grandes. En estas circunstancias, se puede decidir diseñar el ensayo para poder detectar un impacto en la morbilidad y aceptar que es poco probable que pueda generar hallazgos concluyentes sobre el efecto en la mortalidad. Es importante señalar, sin embargo, que si un ensayo demuestra que una intervención tiene un impacto en la morbilidad, puede considerarse poco ético emprender otro ensayo más amplio para evaluar el impacto en la mortalidad. Por esta razón, en general es recomendable asegurar que los ensayos se realicen en una etapa temprana en la que el resultado de mayor importancia para la salud pública sea el punto final alrededor del cual se planifica el ensayo. Este tema se discute más a fondo en el Capítulo 6.

A veces, se pueden usar diferentes tamaños de ensayo para diferentes resultados. Por ejemplo, podría ser posible diseñar un ensayo de tal manera que una gran muestra de participantes sea monitoreada en busca de mortalidad, digamos por encuestas anuales, y solo una proporción de participantes sea monitoreada por morbilidad, digamos por visitas semanales.

Si no es factible diseñar el ensayo para lograr la potencia o precisión adecuadas para el resultado primario, el juicio debe abandonarse o adoptarse un resultado primario diferente.

2.5 Restricciones prácticas

En la práctica, las consideraciones estadísticas no son los únicos factores que deben tenerse en cuenta al planear el tamaño de una investigación. Los recursos, en términos de personal, vehículos, capacidad de laboratorio, tiempo o dinero, pueden limitar el tamaño potencial de un ensayo, y a menudo es necesario comprometer entre los resultados de los cálculos del tamaño del ensayo y lo que se puede administrar con los recursos disponibles. Tratar de hacer un ensayo que esté más allá de la capacidad de los recursos disponibles probablemente sea infructuoso, ya que es probable que la calidad de los datos se vea afectada y los resultados puedan estar sujetos a serios sesgos, o el juicio puede incluso colapsar por completo, desperdiciando el esfuerzo y el dinero que ya se gastaron. Si los cálculos indican que un ensayo de tamaño manejable producirá potencia y/o precisión inaceptablemente baja, probablemente sea mejor no realizar el juicio en absoluto.

Un enfoque útil para examinar la compensación entre el tamaño del ensayo (y por lo tanto el costo) y la potencia es construir curvas de potencia para una o dos de las variables clave de resultado. Las curvas de potencia muestran cómo varía la potencia con el tamaño del ensayo para diferentes valores de la medida del efecto. La Figura 5.1 muestra las curvas de potencia para las muertes por malaria en el ensayo mosquito-net discutido en la Sección 2.4, asumiendo que se asignará un número igual de niños a los grupos de intervención y control y la significación estadística se basará en una prueba de dos caras al nivel del 5%. R representa la tasa de mortalidad por malaria en el grupo de intervención, en comparación con el grupo control, de manera que R=0.3R=0.3representa una reducción en la tasa de mortalidad de 70%. Los supuestos utilizados para construir estas curvas se describen en la Sección 4. Las curvas indican que, si se siguiera a 1000 niños por 1 año en cada grupo (haciendo 2000 niños en total), habría aproximadamente una probabilidad de uno en dos de obtener un resultado significativo (potencia = 50%), aunque la reducción en la tasa de mortalidad fuera tan alta como 70%. Un ensayo cinco veces más grande que éste tendría una buena probabilidad (alrededor del 80%) de detectar una reducción en la tasa de mortalidad del 50% o más pero sería inadecuado (alrededor del 40%) para detectar una reducción del 30% en la tasa de mortalidad.

Figura 5.1 Curvas de poder para un ensayo del efecto de mosquito-mosquiteros sobre las muertes por malaria.

Se supone que la tasa de mortalidad por malaria en el grupo control es de 10/1000/año. R, tasa relativa en el grupo de intervención. Asume grupos de igual tamaño, prueba de dos caras y significancia p < 0.05.

Search

Text Color

Text Size

Margin Size

Font Type