3: Pseudoreplicación: elija sus datos sabiamente

Última actualización
Guardar como PDF

Page ID: 150565

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\( \newcommand{\dsum}{\displaystyle\sum\limits} \)

\( \newcommand{\dint}{\displaystyle\int\limits} \)

\( \newcommand{\dlim}{\displaystyle\lim\limits} \)

\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\id}{\mathrm{id}}\)

\( \newcommand{\Span}{\mathrm{span}}\)

\( \newcommand{\kernel}{\mathrm{null}\,}\)

\( \newcommand{\range}{\mathrm{range}\,}\)

\( \newcommand{\RealPart}{\mathrm{Re}}\)

\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

\( \newcommand{\Argument}{\mathrm{Arg}}\)

\( \newcommand{\norm}[1]{\| #1 \|}\)

\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)

\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)

\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\( \newcommand{\vectorC}[1]{\textbf{#1}} \)

\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

\(\newcommand{\longvect}{\overrightarrow}\)

\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

Muchos estudios se esfuerzan por recopilar más datos a través de la replicación: repitiendo sus mediciones con pacientes o muestras adicionales, pueden estar más seguros de sus números y descubrir relaciones sutiles que no son obvias a primera vista. Hemos visto el valor de los datos adicionales para mejorar el poder estadístico y detectar pequeñas diferencias. Pero, ¿qué cuenta exactamente como replicación?

Volvamos a un ejemplo médico. Tengo dos grupos de\(100\) pacientes tomando diferentes medicamentos, y busco establecer qué medicamento disminuye más la presión arterial. Yo hago que cada grupo tome el medicamento durante un mes para permitir que surta efecto, y luego sigo a cada grupo durante diez días, cada día analizando su presión arterial. Ahora tengo diez puntos de datos por paciente y puntos de\(1,000\) datos por grupo.

¡Brillante! \(1,000\)puntos de datos es bastante, y puedo establecer con bastante facilidad si un grupo tiene presión arterial más baja que el otro. Cuando hago cálculos de significancia estadística encuentro resultados significativos muy fácilmente.

Pero espera: esperamos que tomar la presión arterial de un paciente diez veces arroje diez resultados muy similares. Si un paciente está genéticamente predispuesto a la presión arterial baja, he contado su genética diez veces. Si hubiera recopilado datos de pacientes\(1,000\) independientes en lugar de probar repetidamente\(100\), estaría más seguro de que las diferencias entre grupos provenían de los medicamentos y no de la genética y la suerte. Reclamé un gran tamaño muestral, dándome resultados estadísticamente significativos y alto poder estadístico, pero mi afirmación es injustificada.

Este problema se conoce como pseudoreplicación, y es bastante común. ³⁸ Después de probar células de un cultivo, un biólogo podría “replicar” sus resultados probando más células del mismo cultivo. Los neurocientíficos probarán múltiples neuronas del mismo animal, afirmando incorrectamente que tienen un tamaño de muestra grande porque probaron cientos de neuronas de solo dos ratas.

En términos estadísticos, la pseudoreplicación ocurre cuando las observaciones individuales dependen en gran medida entre sí. Su medición de la presión arterial de un paciente estará altamente relacionada con su presión arterial ayer, y su medición de la composición del suelo aquí estará altamente correlacionada con su medición a cinco pies de distancia. Hay varias formas de dar cuenta de esta dependencia al realizar su análisis estadístico:

Promedio de los puntos de datos dependientes. Por ejemplo, promediar todas las mediciones de presión arterial tomadas de una sola persona. Sin embargo, esto no es perfecto; si midió algunos pacientes con más frecuencia que otros, esto no se reflejará en el número promedio. Quieres un método que de alguna manera cuente las mediciones de manera más confiable a medida que se tomen más.
Analiza cada punto de datos dependiente por separado. Podrías realizar un análisis de la presión arterial de cada paciente el día\(5\), dándote solo un punto de datos por persona. Pero ten cuidado, porque si haces esto para todos los días, tendrás problemas con múltiples comparaciones, que discutiremos en el próximo capítulo.
Utilizar un modelo estadístico que dé cuenta de la dependencia, como un modelo jerárquico o un modelo de efectos aleatorios.

Es importante considerar cada enfoque antes de analizar tus datos, ya que cada método es adecuado para diferentes situaciones. La pseudoreplicación facilita el logro de significación, a pesar de que le brinda poca información adicional sobre los sujetos de prueba. Los investigadores deben tener cuidado de no inflar artificialmente sus tamaños de muestra cuando vuelven a probar las muestras.

Search

Text Color

Text Size

Margin Size

Font Type