Saltar al contenido principal
LibreTexts Español

1.3: Cómo obtener los datos

  • Page ID
    149969
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Existen dos principios principales del muestreo: la replicación y la aleatorización.

    La replicación sugiere que el mismo efecto será investigado varias veces. Esta idea deriva del postulado de “números grandes” matemáticos fundamentales que en palabras simples es “cuanto más, mejor”. Cuando cuentes réplicas, recuerda que deben ser independientes. Por ejemplo, si investigas cómo la luz influye en el crecimiento de las plantas y usas cinco cámaras de cultivo, cada una con diez plantas, entonces el número de réplicas es cinco, no cincuenta. Esto se debe a que las plantas dentro de cada cámara no son independientes ya que todas crecen en el mismo ambiente, pero investigamos las diferencias entre ambientes. Cinco cámaras son réplicas, mientras que cincuenta plantas son pseudoréplicas.

    Las mediciones repetidas son otra complicación. Por ejemplo, en un estudio de memoria visual a corto plazo se planeó que diez voluntarios miraran el mismo objeto específico varias veces. El problema aquí es que la gente puede recordar el objeto y recordarlo más rápido hacia el final de una secuencia. En consecuencia, estas múltiples veces no son réplicas, son mediciones repetidas que podrían decir algo sobre el aprendizaje pero no sobre la memoria misma. Sólo hay diez réplicas verdaderas.

    Otra pregunta importante es cuántas réplicas se deben recolectar. Existe la inmensa cantidad de publicaciones al respecto, pero en esencia, hay dos respuestas: a) tantas como sea posible y b) 30. La segunda respuesta parece un poco divertida pero esta regla general es el resultado de muchos años de experiencia. Por lo general, las muestras cuyo tamaño es menor a 30, se consideran pequeñas. Sin embargo, incluso muestras minúsculas podrían ser útiles, y existen métodos de análisis de datos que funcionan con cinco e incluso con tres réplicas. También hay métodos especiales (análisis de potencia) que permiten estimar cuántos objetos recolectar (daremos un ejemplo a su debido tiempo).

    La aleatorización dice entre otras cosas que cada objeto debe tener las mismas posibilidades de entrar en la muestra. Con bastante frecuencia, los investigadores piensan que los datos fueron aleatorizados mientras que en realidad no se recopilaron de manera aleatoria.

    Por ejemplo, ¿cómo seleccionar la muestra de 100 árboles en el gran bosque? Si tratamos simplemente de caminar y seleccionar árboles que de alguna manera atrajeron la atención, esta muestra no será aleatoria porque estos árboles están de alguna manera desviados y es por eso que los vimos. Dado que una de las mejores formas de aleatorización es introducir el orden que a sabiendas está ausente en la naturaleza (o al menos no relacionado con la pregunta del estudio), el método confiable es, por ejemplo, usar un mapa detallado del bosque, seleccionar dos coordenadas aleatorias y encontrar el árbol que está más cerca el punto seleccionado. Sin embargo, los árboles no crecen homogéneamente, algunos de ellos (como los abetos) tienden a crecer juntos mientras que otros (como los robles) prefieren mantenerse separados. Con el método descrito anteriormente, los abetos tendrán una mejor oportunidad de entrar en muestra para que rompa la regla de aleatorización. Podríamos emplear el segundo método y hacer un transecto a través del bosque usando cuerda, luego seleccionar todos los árboles tocados con él, y luego seleccionar, diciendo, cada quinto árbol para hacer un total de cien.

    ¿Es apropiado el último (segundo) método? ¿Cómo mejorarlo?

    Ahora ya sabes lo suficiente como para responder a otra pregunta:

    Érase una vez un experimento con el objetivo de investigar el efecto de diferentes venenos químicos en los gorgojos. Los gorgojos se sujetaron en frascos, se colocaron químicos en fragmentos de papel de filtro. Investigador abrió el frasco, luego recogió el gorgojo que primero salió del frasco, lo puso en el papel de filtro y esperó hasta que muriera el gorgojo. Entonces investigador cambió químico, e inicia la segunda serie de experimento en el mismo plato, y así sucesivamente. Pero por alguna razón desconocida, el primer químico utilizado siempre fue el más fuerte (los gorgojos murieron muy rápido). ¿Por qué? ¿Cómo organizar mejor este experimento?


    This page titled 1.3: Cómo obtener los datos is shared under a Public Domain license and was authored, remixed, and/or curated by Alexey Shipunov via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.