Saltar al contenido principal

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

En esta unidad, discutimos el primer paso en el panorama general de la estadística: la producción de datos.

La producción de datos ocurre en dos etapas: muestreo y diseño del estudio.

Nuestro objetivo en el muestreo es obtener una muestra que represente bien a la población de interés, para que cuando lleguemos a la etapa de inferencia, sacar conclusiones basadas en esta muestra sobre toda la población tenga sentido.

Se discutieron varios planes de muestreo sesgados, pero también se introdujo la “familia” de planes de muestreo probabilístico, el más simple de los cuales es la muestra aleatoria simple, que (al menos en teoría) se supone que proporciona una muestra que no está sujeta a sesgos.

En la sección de diseño del estudio, se introdujeron 3 tipos de diseño: estudio observacional, experimento controlado y encuesta por muestreo.

Distinguimos entre diferentes tipos de estudios y aprendimos los detalles de cada tipo de diseño de estudio. Al hacerlo, también ampliamos nuestra comprensión del tema de establecer la causalidad que primero se discutió en la dependencia anterior del curso. En la unidad de Análisis Exploratorio de Datos aprendimos que, en general, la asociación no implica causalidad, debido a que las variables al acecho podrían ser responsables de la asociación que observamos, lo que significa que no podemos establecer que exista una relación causal entre nuestra variable “explicativa” y nuestra variable de respuesta.

Vimos que en los estudios observacionales, lo mejor que podemos hacer es controlar lo que pensamos que podrían ser posibles variables al acecho, pero nunca podemos estar seguros de que no hay otras que no anticipamos. Por lo tanto, podemos acercarnos a establecer la causalidad, pero nunca establecerla realmente.

La única forma en que podemos, al menos en teoría, eliminar el efecto de (o controlar) las variables que acechan de ALL es realizando un experimento controlado aleatorizado, en el que los sujetos son asignados aleatoriamente a uno de los grupos de tratamiento. Sólo en este caso podemos interpretar una asociación observada como causalidad.

Obviamente, por razones éticas u otras razones prácticas, no todos los estudios pueden realizarse como un experimento aleatorio. Donde sea posible, sin embargo, un experimento controlado aleatorizado doble ciego es el mejor diseño de estudio que podemos usar.

Otro diseño de estudio muy común es la encuesta. Si bien una encuesta es un tipo especial de estudio observacional, realmente se trata como un diseño separado, ya que es tan común y es el tipo de estudio al que el público en general está más expuesto (encuestas). Es importante que seamos conscientes de que la redacción, el orden o el tipo de preguntas que se hacen en una encuesta podrían tener un impacto en la respuesta. Para que los resultados de una encuesta sean confiables, estos temas deben ser considerados cuidadosamente cuando se diseña la encuesta.

Vimos que con estudios observacionales es difícil establecer evidencias convincentes de una relación causal, debido a la falta de control sobre las variables externas (llamadas variables al acecho). Otros escollos que pueden surgir son que los comportamientos de los individuos pueden verse afectados si saben que están participando en un estudio observacional, y que los recuerdos de los individuos pueden ser defectuosos si se les pide que recuerden información del pasado.

Los experimentos permiten a los investigadores tomar el control de las variables al acecho mediante la asignación aleatoria a los tratamientos, lo que ayuda a proporcionar evidencia más convincente de la causalidad. El diseño puede mejorarse asegurándose de que los sujetos y/o investigadores sean ciegos a quién recibe qué tratamiento. Dependiendo de qué relación se esté investigando, puede ser difícil diseñar un experimento cuyo escenario sea lo suficientemente realista como para que podamos generalizar de manera segura las conclusiones a la vida real.

Otra razón por la que se utilizan estudios observacionales en lugar de experimentos es que ciertas variables explicativas —como los ingresos o la ingesta de alcohol— no pueden o no deben ser controladas por investigadores.

Ocasionalmente se utilizan encuestas por muestreo para examinar las relaciones, pero a menudo evalúan valores de muchas variables separadas, como las opiniones de los encuestados sobre diversos temas. Las preguntas de la encuesta deben diseñarse cuidadosamente, con el fin de asegurar una evaluación imparcial de los valores de las variables.

A lo largo de esta unidad, establecimos lineamientos para la producción ideal de datos, los cuales deben ser mantenidos como estándares para esforzarnos. De manera realista, sin embargo, rara vez es posible realizar un estudio que esté completamente libre de fallas. Por lo tanto, con frecuencia se debe aplicar el sentido común para decidir con qué imperfecciones podemos vivir y cuáles podrían socavar completamente los resultados de un estudio.

(Opcional) Lectura Exterior: Pequeño Manual — Diseño y Muestreo (uno largo y otro corto)

Resumen (Unidad 2) is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by LibreTexts.