Saltar al contenido principal

2.1: Experimentos aleatorios

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$
$$\newcommand{\N}{\mathbb{N}}$$

Experimentos

El término parámetro se refiere a una cantidad no aleatoria en un modelo que, una vez elegido, permanece constante. Muchos modelos de probabilidad de experimentos aleatorios tienen uno o más parámetros que se pueden ajustar para ajustarse al experimento físico que se está modelando.

Los sujetos de probabilidad y estadística tienen una relación inversa de clases. En probabilidad, comenzamos con un modelo matemático completamente especificado de un experimento aleatorio. Nuestro objetivo es realizar diversos cálculos que nos ayuden a entender el experimento aleatorio, nos ayuden a predecir lo que sucederá cuando ejecutemos el experimento. En estadística, por el contrario, comenzamos con un modelo matemático incompletamente especificado (uno o más parámetros pueden ser desconocidos, por ejemplo). Realizamos el experimento para recolectar datos, y luego los usamos para extraer inferencias sobre los factores desconocidos en el modelo matemático.

Experimentos con compuestos

Supongamos que tenemos$$n$$ experimentos$$(E_1, E_2, \ldots, E_n)$$. Podemos formar un nuevo experimento compuesto realizando los$$n$$ experimentos en secuencia,$$E_1$$ primero, y luego$$E_2$$ y así sucesivamente, independientemente unos de otros. El término independiente significa, intuitivamente, que el resultado de un experimento no tiene influencia sobre ninguno de los otros experimentos. Haremos que el término matemáticamente preciso posteriormente.

En particular, supongamos que tenemos un experimento básico. Un número fijo (o incluso un número infinito) de réplicas independientes del experimento básico es un experimento nuevo compuesto. Muchos experimentos resultan ser experimentos compuestos y además, como se señaló anteriormente, la teoría de probabilidad (clásica) misma se basa en la idea de replicar un experimento.

En particular, supongamos que tenemos un experimento sencillo con dos resultados. Las réplicas independientes de este experimento se conocen como ensayos de Bernoulli, llamados así por Jacob Bernoulli. Este es uno de los modelos más simples, pero más importantes en probabilidad. De manera más general, supongamos que tenemos un experimento sencillo con$$k$$ posibles resultados. Las repeticiones independientes de este experimento se denominan ensayos multinomiales.

A veces un experimento ocurre en etapas bien definidas, pero de manera dependiente, en el sentido de que el resultado de una etapa determinada está influenciado por los resultados de las etapas anteriores.

Experimentos de muestreo

En la mayoría de los estudios estadísticos, se inicia con una población de objetos de interés. Los objetos pueden ser personas, chips de memoria o acres de maíz, por ejemplo. Por lo general, hay una o más mediciones numéricas de interés para nosotros: la altura y el peso de una persona, la vida útil de un chip de memoria, la cantidad de lluvia, la cantidad de fertilizante y el rendimiento de un acre de maíz.

Aunque nuestro interés está en toda la población de objetos, este conjunto suele ser demasiado grande y demasiado amorfo para estudiarlo. En su lugar, recolectamos una muestra aleatoria de objetos de la población y registramos las mediciones de interés de cada objeto en la muestra.

Existen dos tipos básicos de muestreo. Si se toma una muestra con reemplazo, cada ítem se reemplaza en la población antes del siguiente sorteo; así, un solo objeto puede ocurrir varias veces en la muestra. Si tomamos muestras sin reemplazo, los objetos no son reemplazados en la población. El capítulo sobre Modelos de Muestreo Finito explora una serie de modelos basados en el muestreo de una población finita.

El muestreo con reemplazo puede considerarse como un experimento compuesto, basado en replicaciones independientes del experimento simple de dibujar un solo objeto de la población y registrar las mediciones de interés. Por el contrario, un experimento compuesto que consiste en replicaciones$$n$$ independientes de un experimento simple generalmente se puede considerar como un experimento de muestreo. Por otro lado, el muestreo sin reemplazo es un experimento que consiste en etapas dependientes, debido a que la población cambia con cada sorteo.

Ejemplos y Aplicaciones

La teoría de la probabilidad a menudo se ilustra usando dispositivos simples de juegos de azar: monedas, dados, cartas, hilanderos, urnas con bolas, etc. Los ejemplos basados en tales dispositivos son pedagógicamente valiosos por su simplicidad y claridad conceptual. Por otro lado, sería una lástima que pensaras que la probabilidad sólo se trata de juegos de azar y juegos de azar. Más bien, tratar de ver los problemas que involucran monedas, dados, etc. como metáforas para problemas más complejos y realistas.

Considera el experimento de monedas de lanzar una moneda$$n$$ veces y registrar la partitura (1 para cabezas o 0 para colas) para cada lanzamiento.

1. Identificar un parámetro del experimento.
2. Interpretar el experimento como un experimento compuesto.
3. Interpretar el experimento como un experimento de muestreo.
4. Interpretar el experimento como ensayos de$$n$$ Bernoulli.
Contestar
1. El número de monedas$$n$$ es el parámetro.
2. El experimento consiste en replicaciones$$n$$ independientes del simple experimento de lanzar la moneda una vez.
3. Se puede pensar en el experimento como la selección de una muestra de tamaño$$n$$ con reemplazo de la población$$\{0, 1\}$$.
4. Hay dos resultados en cada lanzamiento y los tirados son independientes.

En la simulación del experimento de monedas, set$$n = 5$$. Ejecute la simulación 100 veces y observe los resultados.

Los dados son dispositivos aleatorios que, al igual que las monedas, datan de la antigüedad y vienen en una variedad de tamaños y formas. Por lo general, las caras de un dado tienen números u otros símbolos grabados en ellas. Nuevamente, lo importante es que cuando se lanza un dado, se elige una cara única (generalmente la cara ascendente, pero a veces la descendente). Para más información sobre los dados, consulta la sección introductoria en el capítulo sobre Juegos de azar.

Considera el experimento de dados de lanzar un dado de$$k$$ lados (con caras numeradas del 1 al$$k$$),$$n$$ tiempos y registrar las puntuaciones para cada lanzamiento.

1. Identificar los parámetros del experimento.
2. Interpretar el experimento como un experimento compuesto.
3. Interpretar el experimento como un experimento de muestreo.
4. Identificar el experimento como ensayos$$n$$ multinomiales.
Contestar
1. Los parámetros son el número de dados$$n$$ y el número de caras$$k$$.
2. El experimento consiste en replicaciones$$n$$ independientes del simple experimento de lanzar un dado.
3. Se puede pensar en el experimento como la selección de una muestra de tamaño$$n$$ con reemplazo de la población$$\{1, 2, \ldots, k\}$$.
4. Los mismos$$k$$ resultados ocurren para cada dado los lanzamientos son independientes.

En realidad, la mayoría de los dados son sólidos platónicos (llamados así por Platón, por supuesto) con 4, 6, 8, 12 o 20 lados. El troquel de seis lados es el estándar.

En la simulación del experimento de dados, set$$n = 5$$. Ejecute la simulación 100 veces y observe los resultados.

En el experimento de troquelado, se lanza un dado estándar y luego se lanza una moneda el número de veces que se muestra en el dado. Se registra la secuencia de puntuaciones de monedas (1 para cabezas y 0 para colas). Interpretar el experimento como un experimento compuesto.

Contestar

La primera etapa consiste en enrollar la matriz y la segunda etapa consiste en lanzar la moneda. Las etapas son dependientes porque el número de lanzamientos depende del resultado del lanzamiento del dado.

Obsérvese que este experimento se puede obtener aleatorizando el parámetro$$n$$ en el experimento básico de monedas en (1).

Ejecute la simulación del experimento die-coin 100 veces y observe los resultados.

En el experimento de troqueles de monedas, se lanza una moneda. Si la moneda aterriza cabezas, se lanza un dado rojo y si la moneda aterriza colas, se lanza un dado verde. Se registra la puntuación de la moneda (1 para las cabezas y 0 para las colas) y la puntuación del dado. Interpretar el experimento como un experimento compuesto.

Contestar

La primera etapa consiste en lanzar la moneda y la segunda etapa consiste en enrollar la matriz. Las etapas son dependientes porque se lanzan diferentes dados (que pueden comportarse de manera diferente), dependiendo del resultado del lanzamiento de la moneda.

Ejecute la simulación del experimento de monedas 100 veces y observe los resultados.

Tarjetas

Los juegos de cartas, como las monedas y los dados, datan de la antigüedad. Desde el punto de vista de la probabilidad, lo importante es que una carta de juego codifica una serie de propiedades o atributos en la parte frontal de la carta que están ocultos en el dorso de la carta. (Más adelante en este capítulo, estas propiedades se convertirán en variables aleatorias). En particular, una baraja de cartas estándar puede ser modelada por el conjunto de productos cartesianos$D = \{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, j, q, k \} \times \{\clubsuit, \diamondsuit, \heartsuit, \spadesuit \}$ donde la primera coordenada codifica la denominación o tipo (as, 2—10, jack, reina, rey) y donde la segunda coordenada codifica el palo (palos, diamantes, corazones, espadas). A veces representamos una carta como una cadena en lugar de un par ordenado (por ejemplo$$q \heartsuit$$ más que$$(q, \heartsuit)$$ para la reina de corazones). Algunas otras propiedades, derivadas de las dos principales, son el color (los diamantes y los corazones son rojos, los palos y las espadas son negros), la cara (las tomas, las reinas y los reyes tienen caras, las otras cartas no), y el orden del palo (de menor a mayor rango:$$(\clubsuit, \diamondsuit, \heartsuit, \spadesuit)$$).

Considera el experimento de cartas que consiste en repartir$$n$$ cartas de un mazo estándar (sin reemplazo).

1. Identificar un parámetro del experimento.
2. Interpretar el experimento como un experimento compuesto.
3. Interpretar el experimento como un experimento de muestreo.
Contestar
1. El parámetro es$$n$$, el número de cartas repartidas.
2. En cada etapa, sacamos una carta de una baraja, pero la baraja cambia de un sorteo a otro, por lo que las etapas son dependientes.
3. El experimento consiste en seleccionar una muestra de tamaño$$n$$ de la población$$D$$, sin reemplazo.

En la simulación del experimento de cartas, set$$n = 5$$. Ejecute la simulación 100 veces y observe los resultados.

El caso especial$$n = 5$$ es el experimento de poker y el caso especial$$n = 13$$ es el experimento bridge.

Abre cada uno de los siguientes para ver representaciones del juego de cartas en algunas pinturas famosas.

1. Hacer trampa con el as de los clubes por Georges de La Tour
2. Los Cardsharps de Michelangelo Carravagio
3. Los jugadores de cartas de Paul Cézanne
4. Su Estación y Cuatro Ases de CM Coolidge
5. Waterloo de CM Coolidge

Urna Modelos

Los modelos de urnas se utilizan a menudo en probabilidad como metáforas simples para el muestreo de una población finita.

Una urna contiene bolas$$m$$ distintas, etiquetado de 1 a$$m$$. El experimento consiste en seleccionar$$n$$ bolas de la urna, sin reemplazo, y registrar la secuencia de números de bolas.

1. Identificar los parámetros del experimento.
2. Interpretar el experimento como un experimento compuesto.
3. Interpretar el experimento como un experimento de muestreo.
Contestar
1. Los parámetros son el número de bolas$$m$$ y el tamaño de la muestra$$n$$.
2. En cada etapa, sacamos una bola de la urna, pero el contenido de la urna cambia de un sorteo a otro, por lo que las etapas son dependientes
3. El experimento consiste en seleccionar una muestra de tamaño$$n$$ de las bolas en la urna (la población), sin reemplazo.

Considera el modelo básico de urna del ejercicio anterior. Supongamos que$$r$$ de las$$m$$ bolas son rojas y las$$m - r$$ bolas restantes son verdes. Identificar un parámetro adicional del modelo. Este experimento es una metáfora para el muestreo de una población dicotómica general

Contestar

Los parámetros son el tamaño de la población$$m$$, el tamaño$$n$$ de la muestra y el número de bolas rojas$$r$$.

En la simulación del experimento de urna, conjunto$$m = 100$$,$$r = 40$$, y$$n = 25$$. Ejecutar el experimento 100 veces y observar los resultados.

Una urna contiene inicialmente$$m$$ bolas;$$r$$ son rojas y$$m - r$$ son verdes. Se selecciona una bola de la urna y se retira, y luego se reemplaza con$$k$$ bolas del mismo color. El proceso se repite. Esto se conoce como el modelo de urna de Pólya, que lleva el nombre de George Pólya.

1. Identificar los parámetros del experimento.
2. Interpretar el caso$$k = 0$$ como un experimento de muestreo.
3. Interpretar el caso$$k = 1$$ como un experimento de muestreo.
Contestar
1. Los parámetros son el tamaño de la población$$m$$, el número inicial de bolas$$r$$ rojas y el número de bolas nuevas agregadas$$k$$.
2. Cuando$$k = 0$$, cada bola extraída se retira y no se agregan bolas nuevas, por lo que el experimento consiste en seleccionar una muestra de tamaño$$n$$ de la urna, sin reemplazo.
3. Cuando$$k = 1$$, cada bola dibujada es reemplazada por otra bola del mismo color. Entonces al menos en cuanto a los colores de las bolas, el experimento equivale a seleccionar una muestra de tamaño$$n$$ de la urna, con reemplazo.

Abre la imagen de la pintura Alegoría de la Fortuna de Dosso Dossi. Presumiblemente el joven ha elegido boletos de lotería de una urna.

Experimento de monedas de Buffon

El experimento de monedas de Buffon consiste en lanzar una moneda con radio$$r \leq \frac{1}{2}$$ sobre un piso cubierto con azulejos cuadrados de longitud lateral 1. Se registran las coordenadas del centro de la moneda, relativas a los ejes que atraviesan el centro del cuadrado, paralelas a los lados. El experimento lleva el nombre del comte de Buffon.

1. Identificar un parámetro del experimento
2. Interpretar el experimento como un experimento compuesto.
3. Interpretar el experimento como experimento de muestreo.
Contestar
1. El parámetro es el radio de la moneda$$r$$.
2. Se puede pensar en el experimento como seleccionar las coordenadas del centro de la moneda independientemente unas de otras.
3. El experimento equivale a seleccionar una muestra de tamaño 2 de la población$$\left[-\frac{1}{2}, \frac{1}{2}\right]$$, con reemplazo.

En la simulación del experimento de monedas de Buffon, set$$r = 0.1$$. Ejecutar el experimento 100 veces y observar los resultados.

En el modelo habitual de confiabilidad estructural, un sistema consta de$$n$$ componentes, cada uno de los cuales está funcionando o falló. Los estados de los componentes son inciertos y, por lo tanto, definen un experimento aleatorio. El sistema en su conjunto también está funcionando o falló, dependiendo de los estados de los componentes y de cómo se conecten los componentes. Por ejemplo, un sistema en serie funciona si y solo si cada componente funciona, mientras que un sistema paralelo funciona si y solo si al menos un componente funciona. De manera más general, un $$n$$sistema$$k$$ fuera funciona si al menos$$k$$ los componentes funcionan.

Considera el modelo$$k$$ fuera de$$n$$ confiabilidad.

1. Identificar dos parámetros.
2. ¿Qué valor$$k$$ da un sistema en serie?
3. ¿Qué valor$$k$$ da un sistema paralelo?
Contestar
1. Los parámetros son$$k$$ y$$n$$
2. $$k = n$$da un sistema en serie.
3. $$k = 1$$da un sistema paralelo.

El modelo de confiabilidad anterior es un modelo estático. Se puede extender a un modelo dinámico asumiendo que cada componente está funcionando inicialmente, pero tiene un tiempo aleatorio hasta el fallo. El sistema en su conjunto también tendría un tiempo aleatorio hasta la falla que dependería de los tiempos de falla del componente y de la estructura del sistema.

Genética

En la reproducción sexual ordinaria, el material genético de un niño es una combinación aleatoria del material genético de los padres. Así, el nacimiento de un niño es un experimento aleatorio con respecto a resultados como color de ojos, tipo de cabello y muchos otros rasgos físicos. A menudo estamos particularmente interesados en la transmisión aleatoria de rasgos y la transmisión aleatoria de trastornos genéticos.

Por ejemplo, consideremos un modelo excesivamente simplificado de un rasgo heredado que tiene dos estados posibles (fenotipos), digamos una planta de guisante cuyas vainas son verdes o amarillas. El término alelo se refiere a formas alternas de un gen en particular, por lo que estamos asumiendo que existe un gen que determina el color de la vaina, con dos alelos:$$g$$ para el verde y$$y$$ para el amarillo. Una planta de guisante tiene dos alelos para el rasgo (uno de cada progenitor), por lo que los genotipos posibles son

• $$gg$$, alelos para vainas verdes de cada padre.
• $$gy$$, un alelo para vainas verdes de uno de los padres y un alelo para vainas amarillas del otro (generalmente no podemos observar qué progenitor contribuyó con qué alelo).
• $$yy$$, alelos para vainas amarillas de cada padre.

Los genotipos$$gg$$ y$$yy$$ se llaman homocigotos porque los dos alelos son iguales, mientras que al genotipo$$gy$$ se le llama heterocigótico porque los dos alelos son diferentes. Por lo general, uno de los alelos del rasgo heredado es dominante y el otro recesivo. Así, por ejemplo, si$$g$$ es el alelo dominante para el color de vaina, entonces una planta con genotipo$$gg$$ o$$gy$$ tiene vainas verdes, mientras que una planta con genotipo$$yy$$ tiene vainas amarillas. Los genes se pasan de padres a hijos de manera aleatoria, por lo que cada nueva planta es un experimento aleatorio con respecto al color de las vainas.

El color de las vainas en los guisantes fue en realidad uno de los primeros ejemplos de un rasgo heredado estudiado por Gregor Mendel, quien es considerado el padre de la genética moderna. Mendel también estudió el color de las flores (amarillas o moradas), la longitud de los tallos (cortos o largos) y la textura de las semillas (redondas o arrugadas).

Para otro ejemplo, el tipo de$$ABO$$ sangre en humanos está controlado por tres alelos:$$a$$,$$b$$, y$$o$$. Así, los genotipos posibles son$$aa$$$$ab$$,$$ao$$,$$bb$$,$$bo$$ y$$oo$$. Los alelos$$a$$ y$$b$$ son codominantes y$$o$$ es recesivo. Así, existen cuatro posibles tipos de sangre (fenotipos):

• Tipo$$A$$: genotipo$$aa$$ o$$ao$$
• Tipo$$B$$: genotipo$$bb$$ o$$bo$$
• Tipo$$AB$$: genotipo$$ab$$
• tipo$$O$$: genotipo$$oo$$

Por supuesto, la sangre puede ser mecanografiada de maneras mucho más extensas que la simple$$ABO$$ tipificación. El factor RH (positivo o negativo) es el ejemplo más conocido.

Para nuestro tercer ejemplo, consideremos un trastorno hereditario vinculado al sexo en humanos. Se trata de un trastorno debido a un defecto en el cromosoma X (uno de los dos cromosomas que determinan el género). Supongamos que$$h$$ denota el alelo sano y$$d$$ el alelo defectuoso para el gen vinculado al trastorno. Las mujeres tienen dos cromosomas X, y por lo general$$d$$ es recesivo. Así, una mujer con genotipo$$hh$$ es completamente normal con respecto al padecimiento; una mujer con genotipo$$hd$$ no tiene el trastorno, sino que es portadora, ya que puede pasar el alelo defectuoso a sus hijos; y una mujer con genotipo$$dd$$ tiene el trastorno. Un hombre solo tiene un cromosoma X (su otro cromosoma sexual, el cromosoma Y, normalmente no juega ningún papel en el trastorno). Un hombre con genotipo$$h$$ es normal y un hombre con genotipo$$d$$ tiene el trastorno. Ejemplos de trastornos hereditarios vinculados al sexo son el dicromatismo, la forma más común de daltonismo, y la hemofilia, un trastorno hemorrágico. Nuevamente, los genes se pasan de padres a hijos de manera aleatoria, por lo que el nacimiento de un niño es un experimento aleatorio en términos del trastorno.

Procesos puntuales

Hay una serie de procesos importantes que generan puntos aleatorios en el tiempo. A menudo, los puntos aleatorios se denominan llegadas. Aquí hay algunos ejemplos específicos:

• veces que una pieza de material radiactivo emite partículas elementales
• veces que los clientes llegan a una tienda
• tiempos en que las solicitudes llegan a un servidor web
• tiempos de falla de un dispositivo

Para formalizar un experimento, podríamos registrar el número de llegadas durante un intervalo de tiempo específico o podríamos registrar los tiempos de llegadas sucesivas.

Hay otros procesos que producen puntos aleatorios en el espacio. Por ejemplo,

• defectos en una pieza de chapa
• errores en una cadena de símbolos (en un programa de computadora, por ejemplo)
• pasas en un pastel
• erratas en una página
• estrellas en una región del espacio

Nuevamente, para formalizar un experimento, podríamos registrar el número de puntos en una determinada región del espacio.

En 1879, Albert Michelson construyó un experimento para medir la velocidad de la luz con un interferómetro. El conjunto de datos de velocidad de la luz contiene los resultados de 100 repeticiones del experimento de Michelson. Explorar el conjunto de datos y explicar, de manera general, la variabilidad de los datos.

Contestar

La variablilidad se debe a la medición y otros errores experimentales más allá del control de Michelson.

En 1998, dos estudiantes de la Universidad de Alabama en Huntsville diseñaron el siguiente experimento: comprar una bolsa de M&Ms (de una talla anunciada especificada) y registrar los recuentos de caramelos rojos, verdes, azules, naranjas y amarillos, y el peso neto (en gramos). Explore los datos de M&M. establecer y explicar, de manera general, la variabilidad de los datos.

Contestar

La variabilidad en el peso se debe al error de medición por parte de los estudiantes y a errores de fabricación por parte de la empresa. La variabilidad en los recuentos de color es menos clara y puede deberse a una aleatoriedad intencionada por parte de la empresa.

En 1999, dos investigadores de la Universidad de Belmont diseñaron el siguiente experimento: capturar una cigarra en el área de Middle Tennessee y registrar el peso corporal (en gramos), la longitud del ala, la anchura del ala y la longitud corporal (en milímetros), el género y el tipo de especie. El conjunto de datos de cigarra contiene los resultados de 104 repeticiones de este experimento. Explorar los datos de cigarra y explicar, de manera general, la variabilidad de los datos.

Contestar

La variabilidad en las mediciones corporales se debe a diferencias en las tres especies, a todo tipo de factores ambientales y a errores de medición por parte de los investigadores.

El 6 de junio de 1761, James Short realizó 53 mediciones del paralaje del sol, basadas en el tránsito de Venus. Explore el conjunto de datos Short y explique, de manera general, la variabilidad de los datos.

Contestar

La variabilidad se debe a la medición y otros errores experimentales más allá del control de Short.

En 1954, se realizaron dos ensayos masivos de campo en un intento de determinar la efectividad de la nueva vacuna desarrollada por Jonas Salk para la prevención de la polio. En ambos ensayos, se administró la vacuna a un grupo de niños de tratamiento mientras que a un grupo control de niños no. Se midió la incidencia de polio en cada grupo. Explore el conjunto de datos de ensayos de campo de polio y explique, de manera general, el experimento aleatorio subyacente.

Contestar

El experimento aleatorio básico consiste en observar si un niño determinado, en el grupo de tratamiento o grupo de control, sufre de polio en un periodo de tiempo determinado. Presumiblemente, una menor incidencia de polio en el grupo de tratamiento en comparación con el grupo control sería evidencia de que la vacuna fue efectiva.

Cada año, de 1969 a 1972, se realizaba una lotería en Estados Unidos para determinar quién sería reclutado para el servicio militar. Esencialmente, la lotería era un modelo de pelota y urna y se hizo famosa porque muchos creían que el proceso no era lo suficientemente aleatorio. Explore el conjunto de datos de la lotería del draft de Vietnam y especule sobre cómo se podría juzgar el grado de aleatoriedad.

Contestar

Este es un problema difícil, pero presumiblemente en una lotería suficientemente aleatoria, no se esperaría ver fechas del mismo mes agrupadas demasiado juntas. Observar tal agrupamiento, entonces, sería evidencia de que la lotería no fue aleatoria.

Modelos deterministas versus probabilísticos

Se podría argumentar que algunos de los ejemplos discutidos anteriormente son inherentemente deterministas. Al lanzar una moneda, por ejemplo, si conocemos las condiciones iniciales (que involucran posición, velocidad, rotación, etc.), las fuerzas que actúan sobre la moneda (gravedad, resistencia al aire, etc.), y la composición de la moneda (forma, densidad de masa, centro de masa, etc.), entonces las leyes de la física deberían permitirnos predecir con precisión cómo la moneda aterrizará. Esto es cierto en un sentido técnico, teórico, pero falso en un sentido muy real. Las monedas, los dados y muchos sistemas más complicados e importantes son caóticos en el sentido de que los resultados de interés dependen de manera muy sensible de las condiciones iniciales y otros parámetros. En tales situaciones, bien podría ser imposible conocer nunca las condiciones iniciales y las fuerzas con la suficiente precisión para usar métodos deterministas.

En el experimento de monedas, por ejemplo, incluso si eliminamos la mayor parte de la complejidad del mundo real, todavía nos queda un experimento esencialmente aleatorio. Joseph Keller en su artículo La probabilidad de las cabezas analizó determinísticamente el lanzamiento de una moneda bajo una serie de supuestos ideales:

1. La moneda es un círculo perfecto y tiene un grosor insignificante
2. El centro de gravedad de la moneda es el centro geométrico.
3. La moneda es inicialmente cabeza arriba y se le da una velocidad inicial hacia arriba$$u$$ y una velocidad angular$$\omega$$.
4. En vuelo, la moneda gira alrededor de un eje horizontal a lo largo de un diámetro de la moneda.
5. En vuelo, la moneda se rige únicamente por la fuerza de la gravedad. Todas las demás fuerzas posibles (resistencia al aire o viento, por ejemplo) son descuidadas.
6. La moneda no rebota ni rueda después de aterrizar (como podría ser el caso si aterriza en arena o barro).

Por supuesto, pocos de estos supuestos ideales son válidos para monedas reales lanzadas por humanos. Dejar$$t = u / g$$ donde$$g$$ esta la aceleracion de la gravedad (en unidades apropiadas). Tenga en cuenta que el$$t$$ justo tiene unidades de tiempo (en segundos) y por lo tanto es independiente de cómo se mide la distancia. El parámetro escalado$$t$$ en realidad representa el tiempo requerido para que la moneda alcance su altura máxima.

Keller demostró que las regiones del espacio de parámetros$$(t, \omega)$$ donde aterriza la moneda ya sea boca arriba o cola arriba están separadas por$\omega = \left( 2n \pm \frac{1}{2} \right) \frac{\pi}{2t}, \quad n \in \N$ las curvas El parámetro$$n$$ es el número total de revoluciones en el lanzamiento. A continuación se presenta una gráfica de algunas de estas curvas. La región más grande, en la esquina inferior izquierda, corresponde al evento de que la moneda no completa ni una sola rotación, y así por supuesto aterriza de cabeza, tal y como empezó. La siguiente región corresponde a una rotación, con las colas de aterrizaje de monedas hacia arriba. En general, las regiones alternan entre cabezas y colas.

El punto importante, por supuesto, es que para valores incluso moderados de$$t$$ y$$\omega$$, las curvas están muy juntas, de manera que un pequeño cambio en las condiciones iniciales puede desplazar fácilmente el resultado de cabeza a cola hacia arriba o a la inversa. Como se señala en el artículo de Keller, el probabilista y estadístico Persi Diaconis determinó experimentalmente que los valores típicos de las condiciones iniciales para un lanzamiento de moneda real son$$t = \frac{1}{4}$$ segundos y$$\omega = 76 \pi \approx 238.6$$ radianes por segundo. Estos valores corresponden a$$n = 19$$ revoluciones en el lanzamiento. Por supuesto, este punto de parámetro está mucho más allá de la región mostrada en nuestra gráfica, en una región donde las curvas están exquisitamente juntas.

This page titled 2.1: Experimentos aleatorios is shared under a CC BY 2.0 license and was authored, remixed, and/or curated by Kyle Siegrist (Random Services) via source content that was edited to the style and standards of the LibreTexts platform.