3.8: La falacia de los números pequeños
- Page ID
- 101218
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Supongamos que un estudio mostró que de los 3,141 condados de Estados Unidos, la incidencia de cáncer de riñón fue más baja en aquellos condados que son en su mayoría rurales, escasamente poblados y ubicados en estados tradicionalmente republicanos. De hecho, esto es cierto. 9 ¿Qué explica este interesante hallazgo? La mayoría de las personas estarían tentadas a buscar una explicación causal, buscar características del entorno rural que expliquen la menor incidencia de cáncer. No obstante, estarían equivocados (en este caso) al hacerlo. Es fácil ver por qué una vez consideramos los condados que tienen la mayor incidencia de cáncer de riñón: ¡son condados que en su mayoría son rurales, escasamente poblados y ubicados en estados tradicionalmente republicanos! Entonces, sea lo que sea que pensaras podría explicar las tasas más bajas de cáncer en los condados rurales no puede ser la explicación correcta, ya que estos condados también tienen las tasas más altas de cáncer. Es importante entender que no son los mismos condados los que tienen las tasas más altas y más bajas, por ejemplo, el condado X no tiene una tasa de cáncer alta y baja (en relación con otros condados de Estados Unidos). Eso sería una contradicción (y así no puede ser posiblemente cierto). Más bien, lo que sucede es que los condados que tienen las tasas más altas de cáncer de riñón son “en su mayoría rurales, escasamente poblados y ubicados en estados tradicionalmente republicanos” pero también los condados que tienen las tasas más bajas de cáncer de riñón son “en su mayoría rurales, escasamente poblados y ubicados en tradicionalmente republicanos estados.” ¿Cómo podría ser esto? Antes de darte la explicación, te voy a dar un ejemplo más sencillo y a ver si puedes averiguarlo a partir de ese ejemplo.
Supongamos que un frasco contiene cantidades iguales de canicas rojas y blancas. Jack y Jill se turnan para sacar canicas del frasco. No obstante, dibujan canicas a diferentes ritmos. Jill dibuja 5 canicas a la vez mientras que Jack dibuja 2 canicas a la vez. ¿Quién es más probable que dibuje más a menudo ya sea todas las canicas rojas o todas las blancas: Jack o Jill? 10
La respuesta aquí debería ser obvia: es más probable que Jack dibuje canicas de todo el mismo color con más frecuencia, ya que Jack solo está dibujando 2 canicas a la vez. Dado que Jill está dibujando 5 canicas a la vez, será menos probable que sus sorteos den canicas de todos el mismo color. Esto es simplemente un hecho de muestreo y está relacionado con los errores de muestreo discutidos en la sección 3.1. Una muestra demasiado pequeña tenderá a no ser representativa de la población. En el caso de los mármoles, si vemos los sorteos de Jack como muestras, entonces sus muestras, cuando producen canicas de todo el mismo color, estarán lejos de ser representativas de la proporción de canicas en el frasco, ya que la relación es 50/50 de blanco a rojo y sus sorteos a veces rinden 100% rojo o 100% blanco. Jill, por otro lado, tenderá a no obtener una muestra tan poco representativa. Dado que Jill está dibujando un mayor número de canicas, es menos probable que sus muestras se apagaran drásticamente de la manera en que Jack's podría ser. El punto general que se debe tomar de este ejemplo es que las muestras más pequeñas tienden a los extremos, tanto en términos de sobrerepresentar alguna característica como en subrepresentar esa misma característica.
¿Ves cómo esto podría aplicarse al caso de las tasas de cáncer de riñón en condados rurales poco poblados? Existe una tasa nacional de cáncer de riñón que es un promedio de todas las tasas de cáncer de riñón de los 3,141 condados en Estados Unidos Imagínese clasificar cada condado en términos de las tasas de cáncer de mayor a menor. El hallazgo es que hay una proporción relativamente mayor de los condados escasamente poblados en la parte superior de esta lista, pero también una proporción relativamente mayor de los condados escasamente poblados al final de la lista. Pero, ¿por qué sería que los condados más escasamente poblados estarían sobrerrepresentados en ambos extremos de la lista? La razón es que estos condados tienen poblaciones más pequeñas, por lo que tenderán a tener resultados más extremos (ya sea de las tasas más altas o menores). Así como es más probable que Jack obtenga todas las canicas blancas o todas las canicas rojas (un resultado extremo), los condados menos poblados tenderán a tener tasas de cáncer que están en el extremo, en relación con el promedio nacional. Y esto es un hecho puramente estadístico; no tiene nada que ver con características de esos ambientes que hacen que la tasa de cáncer sea mayor o menor. Así como los sorteos extremos de Jack no tienen nada que ver con la forma en que está dibujando (sino que son simplemente el resultado de hechos estadísticos, matemáticos), los extremos de los condados más pequeños no tienen nada que ver con las características de esos condados, sino solo con el hecho de que son más pequeños y así tenderán a tener más extremos resultados (es decir, tasas de cáncer que son mayores o menores que el promedio nacional).
La primera lección para llevar a casa aquí es que los grupos más pequeños tenderán hacia los extremos en términos de su posesión de alguna característica, en relación con los grupos más grandes. Podemos llamar a esto la ley de los números pequeños. El segundo mensaje para llevar a casa es que nuestros cerebros están conectados para buscar explicaciones causales en lugar de explicaciones matemáticas, y debido a esto somos propensos a ignorar la ley de los números pequeños y buscar una explicación causal de los fenómenos. La falacia de los números pequeños es nuestra tendencia a buscar una explicación causal para algún fenómeno cuando solo se necesita la ley de los números pequeños para explicar ese fenómeno.
Terminaremos esta sección con un ejemplo algo humorístico e increíble de un pequeño sesgo de números que, presumiblemente, desperdició miles de millones de dólares. Este ejemplo, también, viene de Kahneman, quien a su vez escuchó la anécdota de algunos de sus colegas que son estadísticos. 11 Hace algún tiempo, la fundación Gates (que es la fundación benéfica del fundador de Microsoft, Bill Gates) donó 1.7 mil millones para investigar un hallazgo curioso: las escuelas más pequeñas tienden a tener más éxito que las escuelas más grandes. Es decir, si se considera un orden de clasificación de las escuelas más exitosas, las escuelas más pequeñas tenderán a estar sobrerrepresentadas cerca de la parte superior (es decir, hay una mayor proporción de ellas cerca de la parte superior de la lista en comparación con la proporción de escuelas más grandes en la parte superior de la lista). Este es el hallazgo de que la Fundación Gates invirtió 1.7 mil millones de dólares para ayudar a entender. Para ello, crearon escuelas más pequeñas, a veces dividiendo las escuelas más grandes a la mitad. No obstante, nada de esto fue necesario. Si la Fundación Gates (o los que les asesoran) hubieran mirado que las características de las peores escuelas, ¡habrían encontrado que esas escuelas también tendían a ser más pequeñas! El “hallazgo” es simplemente el resultado de la ley de los números pequeños: los grupos más pequeños tienden hacia los extremos (en ambos extremos de un espectro) más que los grupos más grandes. En este caso, el hecho de que las escuelas más pequeñas tienden a ser tanto más exitosas como menos exitosas se explica de la misma manera que explicamos por qué Jack tiende a obtener ya sea todas las canicas rojas o todas las blancas con más frecuencia que Jill.
9 Este ejemplo tomado de Kahneman (2011), op. cit., p. 109.
10 Este ejemplo también se toma (con modificaciones menores) de Kahneman (2011), p. 110.
11 Kahneman (2011), pp. 117-118.