3.7: La falacia de la tasa base
- Page ID
- 101243
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Considera el siguiente escenario. Entras algunas pruebas para detectar algunos problemas de salud que has estado teniendo y después de varias pruebas, das positivo para cáncer de colon. ¿Cuáles son las posibilidades de que realmente tengas cáncer de colon? Supongamos que la prueba no es perfecta, pero es 95% precisa. Es decir, en el caso de quienes realmente sí tienen cáncer de colon, la prueba detectará el cáncer el 95% del tiempo (y así lo perderá el 5% de las veces). (La prueba también diagnosticará erróneamente a quienes en realidad no tienen cáncer de colon el 5% de las veces). Mucha gente se inclinaría a decir que, dada la prueba y su precisión, hay un 95% de probabilidades de que tengas cáncer de colon. No obstante, si eres como la mayoría de la gente y te inclinas a responder de esta manera, te equivocas. De hecho, has cometido la falacia de ignorar la tasa base (es decir, la falacia de la tasa base).
La tasa base en este ejemplo es la tasa de quienes tienen cáncer de colon en una población. Hay un porcentaje muy pequeño de la población que realmente tiene cáncer de colon (supongamos que es .005 o .5%), por lo que la probabilidad de que lo tengas debe tomar en cuenta la muy baja probabilidad de que seas de los pocos que lo tienen. Es decir, antes de la prueba (y no tomar en cuenta ningún otro detalle sobre ti), había una probabilidad muy baja de que la tuvieras, es decir, la mitad del uno por ciento de probabilidad (.5%). La prueba es 95% precisa, pero dada la muy baja probabilidad previa de que tengas cáncer de colon, no podemos simplemente ahora decir que hay un 95% de probabilidad de que lo tengas. Más bien, debemos templar esa cifra con la tasa base muy baja. Aquí es como lo hacemos. Supongamos que nuestra población es de 100 mil personas. Si tuviéramos que aplicar la prueba a toda esa población, entregaría 5000 falsos positivos. Un falso positivo ocurre cuando una prueba registra que alguna característica está presente, cuando la característica no está realmente presente. En este caso, el falso positivo es cuando la prueba de cáncer de colon (que dará falsos positivos en el 5% de los casos) dice que alguien lo tiene cuando realmente no lo hace.El número de personas que realmente tienen cáncer de colon (basado en la tasa base establecida) es de 500, y la prueba identificará con precisión el 95 por ciento de esos (o 475 personas). Entonces, lo que necesitas saber es la probabilidad de que seas uno que dio positivo y en realidad tenga cáncer de colon en lugar de uno de los falsos positivos. ¿Y cuál es la probabilidad de eso? Es simplemente el número de personas que realmente tienen cáncer de colon (500) dividido por el número que la prueba identificaría como que tiene cáncer de colon. Este último número incluye aquellos que la prueba identificaría erróneamente (5000) así como el número que identificaría con precisión (475), por lo que el número total que la prueba identificaría como que tiene cáncer de colon sería 5475. Entonces la probabilidad de que la tengas, dada la prueba positiva = 500/5475 = .091 o 9.1%. Entonces la probabilidad de que tengas cáncer, dada la evidencia de la prueba positiva es de 9.1%. Así, contrariamente a nuestro razonamiento inicial de que había un 95% de probabilidades de que tuvieras cáncer de colon, la probabilidad es solo una décima parte de eso, ¡es menos del 10%! Al pensar que la probabilidad de que tengas cáncer está más cerca del 95% estarías ignorando la tasa base de la probabilidad de tener la enfermedad en primer lugar (que, como hemos visto, es bastante baja). Esta es la firma de cualquier falacia de tasa base. Antes de cerrar esta sección, veamos un ejemplo más de una falacia de tasa base.
Supongamos que el gobierno ha desarrollado una máquina que es capaz de detectar la intención terrorista con una precisión del 90%. Durante una reunión conjunta del congreso, una fuente altamente confiable dice que hay un terrorista en el edificio. (Supongamos, en aras de simplificar este ejemplo, que de hecho hay un terrorista en el edificio.) Para determinar quién es el terrorista, la seguridad del edificio sella todas las salidas, redondea a las 3000 personas del edificio y utiliza la máquina para probar a cada persona. Las primeras 30 personas pasan sin desencadenar una identificación positiva de la máquina, pero en la siguiente persona, la máquina desencadena una identificación positiva de intención terrorista. La pregunta es: ¿cuáles son las posibilidades de que la persona que detonó la máquina sea realmente terrorista? 8 Considera las siguientes tres posibilidades: a) 90%, b) 10%, o c) .3%. Si respondiste 90%, entonces volviste a cometer la falacia de la tasa base. ¡La respuesta en realidad es “c” menos del 1%! Aquí está el razonamiento relevante. La tasa base aquí es que es sumamente improbable que algún individuo sea terrorista, dado que sólo hay un terrorista en el edificio y hay 3000 personas en el edificio. Eso significa que la probabilidad de que una persona sea terrorista, antes de cualquier resultado de la prueba, es sumamente baja: 1/3000. Dado que la prueba es 90% precisa, eso significa que de las 3000 personas, identificará erróneamente a 10% de ellas como terroristas = 300 falsos positivos. Suponiendo que la máquina no identifica erróneamente al terrorista real, la máquina identificará a un total de 301 individuos como aquellos que “poseen intención terrorista”. La probabilidad de que alguno de ellos realmente Esta es otra buena ilustración de lo lejos que pueden estar las probabilidades cuando se ignora la tasa base.
8 Este ejemplo se toma (con ciertas alteraciones) de: http://news.bbc.co.uk/2/hi/uk_news/m...ne/8153539.stm