Saltar al contenido principal
LibreTexts Español

8.1.2: Canal binario no simétrico

  • Page ID
    82527
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Un canal binario no simétrico es aquel en el que las probabilidades de error para las entradas 0 y 1 son diferentes, es decir,\(c_{01} \neq c_{10}\). Ilustramos canales binarios no simétricos con un caso extremo basado en una prueba médica para la enfermedad de Huntington.

    Screen Shot 2021-05-19 a las 11.38.51 PM.png
    Figura 8.3:: Prueba de la Enfermedad de Huntington

    La Enfermedad de Huntington es un trastorno cerebral hereditario poco frecuente, progresivo y sin cura conocida. Fue nombrado así por el Dr. George Huntington (1850—1915), un médico de Long Island que publicó una descripción en 1872. Es causado por un gen defectuoso, el cual fue identificado en 1983. Quizás la persona más famosa que padece la enfermedad fue la compositora Woodie Guthrie.

    El hijo biológico de una persona que porta el gen defectuoso tiene un 50% de probabilidad de heredar el gen defectuoso. Para la población en su conjunto, la probabilidad de portar el gen defectuoso es mucho menor. Según la Huntington's Disease Society of America, http://www.hdsa.org, “Más de un cuarto de millón de estadounidenses tienen EH o están 'en riesgo' de heredar la enfermedad de un padre afectado”. Esto es alrededor de 1/1000 de la población, por lo que para una persona seleccionada al azar, con antecedentes familiares desconocidos, es razonable estimar la probabilidad de portar el gen afectado a 1/2000.

    Las personas portadoras del gen defectuoso eventualmente desarrollan la enfermedad a menos que mueran primero por otra causa. Los síntomas aparecen con mayor frecuencia en la mediana edad, en personas de entre 40 y 50 años, tal vez después de que ya hayan producido una familia y con ello posiblemente hayan transmitido el gen defectuoso a otra generación. Aunque la enfermedad no es mortal, las que se encuentran en etapas avanzadas generalmente mueren por sus complicaciones. Hasta hace poco, las personas con antecedentes familiares de la enfermedad se enfrentaban a una vida de incertidumbre, sin saber si portaban el gen defectuoso, y sin saber cómo manejar su vida personal y profesional.

    En 1993 se desarrolló una prueba que puede decir si portas el gen defectuoso. Desafortunadamente la prueba no es perfecta; existe la probabilidad de un falso positivo (reportando que lo tienes cuando realmente no lo haces) y de un falso negativo (reportar que tu gen no es defectuoso cuando realmente lo es). Para nuestros fines asumiremos que la prueba sólo da una respuesta sí/no, y que la probabilidad de un falso positivo es del 2% y la probabilidad de un falso negativo es del 1%. (La prueba real es realmente mejor; también estima la gravedad del defecto, que se correlaciona con la edad a la que comienzan los síntomas).

    Si te haces la prueba y aprendes el resultado, por supuesto te gustaría inferir si eventualmente desarrollarás la enfermedad. Las técnicas desarrolladas anteriormente pueden ayudar.

    Modelaremos la prueba como un proceso discreto sin memoria, con entrada\(A\) (sin gen defectuoso) y\(B\) (gen defectuoso), y salidas\(P\) (positivas) y\(N\) (negativas). El proceso, mostrado en la Figura 8.3, no es un canal binario simétrico, porque las dos probabilidades de error no son iguales.

    Primero, considere la aplicación de esta prueba a alguien con antecedentes familiares, para lo cual\(p(A) = p(B)\) = 0.5. Entonces, si la prueba es negativa, la probabilidad, para esa persona, de tener el defecto es 1/99 = 0.0101 y la probabilidad de no tenerlo es 98/99 = 0.9899. Por otra parte, si la prueba es positiva, la probabilidad, para esa persona, de portar el gen defectuoso es 99/101 = 0.9802 y la probabilidad de no hacerlo es 2/101 = 0.0198. La prueba es muy efectiva, ya que las dos salidas implican, a alta probabilidad, diferentes entradas.

    Una pregunta interesante que se plantea por la existencia de esta prueba pero que no es abordada por nuestro modelo matemático es si una persona con antecedentes familiares elegiría tomar el examen, o si preferiría vivir sin saber lo que le depara el futuro. El desarrollo de la prueba fue financiado por un grupo que incluía a la viuda de Guthrie y encabezado por un hombre llamado Milton Wexler (1908—2007), quien estaba preocupado por sus hijas porque su esposa y sus hermanos tenían la enfermedad. Las hijas de Wexler, cuya situación inspiró el desarrollo de la prueba, decidieron no tomarla.

    A continuación, considere la aplicación de esta prueba a alguien con antecedentes familiares desconocidos, de manera que\(p(A)\) = 0.9995 y\(p(B)\) = 0.0005. Entonces, si la prueba es negativa, la probabilidad de que esa persona porte el gen defectuoso\(p(B \;|\; N)\) es

    \[\dfrac{0.0005 \times 0.01}{0.0005 \times 0.01+0.9995 \times 0.98}=0.000005105 \tag{8.9} \]

    y la probabilidad de que esa persona porte el gen normal\(p(A \;|\; N)\) es

    \[\dfrac{0.9995 \times 0.98}{0.0005 \times 0.01+0.9995 \times 0.98}=0.999994895 \tag{8.10} \]

    Por otro lado, si la prueba es positiva, la probabilidad de que esa persona porte el gen defectuoso\(p(B \;|\; P)\) es

    \[\dfrac{0.0005 \times 0.99}{0.0005 \times 0.99+0.9995 \times 0.02}= 0.02416 \tag{8.11} \]

    y la probabilidad de no tener el defecto\(p(A \;|\; P)\) es

    \[\dfrac{0.9995 \times 0.02}{0.0005 \times 0.99+0.9995 \times 0.02}= 0.97584 \tag{8.12} \]

    La prueba no parece distinguir las dos entradas posibles, ya que la probabilidad abrumadora es que la persona tenga un gen normal, independientemente de los resultados de la prueba. En otras palabras, si obtienes un resultado positivo en la prueba, es más probable que haya sido causado por un error de prueba que por un gen defectuoso. Parece que no hay un propósito útil servido por probar a personas sin antecedentes familiares. (Por supuesto, se podrían hacer pruebas repetidas para reducir la tasa de falsos positivos).

    Un análisis de información muestra claramente la diferencia entre estos dos casos. Primero, recordemos que las probabilidades son subjetivas, u dependientes del observador. El técnico de laboratorio que realiza la prueba presumiblemente no sabe si hay antecedentes familiares, por lo que no podría inferir nada de los resultados. Sólo alguien que conozca los antecedentes familiares podría hacer una inferencia útil. Segundo, es instructivo calcular el flujo de información en los dos casos. Recordemos que las cinco medidas de información (\(I, L, M, N\), y\(J\)) dependen de las probabilidades de entrada. Un cálculo sencillo de los dos casos conduce a las cantidades de información (en bits) en la Tabla 8.1 (observe cuánto más grande\(N\) es que\(M\) si no hay antecedentes familiares conocidos).

    Cuadro 8.1: Características del modelo de prueba de la enfermedad de Huntington
    \(p(A)\) \(p(B)\) \(I\) \(L\) \(M\) \(N\) \(J\)
    Historia familiar \ (p (A)\) ">0.5 \ (p (B)\) ">0.5 \ (I\) ">1.00000 \ (L\) ">0.11119 \ (M\) ">0.88881 \ (N\) ">0.11112 \ (J\) ">0.99993
    Antecedentes familiares desconocidos \ (p (A)\) ">0.9995 \ (p (B)\) ">0.0005 \ (I\) ">0.00620 \ (L\) ">0.00346 \ (M\) ">0.00274 \ (N\) ">0.14141 \ (J\) ">0.14416

    Claramente, la prueba transmite información sobre el estado de los pacientes al reducir la incertidumbre en el caso donde hay antecedentes familiares de la enfermedad. Por otro lado, sin antecedentes familiares hay muy poca información que posiblemente pueda transmitirse porque hay muy poca incertidumbre inicial.


    This page titled 8.1.2: Canal binario no simétrico is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Paul Penfield, Jr. (MIT OpenCourseWare) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.