Saltar al contenido principal
Library homepage
 
LibreTexts Español

11.2: Dos tipos de errores

  • Page ID
    151754
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Antes de entrar en detalles sobre cómo se construye una prueba estadística, es útil entender la filosofía detrás de ella. Lo insinué al señalar la similitud entre una prueba de hipótesis nula y un juicio penal, pero ahora debería ser explícito. Idealmente, nos gustaría construir nuestra prueba para que nunca cometamos ningún error. Desafortunadamente, como el mundo está desordenado, esto nunca es posible. A veces simplemente tienes mucha mala suerte: por ejemplo, supongamos que lanzas una moneda 10 veces seguidas y se te sube de cabeza las 10 veces. Eso se siente como una prueba muy fuerte de que la moneda está sesgada (¡y lo es!) , pero claro que hay una probabilidad de 1 en 1024 de que esto sucediera aunque la moneda fuera totalmente justa. Es decir, en la vida real siempre tenemos que aceptar que existe la posibilidad de que hayamos hecho lo incorrecto. Como consecuencia, el objetivo detrás de las pruebas de hipótesis estadísticas no es eliminar errores, sino minimizarlos.

    En este punto, necesitamos ser un poco más precisos sobre lo que entendemos por “errores”. En primer lugar, digamos lo obvio: o bien se da el caso de que la hipótesis nula es verdadera, o es falsa; y nuestra prueba rechazará la hipótesis nula o la conservará. 160 Entonces, como lo ilustra la siguiente tabla, después de que ejecutemos la prueba y hagamos nuestra elección, podría haber sucedido una de cuatro cosas:

    retener H 0 retener H 0
    H 0 es cierto decisión correcta error (tipo I)
    H 0 es falso error (tipo II) decisión correcta

    Como consecuencia, en realidad hay dos tipos diferentes de error aquí. Si rechazamos una hipótesis nula que en realidad es cierta, entonces hemos cometido un error tipo I. Por otro lado, si conservamos la hipótesis nula cuando de hecho es falsa, entonces hemos hecho un error tipo II.

    ¿Recuerdas cómo dije que las pruebas estadísticas eran como un juicio penal? Bueno, lo decía en serio. Un juicio penal requiere que se establezca “más allá de toda duda razonable” que el acusado lo hizo. Todas las reglas probatorias están (en teoría, al menos) diseñadas para garantizar que no haya (casi) ninguna posibilidad de condenar injustamente a un acusado inocente. El juicio está diseñado para proteger los derechos de un acusado: como dijo el famoso jurista inglés William Blackstone, es “mejor que diez culpables escapen que que sufra un inocente”. Es decir, un juicio penal no trata los dos tipos de error de la misma manera~... castigar al inocente se considera mucho peor que dejar libre al culpable. Una prueba estadística es prácticamente la misma: el principio de diseño más importante de la prueba es controlar la probabilidad de un error tipo I, para mantenerlo por debajo de alguna probabilidad fija. Esta probabilidad, que se denota α, se llama el nivel de significancia de la prueba (o a veces, el tamaño de la prueba). Y lo volveré a decir, porque es tan central para toda la configuración~... se dice que una prueba de hipótesis tiene nivel de significancia α si la tasa de error tipo I no es mayor que α.

    Entonces, ¿qué pasa con la tasa de error tipo II? Bueno, también nos gustaría mantenerlos bajo control, y denotamos esta probabilidad por β. Sin embargo, es mucho más común referirse a la potencia de la prueba, que es la probabilidad con la que rechazamos una hipótesis nula cuando realmente es falsa, que es 1−β. Para ayudar a mantener esto recto, aquí está la misma tabla nuevamente, pero con los números relevantes agregados:

    retener H 0 rechazar H 0
    H 0 es cierto 1−α (probabilidad de retención correcta) α (tasa de error tipo I)
    H 0 es falso β (tasa de error tipo II) 1−β (potencia de la prueba)

    Una prueba de hipótesis “poderosa” es aquella que tiene un pequeño valor de β, al tiempo que mantiene α fijo en algún nivel (pequeño) deseado. Por convención, los científicos hacen uso de tres niveles α diferentes: .05, .01 y .001. Observe la asimetría aquí~... las pruebas están diseñadas para asegurar que el nivel α se mantenga pequeño, pero no hay garantía correspondiente con respecto a β. Ciertamente nos gustaría que la tasa de error tipo II fuera pequeña, e intentamos diseñar pruebas que la mantengan pequeña, pero esto es muy secundario a la abrumadora necesidad de controlar la tasa de error tipo I. Como podría haber dicho Blackstone si fuera estadístico, es “mejor retener 10 hipótesis falsas nulas que rechazar una sola verdadera”. Para ser honesto, no sé si estoy de acuerdo con esta filosofía —hay situaciones en las que creo que tiene sentido, y situaciones en las que creo que no— pero eso no es ni aquí ni allá. Es como se construyen las pruebas.


    This page titled 11.2: Dos tipos de errores is shared under a CC BY-SA 4.0 license and was authored, remixed, and/or curated by Danielle Navarro via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.