3.1: Argumentos inductivos y generalizaciones estadísticas

Última actualización
Guardar como PDF

Page ID: 101244

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Como vimos en el capítulo 1 (sección 1.8), un argumento inductivo es un argumento cuya conclusión se supone que debe seguir de sus premisas con un alto nivel de probabilidad, más que con certeza. Esto quiere decir que aunque es posible que la conclusión no se desprenda de sus premisas, es poco probable que así sea. Dijimos que los argumentos inductivos son “derrotables”, lo que significa que podríamos convertir un argumento inductivo fuerte en un argumento inductivo débil simplemente agregando más premisas al argumento. En contraste, los argumentos deductivos que son válidos nunca pueden ser invalidados agregando más premisas. Recordemos nuestro argumento de “Tweets”:

1. Los tweets son un ave sana, que funciona normalmente
2. Las aves más sanas, que funcionan normalmente vuelan
3. Por lo tanto, los Tweets probablemente vuelan

Sin saber nada más de Tweets, es una buena apuesta que los Tweets vuelen volando. No obstante, si tuviéramos que agregar que los Tweets miden 6 pies de altura y pueden correr 30 mph, entonces ya no es una buena apuesta que los Tweets puedan volar (ya que en este caso los Tweets probablemente sean avestruces y por lo tanto no puedan volar). La segunda premisa, “las aves más sanas, que funcionan normalmente vuelan”, es una generalización estadística. Las generalizaciones estadísticas son generalizaciones a las que se llega mediante observaciones empíricas de ciertas regularidades. Las generalizaciones estadísticas pueden ser universales o parciales. Las generalizaciones universales afirman que todos los miembros (es decir, 100%) de una determinada clase tienen cierta característica, mientras que las generalizaciones parciales afirman que la mayoría o algún porcentaje de los miembros de una clase tienen cierta característica. Por ejemplo, la afirmación de que “el 67.5% de todos los presos liberados de prisión vuelven a ser detenidos dentro de los tres años” es una generalización parcial que es mucho más precisa que simplemente decir que “la mayoría de los presos liberados de prisión vuelven a ser detenidos dentro de los tres años”. En contraste, la afirmación de que “todos los presos liberados de prisión son redetenidos dentro de tres años” es una generalización universal. Como podemos ver en estos ejemplos, los argumentos deductivos suelen utilizar generalizaciones estadísticas universales, mientras que los argumentos inductivos suelen utilizar generalizaciones estadísticas parciales. Dado que las generalizaciones estadísticas suelen ser premisas cruciales tanto en argumentos deductivos como inductivos, poder evaluar cuándo una generalización estadística es buena o mala es crucial para poder evaluar argumentos. Lo que estamos haciendo al evaluar las generalizaciones estadísticas es determinar si la premisa en nuestro argumento es cierta (o al menos bien respaldada por la evidencia). Por ejemplo, considere el siguiente argumento inductivo, cuya premisa es una generalización estadística (parcial):

1. El 70% de los votantes dice que votará por el candidato X
2. Por lo tanto, el candidato X probablemente ganará la elección

Este es un argumento inductivo porque aunque la premisa sea cierta, la conclusión aún podría ser falsa (por ejemplo, un opositor del candidato X podría matar o intimidar sistemáticamente a aquellos votantes que pretendan votar por el candidato X para que muy pocos de ellos realmente voten). Además, es claro que el argumento pretende ser inductivo porque la conclusión contiene la palabra “probablemente”, que indica claramente que se pretende una inferencia inductiva, más que deductiva. Recuerda que al evaluar argumentos queremos saber sobre la fuerza de la inferencia desde las premisas hasta la conclusión, ¡pero también queremos saber si la premisa es cierta! Podemos evaluar si una generalización estadística es cierta o no considerando si la generalización estadística cumple ciertas condiciones. Hay dos condiciones que toda generalización estadística debe cumplir para que la generalización se considere “buena”.

1. Tamaño de muestra adecuado: el tamaño de la muestra debe ser lo suficientemente grande como para soportar la generalización.
2. Muestra no sesgada: la muestra no debe estar sesgada.

Una muestra es simplemente una porción de una población. Una población es la totalidad de miembros de algún conjunto específico de objetos o eventos. Por ejemplo, si estuviera determinando la proporción relativa de autos a camiones que circulan por mi calle en un día determinado, la población sería el número total de autos y camiones que circulan por mi calle en un día determinado. Si tuviera que sentarme en mi porche delantero de 12-2 pm y contar todos los autos y camiones que conducían por mi calle, eso sería una muestra. Una buena generalización estadística es aquella en la que la muestra es representativa de la población. Cuando una muestra es representativa, las características de la muestra coinciden con las características de la población en general. Por ejemplo, mi método de muestreo de autos y camiones que conducen por mi calle sería un buen método siempre y cuando la proporción de camiones a autos que condujeron por mi calle entre las 12-2 de la tarde coincidiera con la proporción de camiones a autos que condujeron por mi calle durante todo el día. Si por alguna razón el número de camiones que circulaban por mi calle de 12-2 pm era muy superior al promedio para todo el día, mi muestra no sería representativa de la población sobre la que intentaba generalizar (es decir, el número total de autos y camiones que circulaban por mi calle en un día). La condición de “tamaño de muestra adecuado” y la condición de “muestra no sesgada” son formas de asegurar que una muestra sea representativa. En el resto de esta sección, explicaremos cada una de estas condiciones a su vez.

Quizás sea más fácil ilustrar estas dos condiciones considerando lo que está mal con las generalizaciones estadísticas que no cumplen con una o más de estas condiciones. Primero, considere un caso en el que el tamaño de la muestra sea demasiado pequeño (y por lo tanto no se cumpla la condición de tamaño de muestra adecuado). Si tuviera que sentarme frente a mi casa solo quince minutos de 12:00-12:15 y viera solo un auto, entonces mi muestra consistiría en solo 1 automóvil, que resultó ser un auto. Si tratara de generalizar a partir de esa muestra, entonces tendría que decir que solo los autos (y no los camiones) circulan por mi calle. Pero la evidencia de esta generalización estadística universal (es decir, “cada automóvil que conduce por mi calle es un automóvil”) es extremadamente pobre ya que he muestreado sólo una porción muy pequeña de la población total (es decir, el número total de automóviles que conducen por mi calle). Tomar esta muestra para ser representativa sería como ir a Flagstaff, AZ por un día y decir que como allí llovió ese día, debe llover todos los días en Flagstaff. Inferir a tal generalización es una falacia informal llamada “generalización apresurada”. Se comete la falacia de la generalización apresurada cuando se infiere una generalización estadística (ya sea universal o parcial) sobre una población a partir de muy pocas instancias de esa población. Las falacias apresuradas de generalización son muy comunes en el discurso cotidiano, como cuando una persona da solo un ejemplo de que ocurre un fenómeno y trata implícitamente ese caso como evidencia suficiente para una generalización. Esto funciona especialmente bien cuando se trata de miedo o intereses prácticos. Por ejemplo, Jones y Smith están hablando de la calidad relativa de Fords versus Chevys y Jones le cuenta a Smith sobre el Ford de su tío, que se descompuso numerosas veces dentro del primer año de poseerlo. Jones luego dice que los Fords simplemente no son confiables y por eso nunca compraría uno. La generalización, que aquí es ambigua entre una generalización universal (es decir, todos los Ford no son confiables) y una generalización parcial (es decir, la mayor/muchos Ford no son confiables), no está respaldada por un solo caso, por más convencido que pudiera estar Smith después de escuchar la anécdota sobre el Ford del tío de Jones.

La condición de muestra no sesgada puede no cumplirse incluso cuando se cumple la condición de tamaño de muestra adecuado. Por ejemplo, supongamos que cuento todos los autos de mi calle por un periodo de tres horas de 11-2 pm durante un día laborable. Supongamos que contar tres horas seguidas nos da un tamaño de muestra adecuado. No obstante, supongamos que durante esas horas (horas de almuerzo) hay una proporción mucho mayor de camiones a automóviles, ya que (supongamos) muchos camiones de trabajo vienen hacia y desde los lugares de trabajo durante esas horas de almuerzo. Si ese fuera el caso, entonces mi muestra, aunque lo suficientemente grande, no sería representativa porque estaría sesgada. En particular, el número de camiones a automóviles en la muestra sería mayor que en la población general, lo que haría que la muestra no sea representativa de la población (y por tanto sesgada).

Otra buena manera de ilustrar el sesgo de muestreo es considerando encuestas. Entonces considere al candidato X que se postula para cargos electos y que apoya firmemente los derechos de armas y es el candidato de elección de la NRA. Supongamos que una organización realiza una encuesta para determinar cómo le va al candidato X contra el candidato Y, quien está activamente en contra de los derechos de armas. Pero supongamos que la forma en que la organización administra la encuesta es encuestando a los suscriptores de la revista, Field y Stream. Supongamos que la encuesta arrojó más de 5000 respuestas, lo que, supongamos, es un tamaño muestral adecuado y de esas respuestas, 89% favoreció al candidato X. Si la organización tomara esa muestra para apoyar la generalización estadística de que “la mayoría de los votantes están a favor del candidato X” entonces habrían hecho una error. Si sabes algo de la revista Field and Stream, debería ser obvio por qué. Field and Stream es una revista cuyos suscriptores tenderían a poseer armas y apoyar los derechos de armas. Por lo tanto, esperaríamos que los suscriptores de esa revista tuvieran un porcentaje mucho mayor de activistas por los derechos de armas que la población en general, a la que la encuesta intenta generalizar. Pero en este caso, la muestra sería poco representativa y sesgada y así la encuesta sería inútil. Si bien la muestra nos permitiría generalizar a la población, “suscriptores de Field y Stream”, no nos permitiría generalizar a la población en general.

Consideremos un ejemplo más de sesgo de muestreo. Supongamos que el candidato X se postulaba en un distrito en el que había una alta proporción de votantes de la tercera edad. Supongamos que el candidato X favoreció las políticas en contra de las que estaban los votantes Por ejemplo, supongamos que el candidato X favorece recortar los fondos de Medicare para reducir el déficit presupuestario, mientras que el candidato Y favoreció mantener o aumentar el apoyo a Medicare. A lo largo viene una organización que está interesada en sondear a los votantes para determinar qué candidato es favorecido en el distrito. Supongamos que la organización elige administrar la encuesta vía mensaje de texto y que los resultados de la encuesta muestran que el 75% de los votantes favorecen al candidato X. ¿Puedes ver qué tiene de malo la encuesta, por qué está sesgada? Probablemente reconozcas que este método de sondeo no producirá una muestra representativa porque los votantes de la tercera edad son mucho menos propensos a usar teléfonos celulares y mensajes de texto y así la encuesta dejará de lado las respuestas de estos votantes adultos mayores (que, suponemos conforman un gran segmento de la población). Así, la muestra será sesgada y no representativa de la población objetivo. En consecuencia, cualquier intento de generalizar a la población en general sería sumamente desaconsejado.

Antes de terminar esta sección, debemos considerar otra fuente de sesgo, que es un sesgo en el propio cuestionario de sondeo (lo que los estadísticos llaman el “instrumento”). Supongamos que una encuesta está tratando de determinar cuánto favorece una población a los productos alimenticios orgánicos. Podemos imaginar el cuestionario que contiene una elección como la siguiente:

¿Cuál prefieres?
a. productos que son caros y no tienen ninguna ventaja comprobada por la FDA sobre los productos menos costosos
b. productos que son económicos y no tienen desventajas comprobadas por la FDA sobre los productos más caros

Debido al fraseo de las opciones, parece claro que muchas personas elegirán la opción “b”. Aunque las dos opciones describen con precisión la diferencia entre productos orgánicos y no orgánicos, la opción “b” suena mucho más deseable que la opción “a”. La redacción de las opciones está sesgada en la medida en que “a” es un suplente de “orgánico” y “b” es suplente de “no orgánico”. Incluso las personas que prefieren los productos orgánicos pueden estar más inclinadas a elegir la opción “b” aquí. Así, la encuesta no sería representativa porque las respuestas estarían sesgadas por el fraseo sesgado de las opciones. Aquí hay otro ejemplo con el mismo punto:

¿Cuál es tu favor?
a. Preservar el derecho constitucional del ciudadano a portar armas
b. Dejar indefensos a ciudadanos honestos frente a delincuentes armados

Nuevamente, debido a que la opción “b” suena tan mal y “a” suena más atractiva, quienes responden a una encuesta con esta pregunta podrían estar inclinados a elegir “a” aunque realmente no apoyen los derechos de armas. Este es otro ejemplo de cómo el sesgo puede arrastrarse hacia una generalización estadística a través de una forma sesgada de hacer una pregunta.

El muestreo aleatorio es un método de muestreo común que intenta evitar cualquier tipo de sesgo de muestreo haciendo que la selección de individuos para la muestra sea una cuestión de azar (es decir, cualquier persona en la población es tan probable como cualquier otra persona de ser elegido para la muestra). La justificación básica detrás del método de muestreo aleatorio es que si la muestra es verdaderamente aleatoria (es decir, cualquier persona de la población es tan probable como cualquier otra persona de ser elegida para la muestra), entonces la muestra será representativa. El truco para cualquier técnica de muestreo aleatorio es encontrar una manera de seleccionar individuos para la muestra que no cree ningún tipo de sesgo. Un método común utilizado para seleccionar individuos para una muestra aleatoria (por ejemplo, por encuestas de Gallup) es llamar a las personas ya sea por su teléfono fijo o celular. Dado que la mayoría de los estadounidenses con derecho a voto tienen ya sea un teléfono fijo o un celular, esta es una buena manera de garantizar que cada estadounidense tenga las mismas posibilidades de ser incluido en la muestra. A continuación, un programa de computadora generador de números aleatorios selecciona números para marcar. De esta manera, organizaciones como Gallup son capaces de obtener algo parecido a una muestra aleatoria y son capaces de representar a toda la población estadounidense con un tamaño de muestra tan pequeño como 1000 (con un margen de error de +/- 4). A medida que cambian la tecnología y los factores sociales, las técnicas de muestreo aleatorio tienen que actualizarse. Por ejemplo, aunque Gallup solía llamar solo a teléfonos fijos, eventualmente este método se volvió sesgado porque muchas personas ya no poseían teléfonos fijos, sino solo celulares. Si algún nuevo tipo de tecnología sustituye a los celulares y fijos, entonces Gallup tendrá que ajustar la forma en que obtiene una muestra para reflejar la cambiante realidad social.

Ejercicio

¿Qué tipo de problemas, en su caso, tienen las siguientes generalizaciones estadísticas? Si hay algún problema con la generalización, especifique cuál de las dos condiciones (tamaño de muestra adecuado, muestra no sesgada) no se cumplen. Algunas generalizaciones pueden tener múltiples problemas. Si es así, especifica todos los problemas que veas con la generalización.

1. Bob, de Silverton, CO conduce una camioneta 4x4, por lo que la mayoría de la gente de Silverton, CO conduce camionetas 4x4.
2. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todas las mañanas de 5:00-5:20am. Cuenta en su mayoría palomas matutinas y generaliza, “la mayoría de las aves que aterrizan en mi árbol por la mañana son palomas matutinas”.
3. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todas las mañanas de 5:00-6:00am. Cuenta en su mayoría palomas matutinas y generaliza, “la mayoría de las aves que aterrizan en mi árbol durante el día de 24 horas son palomas matutinas”.
4. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todos los días de 5:00-6:00am, de 11:00-12:00pm, y de 5:00-6:00pm. Cuenta en su mayoría palomas matutinas y generaliza, “la mayoría de las aves que aterrizan en mi árbol durante el día de 24 horas son palomas matutinas”.
5. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todas las noches de 10:00-11:00pm. Cuenta principalmente búhos y generaliza, “la mayoría de las aves que aterrizan en mi árbol a lo largo del día de 24 horas son búhos”.
6. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todas las noches de 10:00-11:00pm y de 2:00-3:00am. Cuenta principalmente búhos y generaliza, “la mayoría de las aves que aterrizan en mi árbol a lo largo de la noche son búhos”.
7. Una encuesta administrada a 10,000 votantes registrados que eran propietarios de viviendas mostró que 90% apoyaba una política para recortar fondos de Medicaid y disminuir los impuestos a la propiedad. Por lo tanto, 90% de los votantes apoyan una política para reducir el financiamiento de Medicaid.
8. Una encuesta telefónica administrada por una computadora que genera aleatoriamente números para llamar, encontró que 68% de los estadounidenses en la muestra de 2000 estaban a favor de legalizar el uso recreativo de marihuana. Así, casi 70% de los estadounidenses favorecen legalizar el uso recreativo de marihuana.
9. Una encuesta telefónica aleatoria en Estados Unidos preguntó a los encuestados si apoyaban a) una política que permita matar a niños inocentes en el útero o b) una política que salve la vida de niños inocentes en el útero. Los resultados mostraron que 69% de los encuestados eligen la opción “b” sobre la opción “a”. Se hizo la generalización de que “la mayoría de los estadounidenses favorecen una política que no permita el aborto”.
10. El primer concierto de rock and roll de Steve fue un concierto de Ani Difranco, en el que la mayoría de los asistentes al concierto eran mujeres con consignas políticas feministas escritas en sus playeras. Steve hace la generalización de que “la mayoría de los asistentes a conciertos de rock and roll son mujeres feministas”. Luego aplica esta generalización al siguiente concierto al que asiste (Tom Petty) y se sorprende mucho por lo que encuentra.
11. Un director de secundaria realiza una encuesta sobre cuán satisfechos están los estudiantes con su preparatoria pidiendo a los estudiantes detenidos que llenen una encuesta de satisfacción. Generalizando a partir de esa muestra, infiere que 79% de los estudiantes están insatisfechos con su experiencia en la preparatoria. Está sorprendido y entristecido por el resultado.
12. Después de haber asistido a numerosos partidos de los Pistons en casa a lo largo de 20 años, Alice no puede recordar una época en la que no vio a los vendedores de boletos vendiendo boletos fuera del estadio. Generaliza que siempre hay scalpers en cada partido local de los Pistons.
13. Después de haber asistido a numerosos partidos de los Pistons en casa a lo largo de 20 años, Alice no puede recordar una época en la que no vio a los vendedores de boletos vendiendo boletos fuera del estadio. Generaliza que hay scalpers de boletos en cada partido de la NBA.
14. Después de haber asistido a numerosos partidos de los Pistons en casa a lo largo de 20 años, Alice no puede recordar una época en la que no vio a los vendedores de boletos vendiendo boletos fuera del estadio. Generaliza que hay scalpers de boletos en cada evento deportivo.
15. Bob una vez ordenó una hamburguesa a Burger King y se enfermó violentamente poco después de comerla. A partir de ahora, nunca come en Burger King porque teme que consiga una intoxicación alimentaria.