Saltar al contenido principal

# 3.1: Argumentos inductivos y generalizaciones estadísticas

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\id}{\mathrm{id}}$$ $$\newcommand{\Span}{\mathrm{span}}$$

( \newcommand{\kernel}{\mathrm{null}\,}\) $$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$ $$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$ $$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\id}{\mathrm{id}}$$

$$\newcommand{\Span}{\mathrm{span}}$$

$$\newcommand{\kernel}{\mathrm{null}\,}$$

$$\newcommand{\range}{\mathrm{range}\,}$$

$$\newcommand{\RealPart}{\mathrm{Re}}$$

$$\newcommand{\ImaginaryPart}{\mathrm{Im}}$$

$$\newcommand{\Argument}{\mathrm{Arg}}$$

$$\newcommand{\norm}[1]{\| #1 \|}$$

$$\newcommand{\inner}[2]{\langle #1, #2 \rangle}$$

$$\newcommand{\Span}{\mathrm{span}}$$ $$\newcommand{\AA}{\unicode[.8,0]{x212B}}$$

$$\newcommand{\vectorA}[1]{\vec{#1}} % arrow$$

$$\newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow$$

$$\newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vectorC}[1]{\textbf{#1}}$$

$$\newcommand{\vectorD}[1]{\overrightarrow{#1}}$$

$$\newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}}$$

$$\newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}}$$

$$\newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} }$$

$$\newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}}$$

$$\newcommand{\avec}{\mathbf a}$$ $$\newcommand{\bvec}{\mathbf b}$$ $$\newcommand{\cvec}{\mathbf c}$$ $$\newcommand{\dvec}{\mathbf d}$$ $$\newcommand{\dtil}{\widetilde{\mathbf d}}$$ $$\newcommand{\evec}{\mathbf e}$$ $$\newcommand{\fvec}{\mathbf f}$$ $$\newcommand{\nvec}{\mathbf n}$$ $$\newcommand{\pvec}{\mathbf p}$$ $$\newcommand{\qvec}{\mathbf q}$$ $$\newcommand{\svec}{\mathbf s}$$ $$\newcommand{\tvec}{\mathbf t}$$ $$\newcommand{\uvec}{\mathbf u}$$ $$\newcommand{\vvec}{\mathbf v}$$ $$\newcommand{\wvec}{\mathbf w}$$ $$\newcommand{\xvec}{\mathbf x}$$ $$\newcommand{\yvec}{\mathbf y}$$ $$\newcommand{\zvec}{\mathbf z}$$ $$\newcommand{\rvec}{\mathbf r}$$ $$\newcommand{\mvec}{\mathbf m}$$ $$\newcommand{\zerovec}{\mathbf 0}$$ $$\newcommand{\onevec}{\mathbf 1}$$ $$\newcommand{\real}{\mathbb R}$$ $$\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}$$ $$\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}$$ $$\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}$$ $$\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}$$ $$\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}$$ $$\newcommand{\laspan}[1]{\text{Span}\{#1\}}$$ $$\newcommand{\bcal}{\cal B}$$ $$\newcommand{\ccal}{\cal C}$$ $$\newcommand{\scal}{\cal S}$$ $$\newcommand{\wcal}{\cal W}$$ $$\newcommand{\ecal}{\cal E}$$ $$\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}$$ $$\newcommand{\gray}[1]{\color{gray}{#1}}$$ $$\newcommand{\lgray}[1]{\color{lightgray}{#1}}$$ $$\newcommand{\rank}{\operatorname{rank}}$$ $$\newcommand{\row}{\text{Row}}$$ $$\newcommand{\col}{\text{Col}}$$ $$\renewcommand{\row}{\text{Row}}$$ $$\newcommand{\nul}{\text{Nul}}$$ $$\newcommand{\var}{\text{Var}}$$ $$\newcommand{\corr}{\text{corr}}$$ $$\newcommand{\len}[1]{\left|#1\right|}$$ $$\newcommand{\bbar}{\overline{\bvec}}$$ $$\newcommand{\bhat}{\widehat{\bvec}}$$ $$\newcommand{\bperp}{\bvec^\perp}$$ $$\newcommand{\xhat}{\widehat{\xvec}}$$ $$\newcommand{\vhat}{\widehat{\vvec}}$$ $$\newcommand{\uhat}{\widehat{\uvec}}$$ $$\newcommand{\what}{\widehat{\wvec}}$$ $$\newcommand{\Sighat}{\widehat{\Sigma}}$$ $$\newcommand{\lt}{<}$$ $$\newcommand{\gt}{>}$$ $$\newcommand{\amp}{&}$$ $$\definecolor{fillinmathshade}{gray}{0.9}$$

Como vimos en el capítulo 1 (sección 1.8), un argumento inductivo es un argumento cuya conclusión se supone que debe seguir de sus premisas con un alto nivel de probabilidad, más que con certeza. Esto quiere decir que aunque es posible que la conclusión no se desprenda de sus premisas, es poco probable que así sea. Dijimos que los argumentos inductivos son “derrotables”, lo que significa que podríamos convertir un argumento inductivo fuerte en un argumento inductivo débil simplemente agregando más premisas al argumento. En contraste, los argumentos deductivos que son válidos nunca pueden ser invalidados agregando más premisas. Recordemos nuestro argumento de “Tweets”:

1. Los tweets son un ave sana, que funciona normalmente
2. Las aves más sanas, que funcionan normalmente vuelan
3. Por lo tanto, los Tweets probablemente vuelan

1. El 70% de los votantes dice que votará por el candidato X
2. Por lo tanto, el candidato X probablemente ganará la elección

Este es un argumento inductivo porque aunque la premisa sea cierta, la conclusión aún podría ser falsa (por ejemplo, un opositor del candidato X podría matar o intimidar sistemáticamente a aquellos votantes que pretendan votar por el candidato X para que muy pocos de ellos realmente voten). Además, es claro que el argumento pretende ser inductivo porque la conclusión contiene la palabra “probablemente”, que indica claramente que se pretende una inferencia inductiva, más que deductiva. Recuerda que al evaluar argumentos queremos saber sobre la fuerza de la inferencia desde las premisas hasta la conclusión, ¡pero también queremos saber si la premisa es cierta! Podemos evaluar si una generalización estadística es cierta o no considerando si la generalización estadística cumple ciertas condiciones. Hay dos condiciones que toda generalización estadística debe cumplir para que la generalización se considere “buena”.

1. Tamaño de muestra adecuado: el tamaño de la muestra debe ser lo suficientemente grande como para soportar la generalización.

Una muestra es simplemente una porción de una población. Una población es la totalidad de miembros de algún conjunto específico de objetos o eventos. Por ejemplo, si estuviera determinando la proporción relativa de autos a camiones que circulan por mi calle en un día determinado, la población sería el número total de autos y camiones que circulan por mi calle en un día determinado. Si tuviera que sentarme en mi porche delantero de 12-2 pm y contar todos los autos y camiones que conducían por mi calle, eso sería una muestra. Una buena generalización estadística es aquella en la que la muestra es representativa de la población. Cuando una muestra es representativa, las características de la muestra coinciden con las características de la población en general. Por ejemplo, mi método de muestreo de autos y camiones que conducen por mi calle sería un buen método siempre y cuando la proporción de camiones a autos que condujeron por mi calle entre las 12-2 de la tarde coincidiera con la proporción de camiones a autos que condujeron por mi calle durante todo el día. Si por alguna razón el número de camiones que circulaban por mi calle de 12-2 pm era muy superior al promedio para todo el día, mi muestra no sería representativa de la población sobre la que intentaba generalizar (es decir, el número total de autos y camiones que circulaban por mi calle en un día). La condición de “tamaño de muestra adecuado” y la condición de “muestra no sesgada” son formas de asegurar que una muestra sea representativa. En el resto de esta sección, explicaremos cada una de estas condiciones a su vez.

La condición de muestra no sesgada puede no cumplirse incluso cuando se cumple la condición de tamaño de muestra adecuado. Por ejemplo, supongamos que cuento todos los autos de mi calle por un periodo de tres horas de 11-2 pm durante un día laborable. Supongamos que contar tres horas seguidas nos da un tamaño de muestra adecuado. No obstante, supongamos que durante esas horas (horas de almuerzo) hay una proporción mucho mayor de camiones a automóviles, ya que (supongamos) muchos camiones de trabajo vienen hacia y desde los lugares de trabajo durante esas horas de almuerzo. Si ese fuera el caso, entonces mi muestra, aunque lo suficientemente grande, no sería representativa porque estaría sesgada. En particular, el número de camiones a automóviles en la muestra sería mayor que en la población general, lo que haría que la muestra no sea representativa de la población (y por tanto sesgada).

Otra buena manera de ilustrar el sesgo de muestreo es considerando encuestas. Entonces considere al candidato X que se postula para cargos electos y que apoya firmemente los derechos de armas y es el candidato de elección de la NRA. Supongamos que una organización realiza una encuesta para determinar cómo le va al candidato X contra el candidato Y, quien está activamente en contra de los derechos de armas. Pero supongamos que la forma en que la organización administra la encuesta es encuestando a los suscriptores de la revista, Field y Stream. Supongamos que la encuesta arrojó más de 5000 respuestas, lo que, supongamos, es un tamaño muestral adecuado y de esas respuestas, 89% favoreció al candidato X. Si la organización tomara esa muestra para apoyar la generalización estadística de que “la mayoría de los votantes están a favor del candidato X” entonces habrían hecho una error. Si sabes algo de la revista Field and Stream, debería ser obvio por qué. Field and Stream es una revista cuyos suscriptores tenderían a poseer armas y apoyar los derechos de armas. Por lo tanto, esperaríamos que los suscriptores de esa revista tuvieran un porcentaje mucho mayor de activistas por los derechos de armas que la población en general, a la que la encuesta intenta generalizar. Pero en este caso, la muestra sería poco representativa y sesgada y así la encuesta sería inútil. Si bien la muestra nos permitiría generalizar a la población, “suscriptores de Field y Stream”, no nos permitiría generalizar a la población en general.

Consideremos un ejemplo más de sesgo de muestreo. Supongamos que el candidato X se postulaba en un distrito en el que había una alta proporción de votantes de la tercera edad. Supongamos que el candidato X favoreció las políticas en contra de las que estaban los votantes Por ejemplo, supongamos que el candidato X favorece recortar los fondos de Medicare para reducir el déficit presupuestario, mientras que el candidato Y favoreció mantener o aumentar el apoyo a Medicare. A lo largo viene una organización que está interesada en sondear a los votantes para determinar qué candidato es favorecido en el distrito. Supongamos que la organización elige administrar la encuesta vía mensaje de texto y que los resultados de la encuesta muestran que el 75% de los votantes favorecen al candidato X. ¿Puedes ver qué tiene de malo la encuesta, por qué está sesgada? Probablemente reconozcas que este método de sondeo no producirá una muestra representativa porque los votantes de la tercera edad son mucho menos propensos a usar teléfonos celulares y mensajes de texto y así la encuesta dejará de lado las respuestas de estos votantes adultos mayores (que, suponemos conforman un gran segmento de la población). Así, la muestra será sesgada y no representativa de la población objetivo. En consecuencia, cualquier intento de generalizar a la población en general sería sumamente desaconsejado.

Antes de terminar esta sección, debemos considerar otra fuente de sesgo, que es un sesgo en el propio cuestionario de sondeo (lo que los estadísticos llaman el “instrumento”). Supongamos que una encuesta está tratando de determinar cuánto favorece una población a los productos alimenticios orgánicos. Podemos imaginar el cuestionario que contiene una elección como la siguiente:

¿Cuál prefieres?
a. productos que son caros y no tienen ninguna ventaja comprobada por la FDA sobre los productos menos costosos
b. productos que son económicos y no tienen desventajas comprobadas por la FDA sobre los productos más caros

Debido al fraseo de las opciones, parece claro que muchas personas elegirán la opción “b”. Aunque las dos opciones describen con precisión la diferencia entre productos orgánicos y no orgánicos, la opción “b” suena mucho más deseable que la opción “a”. La redacción de las opciones está sesgada en la medida en que “a” es un suplente de “orgánico” y “b” es suplente de “no orgánico”. Incluso las personas que prefieren los productos orgánicos pueden estar más inclinadas a elegir la opción “b” aquí. Así, la encuesta no sería representativa porque las respuestas estarían sesgadas por el fraseo sesgado de las opciones. Aquí hay otro ejemplo con el mismo punto:

¿Cuál es tu favor?
a. Preservar el derecho constitucional del ciudadano a portar armas

Nuevamente, debido a que la opción “b” suena tan mal y “a” suena más atractiva, quienes responden a una encuesta con esta pregunta podrían estar inclinados a elegir “a” aunque realmente no apoyen los derechos de armas. Este es otro ejemplo de cómo el sesgo puede arrastrarse hacia una generalización estadística a través de una forma sesgada de hacer una pregunta.

## Ejercicio

¿Qué tipo de problemas, en su caso, tienen las siguientes generalizaciones estadísticas? Si hay algún problema con la generalización, especifique cuál de las dos condiciones (tamaño de muestra adecuado, muestra no sesgada) no se cumplen. Algunas generalizaciones pueden tener múltiples problemas. Si es así, especifica todos los problemas que veas con la generalización.

1. Bob, de Silverton, CO conduce una camioneta 4x4, por lo que la mayoría de la gente de Silverton, CO conduce camionetas 4x4.
2. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todas las mañanas de 5:00-5:20am. Cuenta en su mayoría palomas matutinas y generaliza, “la mayoría de las aves que aterrizan en mi árbol por la mañana son palomas matutinas”.
3. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todas las mañanas de 5:00-6:00am. Cuenta en su mayoría palomas matutinas y generaliza, “la mayoría de las aves que aterrizan en mi árbol durante el día de 24 horas son palomas matutinas”.
4. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todos los días de 5:00-6:00am, de 11:00-12:00pm, y de 5:00-6:00pm. Cuenta en su mayoría palomas matutinas y generaliza, “la mayoría de las aves que aterrizan en mi árbol durante el día de 24 horas son palomas matutinas”.
5. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todas las noches de 10:00-11:00pm. Cuenta principalmente búhos y generaliza, “la mayoría de las aves que aterrizan en mi árbol a lo largo del día de 24 horas son búhos”.
6. Tom cuenta y categoriza las aves que aterrizan en el árbol en su patio trasero todas las noches de 10:00-11:00pm y de 2:00-3:00am. Cuenta principalmente búhos y generaliza, “la mayoría de las aves que aterrizan en mi árbol a lo largo de la noche son búhos”.
7. Una encuesta administrada a 10,000 votantes registrados que eran propietarios de viviendas mostró que 90% apoyaba una política para recortar fondos de Medicaid y disminuir los impuestos a la propiedad. Por lo tanto, 90% de los votantes apoyan una política para reducir el financiamiento de Medicaid.
8. Una encuesta telefónica administrada por una computadora que genera aleatoriamente números para llamar, encontró que 68% de los estadounidenses en la muestra de 2000 estaban a favor de legalizar el uso recreativo de marihuana. Así, casi 70% de los estadounidenses favorecen legalizar el uso recreativo de marihuana.
9. Una encuesta telefónica aleatoria en Estados Unidos preguntó a los encuestados si apoyaban a) una política que permita matar a niños inocentes en el útero o b) una política que salve la vida de niños inocentes en el útero. Los resultados mostraron que 69% de los encuestados eligen la opción “b” sobre la opción “a”. Se hizo la generalización de que “la mayoría de los estadounidenses favorecen una política que no permita el aborto”.
10. El primer concierto de rock and roll de Steve fue un concierto de Ani Difranco, en el que la mayoría de los asistentes al concierto eran mujeres con consignas políticas feministas escritas en sus playeras. Steve hace la generalización de que “la mayoría de los asistentes a conciertos de rock and roll son mujeres feministas”. Luego aplica esta generalización al siguiente concierto al que asiste (Tom Petty) y se sorprende mucho por lo que encuentra.
11. Un director de secundaria realiza una encuesta sobre cuán satisfechos están los estudiantes con su preparatoria pidiendo a los estudiantes detenidos que llenen una encuesta de satisfacción. Generalizando a partir de esa muestra, infiere que 79% de los estudiantes están insatisfechos con su experiencia en la preparatoria. Está sorprendido y entristecido por el resultado.
12. Después de haber asistido a numerosos partidos de los Pistons en casa a lo largo de 20 años, Alice no puede recordar una época en la que no vio a los vendedores de boletos vendiendo boletos fuera del estadio. Generaliza que siempre hay scalpers en cada partido local de los Pistons.
13. Después de haber asistido a numerosos partidos de los Pistons en casa a lo largo de 20 años, Alice no puede recordar una época en la que no vio a los vendedores de boletos vendiendo boletos fuera del estadio. Generaliza que hay scalpers de boletos en cada partido de la NBA.
14. Después de haber asistido a numerosos partidos de los Pistons en casa a lo largo de 20 años, Alice no puede recordar una época en la que no vio a los vendedores de boletos vendiendo boletos fuera del estadio. Generaliza que hay scalpers de boletos en cada evento deportivo.
15. Bob una vez ordenó una hamburguesa a Burger King y se enfermó violentamente poco después de comerla. A partir de ahora, nunca come en Burger King porque teme que consiga una intoxicación alimentaria.

This page titled 3.1: Argumentos inductivos y generalizaciones estadísticas is shared under a CC BY license and was authored, remixed, and/or curated by Matthew Van Cleave.