1.1: Sobre la Psicología de la Estadística
- Page ID
- 151924
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Para sorpresa de muchos estudiantes, la estadística es una parte bastante significativa de una educación psicológica. Para sorpresa de nadie, las estadísticas rara vez son la parte favorita de la educación psicológica de uno. Después de todo, si realmente te encantara la idea de hacer estadísticas, probablemente estarías inscrito en una clase de estadística en este momento, no en una clase de psicología. Entonces, no en vano, hay una proporción bastante grande de la base estudiantil que no está contenta con el hecho de que la psicología tenga tantas estadísticas en ella. Ante esto, pensé que el lugar adecuado para comenzar podría ser responder algunas de las preguntas más comunes que la gente tiene sobre las estadísticas.
Una gran parte de este tema que nos ocupa se relaciona con la idea misma de la estadística. ¿Qué es? ¿Para qué está ahí? ¿Y por qué los científicos están tan obsesionados con eso? Todas estas son buenas preguntas, cuando se piensa en ello. Entonces comencemos con el último. Como grupo, los científicos parecen estar extrañamente obsesionados en ejecutar pruebas estadísticas en todo. De hecho, utilizamos las estadísticas con tanta frecuencia que a veces nos olvidamos de explicarle a la gente por qué lo hacemos. Es una especie de artículo de fe entre los científicos —y especialmente los científicos sociales— que no se puede confiar en tus hallazgos hasta que hayas hecho algunas estadísticas. Los estudiantes de pregrado podrían ser perdonados por pensar que todos estamos completamente locos, porque nadie se toma el tiempo para responder a una pregunta muy simple:
¿Por qué haces estadísticas? ¿Por qué los científicos no solo usan el sentido común?
Es una pregunta ingenua de alguna manera, pero la mayoría de las buenas preguntas lo son. Hay muchas respuestas buenas para ello, 2 pero por mi dinero, la mejor respuesta es realmente simple: no confiamos lo suficiente en nosotros mismos. Nos preocupa que seamos humanos, y susceptibles a todos los sesgos, tentaciones y debilidades que sufren los humanos. Gran parte de las estadísticas es básicamente una salvaguardia. Usar el “sentido común” para evaluar la evidencia significa confiar en los instintos intestinales, confiar en argumentos verbales y usar el poder crudo de la razón humana para llegar a la respuesta correcta. La mayoría de los científicos no creen que es probable que este enfoque funcione.
De hecho, ahora que lo pienso, esto me suena mucho a una pregunta psicológica, y como sí trabajo en un departamento de psicología, me parece una buena idea profundizar un poco más aquí. ¿Es realmente plausible pensar que este enfoque de “sentido común” es muy confiable? Los argumentos verbales tienen que construirse en lenguaje, y todos los lenguajes tienen sesgos —algunas cosas son más difíciles de decir que otras, y no necesariamente porque son falsas (por ejemplo, la electrodinámica cuántica es una buena teoría, pero difícil de explicar con palabras). Los instintos de nuestro “intestino” no están diseñados para resolver problemas científicos, están diseñados para manejar inferencias del día a día —y dado que la evolución biológica es más lenta que el cambio cultural, deberíamos decir que están diseñados para resolver los problemas del día a día para un mundo diferente al que vivimos. Lo más fundamental es que el razonamiento sensatamente requiere que las personas se involucren en la “inducción”, haciendo suposiciones sabias y yendo más allá de la evidencia inmediata de los sentidos para hacer generalizaciones sobre el mundo. Si piensas que puedes hacer eso sin ser influenciado por diversos distractores, bueno, tengo un puente en Brooklyn que me gustaría venderte. Diablos, como muestra la siguiente sección, ni siquiera podemos resolver problemas “deductivos” (aquellos en los que no se requiere adivinar) sin estar influenciados por nuestros sesgos preexistentes.
maldición de creencia sesgo
La gente es en su mayoría bastante inteligente. Ciertamente somos más inteligentes que las otras especies con las que compartimos el planeta (aunque mucha gente podría estar en desacuerdo). Nuestras mentes son cosas bastante asombrosas, y parecemos ser capaces de las hazañas más increíbles de pensamiento y razón. Sin embargo, eso no nos hace perfectos. Y entre las muchas cosas que los psicólogos han demostrado a lo largo de los años es que realmente sí nos cuesta ser neutrales, evaluar la evidencia de manera imparcial y sin dejarnos influir por sesgos preexistentes. Un buen ejemplo de esto es el efecto de sesgo de creencia en el razonamiento lógico: si le pides a la gente que decida si un argumento en particular es lógicamente válido (es decir, la conclusión sería cierta si las premisas fueran verdaderas), tendemos a ser influenciados por la credibilidad de la conclusión, incluso cuando no deberíamos. Por ejemplo, aquí hay un argumento válido donde la conclusión es creíble:
No hay cigarrillos baratos (Premisa 1)
Algunas cosas adictivas son económicas (Premisa 2)
Por lo tanto, algunas cosas adictivas no son cigarrillos (Conclusión)
Y aquí hay un argumento válido donde la conclusión no es creíble:
No hay cosas adictivas son económicas (Premisa 1)
Algunos cigarrillos son económicos (Premisa 2)
Por lo tanto, algunos cigarrillos no son adictivos (Conclusión)
La estructura lógica del argumento #2 es idéntica a la estructura del argumento #1, y ambas son válidas. No obstante, en el segundo argumento, hay buenas razones para pensar que la premisa 1 es incorrecta, y como resultado probablemente se dé el caso de que la conclusión también sea incorrecta. Pero eso es totalmente irrelevante para el tema que nos ocupa: un argumento es deductivamente válido si la conclusión es una consecuencia lógica de las premisas. Es decir, un argumento válido no tiene que involucrar afirmaciones verdaderas.
Por otro lado, aquí hay un argumento inválido que tiene una conclusión creíble:
No hay cosas adictivas son económicas (Premisa 1)
Algunos cigarrillos son económicos (Premisa 2)
Por lo tanto, algunas cosas adictivas no son cigarrillos (Conclusión)
Y finalmente, un argumento inválido con una conclusión increíble:
No hay cigarrillos baratos (Premisa 1)
Algunas cosas adictivas son económicas (Premisa 2)
Por lo tanto, algunos cigarrillos no son adictivos (Conclusión)
Ahora bien, supongamos que la gente realmente es perfectamente capaz de dejar de lado sus sesgos preexistentes sobre lo que es verdad y lo que no, y puramente evaluar un argumento sobre sus méritos lógicos. Esperaríamos que el 100% de la gente dijera que los argumentos válidos son válidos, y 0% de la gente que diga que los argumentos inválidos son válidos. Entonces, si ejecutaste un experimento mirando esto, esperarías ver datos como estos:
conclusión se siente verdadera | conclusión se siente falsa | |
argumento es válido | 100% dice “válido” | 100% dice “válido” |
argumento no es válido | 0% dice “válido” | 0% dice “válido” |
Si los datos psicológicos se veían así (o incluso una buena aproximación a esto), podríamos sentirnos seguros al confiar en nuestros instintos intestinales. Es decir, estaría perfectamente bien dejar que los científicos evaluaran los datos en función de su sentido común, y no molestarse con todas estas turbias cosas estadísticas. No obstante, ustedes han tomado clases de psiquiatría, y a estas alturas probablemente ya sepan a dónde va esto.
En un estudio clásico, J. S. B. T. Evans, Barston y Pollard (1983) realizaron un experimento mirando exactamente esto. Lo que encontraron es que cuando los sesgos preexistentes (es decir, las creencias) estaban de acuerdo con la estructura de los datos, todo salió como esperarías:
conclusión se siente verdadera | conclusión se siente falsa | |
argumento es válido | 92% dice “válido” | |
argumento no es válido | 8% dice “válido” |
No perfecto, pero eso es bastante bueno. Pero mira lo que sucede cuando nuestros sentimientos intuitivos sobre la verdad de la conclusión van en contra de la estructura lógica del argumento:
conclusión se siente verdadera | conclusión se siente falsa | |
argumento es válido | 92% dice “válido” | 46% dice “válido” |
argumento no es válido | 92% dice “válido” | 8% dice “válido” |
Oh, querido, eso no es tan bueno. Al parecer, cuando a las personas se les presenta un argumento fuerte que contradice nuestras creencias preexistentes, nos resulta bastante difícil incluso percibirlo como un argumento fuerte (la gente solo lo hizo 46% de las veces). Peor aún, cuando a la gente se le presenta un argumento débil que concuerda con nuestros sesgos preexistentes, casi nadie puede ver que el argumento es débil (¡la gente se equivocó ese 92% de las veces!) 3
Si lo piensas, no es como si estos datos fueran horriblemente condenadores. En general, a las personas les fue mejor que la casualidad para compensar sus sesgos previos, ya que alrededor del 60% de los juicios de las personas fueron correctos (se esperaría 50% por casualidad). Aun así, si fueras un profesional “evaluador de pruebas”, y alguien viniera y te ofreciera una herramienta mágica que mejora tus posibilidades de tomar la decisión correcta del 60% al (digamos) 95%, probablemente saltarías en ello, ¿verdad? Por supuesto que lo harías. Agradecidamente, en realidad tenemos una herramienta que puede hacer esto. Pero no es magia, son estadísticas. Entonces esa es la razón #1 por la que los científicos aman las estadísticas. Simplemente es demasiado fácil para nosotros “creer lo que queremos creer”; así que si queremos “creer en los datos” en cambio, vamos a necesitar un poco de ayuda para mantener nuestros sesgos personales bajo control. Eso es lo que hacen las estadísticas: nos ayuda a mantenernos honestos.
1 La cita proviene del poema de Auden en 1946 Under Whale Lyre: A Reactionary Tract for the Times, pronunciado como parte de un discurso de apertura en la Universidad de Harvard. La historia del poema es algo interesante: harvardmagazine.com/2007/11/una-poetas-advertencia.html
2 Incluyendo la sugerencia de que el sentido común es escaso entre los científicos.