13.1.6: Diseño de una prueba de comparación pareada

Última actualización
Guardar como PDF

Page ID: 101997

Bradley H. Dowden
California State University Sacramento

$ \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } $ $ \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} $$\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$ $\newcommand{\id}{\mathrm{id}}$ $ \newcommand{\Span}{\mathrm{span}}$ $ \newcommand{\kernel}{\mathrm{null}\,}$ $ \newcommand{\range}{\mathrm{range}\,}$ $ \newcommand{\RealPart}{\mathrm{Re}}$ $ \newcommand{\ImaginaryPart}{\mathrm{Im}}$ $ \newcommand{\Argument}{\mathrm{Arg}}$ $ \newcommand{\norm}[1]{\| #1 \|}$ $ \newcommand{\inner}[2]{\langle #1, #2 \rangle}$ $ \newcommand{\Span}{\mathrm{span}}$$\newcommand{\AA}{\unicode[.8,0]{x212B}}$

Supongamos que eres dueño de un negocio de alimentos y estás considerando comercializar lo que tu investigador/cocinero dice que es una mejor versión de uno de tus viejos productos alimenticios, digamos, un burrito vegetariano. El factor principal en tu decisión será si a tus clientes les gustará mejor el sabor del nuevo producto que el sabor del anterior. Puedes tomar tu decisión de marketing adivinando, dejando que tu cocinero elija, pidiendo consejo a tus amigos, o por algún otro método. Tú decides usar otro método: pregunta a tus propios clientes cuál de los dos burritos vegetarianos les gusta más. ¿Por qué no? Si los clientes de tu muestra prefieren el nuevo producto, creerás que toda la población también lo hará, y reemplazarás el producto antiguo por el nuevo.

Una buena manera de hacer esta prueba sería usar un procedimiento llamado comparación pareada. En este tipo de pruebas, eliminas las etiquetas identificativas de los productos burritos antiguos y nuevos y luego le das a algunos catadores los pares de productos en pedidos aleatorios. Es decir, algunos catadores llegan a probar primero el burrito nuevo; algunos, primero el viejo. En ninguno de los dos casos se les dice qué producto están degustando. Entonces pregúntale a tu catador/jueces qué producto les gusta más. Si a muchos de ellos les gusta el nuevo mejor que el anterior, puedes ir con el nuevo producto.

¿Cuántos catadores necesitas para obtener resultados útiles? Y si a la mayoría de los catadores les gusta el nuevo producto pero a muchos no, entonces ¿cuánto desacuerdo puedes aceptar y aún así estar seguro de que a tus clientes generalmente les gustará más el nuevo producto? Si tres de cada cinco catadores dicen que el nuevo producto es mejor pero dos de cada cinco no están de acuerdo, ¿llegaría a la conclusión de que más de la mitad de sus clientes preferirían que el nuevo producto burrito sea un resultado estadísticamente significativo? Se trata de preguntas difíciles, pero han sido estudiadas extensamente por estadísticos, y las respuestas son claras.

Antes de que esas preguntas difíciles puedan ser respondidas, es necesario resolver otro problema. ¿Qué tan seguro tienes que estar de que la decisión de tus catadores es correcta, en el sentido de representar con precisión los gustos de la población general de tus clientes? Si necesitas estar 99 por ciento seguro, necesitarás más catadores que si solo necesitas estar 95 por ciento seguro. Supongamos que usted decide el 95 por ciento. Entonces, si tienes, digamos, veinte catadores, ¿cuántos de ellos tendrían que preferir el nuevo producto antes de que puedas estar 95 por ciento seguro de que a tus clientes también les gustará mejor el nuevo producto? Si tus catadores-jueces son seleccionados aleatoriamente de entre tu población de clientes y no son profesionales en el negocio de la degustación, entonces la teoría estadística dice que necesitarías al menos el 75 por ciento (quince) de tus veinte jueces para preferir el nuevo producto. No obstante, si tuvieras más jueces, no necesitarías tanto acuerdo. Por ejemplo, con sesenta jueces, necesitarías solo el 65 por ciento (treinta y nueve) de tus jueces para dar una respuesta positiva a fin de que estés seguro de que tus clientes preferirán el nuevo producto. Lo que significa esta estadística de treinta y nueve de cada sesenta es que aunque veintiuno de sus sesenta jueces dijeran que su nuevo burrito es horrible, podría estar 95 por ciento seguro de que la mayoría de los consumidores no estarían de acuerdo con ellos. Sin embargo, muchas personas de negocios que no están versadas en tal razonamiento estadístico probablemente se preocuparían innecesariamente por su nuevo burrito si a veintiuno de los sesenta probadores no le gustaba el producto.

La teoría estadística también indica cuánto acuerdo se requeriría entre los jueces para elevar su nivel de confianza del 95 por ciento al 99 por ciento. Para estar 99 por ciento seguro de que tus clientes preferirían el nuevo producto al viejo, necesitarías diecisiete respuestas positivas de tus veinte jueces, o cuarenta y una respuestas positivas de sesenta jueces.

Probemos otro ejemplo. Recientemente compraste una nueva estación de servicio (gasolinera) y te has decidido por una campaña publicitaria tanto para aumentar tu visibilidad en la comunidad como para alentar a nuevos clientes a usar la estación. Planeas anunciar un regalo gratis a cada cliente que compre $10 o más de gasolina en cualquier momento durante las próximas dos semanas. El problema ahora es seleccionar el regalo. Tiene conexiones comerciales que le permiten realizar una compra económica de un gran suministro de seis paquetes de Pepsi o bolígrafos grabados con el nombre de un equipo deportivo local. Podrías anunciar que regalarás Pepsi gratis, o bien podrías anunciar que regalarás los bolígrafos. El costo para ti sería el mismo. Usted decide elegir entre los dos sobre la base de lo que predice que sus clientes potenciales preferirían. Para hacer esto, podrías, y deberías, usar una prueba de comparación pareada. Tú decides que te gustaría estar 95 por ciento seguro del resultado antes de seleccionar el regalo. Usted elige al azar a veinte clientes potenciales y les ofrece su opción de Pepsi gratis o un bolígrafo gratis. A diez se les dice que pueden tener la Pepsi o la pluma; a diez se les dice que pueden tener la pluma o la Pepsi. Analizas los resultados. Tres clientes dicen que no les importa qué regalo reciben. Cinco dicen que prefieren fuertemente a Pepsi a la pluma porque no les gusta el equipo deportivo. Seis dicen que estarían contentos con cualquiera de los dos regalos pero apenas preferirían la Pepsi. Cuatro clientes eligen Pepsi porque tienen suficientes bolígrafos. El resto elige bolígrafos sin comentarios. A partir de este resultado, ¿puedes estar seguro de que sería un error ir con el bolígrafo?

Sí, puedes estar seguro de que sería un error. Su prueba de comparación pareada muestra que quince de veinte prefieren Pepsi. Al nivel de confianza del 95 por ciento, puedes estar seguro de que más del 50 por ciento de tus clientes preferirían la Pepsi. Por cierto, esta información sobre los números es para fines ilustrativos. Tú como estudiante no estás en una clase de estadística, así que no te interrogarán sobre hacer estos cálculos. Pero si eras dueño de esa estación de servicio deberías usar una prueba de comparación pareada y obtener algunos consejos numéricos buscando la información en Internet o preguntando a alguien que haya tomado una clase de estadísticas.

Supongamos que se entera de que su programa de TV favorito fue cancelado porque la Corporación A. C. Nielsen informó a CBS que solo 25 por ciento de los televidentes estuvieron sintonizados con su programa la semana pasada. CBS quería un programa del 30 por ciento en ese intervalo de tiempo. Entonces aprendes más sobre la prueba de Nielsen. Nielsen encuestó a 400 televidentes, 100 de los cuales dijeron que estaban viendo tu programa. Sabiendo que Estados Unidos tiene 100 millones de televisores, podría sorprenderte que CBS tome una decisión financiera importante basada en la simple afirmación estadística de que 100 de cada 400 espectadores prefieren tu programa. ¿Puede esta estadística realmente decirle a CBS algo significativo sobre su programa? Sí, puede, siempre que CBS pueda vivir con un error del 2 por ciento. Nielsen y CBS pueden estar 95 por ciento seguros de que las estadísticas de una muestra de 400 tendrán un error de solo más o menos 2 por ciento.