8.2: Solución de software
- Page ID
- 149545
Desarrollo y selección de modelos
Hay muchas razones diferentes para crear un modelo de regresión lineal múltiple y su propósito influye directamente en cómo se crea el modelo. A continuación se enumeran varios de los usos más comunes para un modelo de regresión:
- Describir el comportamiento de su variable de respuesta
- Predecir una respuesta o estimar la respuesta promedio
- Estimando los parámetros (β0, β1, β2,...)
- Desarrollo de un modelo preciso del proceso
Dependiendo de su objetivo para crear un modelo de regresión, su metodología puede variar cuando se trata de selección, retención y eliminación de variables.
Cuando el objeto es una descripción simple de su variable de respuesta, normalmente le preocupa menos eliminar variables no significativas. La mejor representación de la variable respuesta, en términos de sumas residuales mínimas de cuadrados, es el modelo completo, que incluye todas las variables predictoras disponibles del conjunto de datos. Es menos importante que las variables estén relacionadas causalmente o que el modelo sea realista.
Una razón común para crear un modelo de regresión es para la predicción y estimación. Un investigador quiere ser capaz de definir eventos dentro del espacio x de los datos que fueron recolectados para este modelo, y se asume que el sistema continuará funcionando como lo hizo cuando se recolectaron los datos. Se debe incluir cualquier variable predictora medible que contenga información sobre la variable de respuesta. Por esta razón, las variables no significativas pueden ser conservadas en el modelo. Sin embargo, las ecuaciones de regresión con menos variables son más fáciles de usar y tienen una ventaja económica en términos de recolección de datos. Adicionalmente, existe una mayor confianza unida a los modelos que contienen solo variables significativas.
Si el objetivo es estimar los parámetros del modelo, será más cauteloso al considerar la eliminación de variables. Se quiere evitar introducir un sesgo eliminando una variable que tenga información predictiva sobre la respuesta. Sin embargo, existe una ventaja estadística en términos de varianza reducida de las estimaciones de parámetros si se eliminan las variables verdaderamente no relacionadas con la variable de respuesta.
Construir un modelo realista del proceso que estás estudiando es a menudo un objetivo principal de mucha investigación. Es importante identificar las variables que están vinculadas a la respuesta a través de alguna relación causal. Si bien se puede identificar qué variables tienen una fuerte correlación con la respuesta, esto solo sirve como indicador de qué variables requieren un estudio adicional. El objetivo principal es desarrollar un modelo cuya forma funcional refleje de manera realista el comportamiento de un sistema.
La siguiente figura es una estrategia para construir un modelo de regresión.
Figura 4. Estrategia para construir un modelo de regresión.
Soluciones de Software
Minitab
La salida y las parcelas se dan en el ejemplo anterior.