La Metodología de Superficies de Respuesta (MSR) es una colección de técnicas matemáticas y estadísticas que se utilizan en el estudio de la relación entre una o más respuestas que dependen de diversos factores o variables independientes. El objetivo final de la MSR consiste en optimizar la(s) respuesta(s) de interés determinando las mejores condiciones de operación del sistema. Se analiza un diseño de Superficies de Respuesta utilizando el software estadístico STATGRAPHICS[7].
Palabras claves: metodología de superficies de respuesta, modelo, optimización.
AbstractResponse Surface Methodology (RSM) is an amount of mathematical and statistical techniques used to study the relationship among two or more responses that depend on several factors or independent variables. The final goal of RSM is to optimize responses determining the best conditions in the operation of the system. A design of response surface is analyzed using the statististical software STATGRAPHICS[7].
Keywords: response surface methodology, model, optimization
La Metodología de Superficies de Respuesta es una colección de técnicas que se utilizan para modelar y analizar problemas en los que una variable de interés llamada respuesta depende de otras variables independientes o factores. El objetivo fundamental de la MSR es optimizar la respuesta estableciendo la región más adecuada para operar el sistema[5].
En general una superficie de respuesta está modelada por la expresión:
donde las x son las variables independientes y e es el ruido o error observado en la respuesta y.
Si la respuesta está modelada por una función lineal de las variables independientes, se utiliza el modelo de primer orden:
Si hay curvatura en el sistema, debe usarse un polinomio de orden superior, tal como el modelo de segundo orden:
Box and Wilson [2] utilizaron la experimentación secuencial para determinar condiciones operativas óptimas en contextos industriales. Es un enfoque que utiliza inicialmente diseños factoriales 2k y que progresivamente va utilizando diseños cada vez más complejos con el fin de aproximarse a la región de interés o región del óptimo [4].
Materiales y métodosEl procedimiento se ilustra con un ejemplo tomado del libro de Montgomery [5]. Los análisis estadísticos se realizan utilizando el software STATGRAPHICS[7]:
Un ingeniero químico está interesado en determinar las condiciones de operación que maximizan el rendimiento de un proceso. Dos variables controlables influyen en el rendimiento del proceso: el tiempo de reacción y la temperatura de reacción. El ingeniero opera actualmente el proceso con un tiempo de reacción de 35 minutos y una temperatura de 155ºF, que dan como resultado rendimientos de cerca del 40%.
Resultados y discusiónInicialmente se ajusta un modelo de primer orden
Del conocimiento del proceso se decide explorar en la región (30,40) minutos de tiempo de reacción y (150,160) ºF de temperatura. Las variables se codifican en el intervalo (-1,1).
Sea t el tiempo y T la temperatura, entonces las variables codificadas son
Se utiliza un diseño factorial 22 aumentado con cinco puntos centrales:
Cuadro 1. Diseño factorial del modelo inicial de primer orden
Fuente: Montgomery. Diseño y análisis de experimentos (Limusa Wiley)
Las réplicas del centro se usan para estimar el error experimental. Generalmente se utilizan entre 3 y 5 réplicas centrales. Obsérvese que el diseño está centrado en las condiciones actuales del proceso.
Análisis estadístico de los datos (software estadístico STATGRAPHICS) [7]:
Tabla 1. Análisis de Varianza del modelo inicial de primer orden
El análisis de varianza indica que los dos efectos principales son significativos. Obsérvese que las 5 réplicas del centro corresponden a los grados de libertad del error experimental. Excluyendo el efecto de la interacción AB que no es significativo, se ajusta el modelo de regresión lineal a los datos:
que es el modelo de primer orden buscado y cuya gráfica representa un plano en el espacio tridimensional:
Figura 1. Superficie de respuesta del modelo inicial
A continuación se obtiene el mapa de contorno de la superficie (curvas de nivel), que está conformado por líneas rectas de rendimiento constante:
Figura 2. Curvas de nivel de rendimiento constante
Con el fin de encontrar las condiciones óptimas se sigue la trayectoria del ascenso más pronunciado, que corresponde a la recta perpendicular a las curvas de nivel, es decir, el desplazamiento debe hacerse en la dirección indicada por el vector gradiente. Los pasos sobre esta trayectoria, por lo tanto, deben ser proporcionales a los coeficientes de regresión. Se hace un movimiento de 0.775 unidades en la dirección de A por cada 0.325 unidades en la dirección de B.
Por tanto, la pendiente de la trayectoria es ΔB / ΔA = 0.325 / 0.775. Asumiendo inicialmente un paso ΔA = 1, se obtiene ΔB = 0.42. Con estos pasos, se realizan experimentos sobre la trayectoria del ascenso más pronunciado hasta que deja de observarse un incremento adicional en la respuesta:
Cuadro 2. Experimentos secuenciales para encontrar la respuesta óptima
Fuente: Montgomery. Diseño y análisis de experimentos (Limusa Wiley)
Se observa que el rendimiento del proceso se incrementa hasta el décimo paso. Por lo tanto, se ajusta otro modelo de primer orden tomando como centro el punto (85, 175). Se decide explorar en la región (80,90) minutos de tiempo de reacción y (170,180) ºF de temperatura. Las variables se codifican nuevamente en el intervalo (-1,1).
Sea t el tiempo y T la temperatura, entonces las variables codificadas son ahora
Se utiliza de nuevo un diseño factorial 22 aumentado con cinco puntos centrales:
Cuadro 3. Diseño factorial del segundo modelo de primer orden
Fuente: Montgomery. Diseño y análisis de experimentos (Limusa Wiley)
Las réplicas del centro se usan para estimar el error experimental. Obsérvese que el diseño está centrado en las condiciones t = 85, T = 175.
El Análisis de Varianza indica que ninguno de los efectos es significativo:
Tabla 2. Análisis de Varianza del segundo modelo de primer orden
Es decir, el modelo de primer orden no es una aproximación adecuada. Dada la cercanía del óptimo, se requiere un modelo que incorpore la curvatura del sistema para encontrar esta respuesta. Debe utilizarse el modelo de segundo orden
Para dos variables experimentales, este modelo se reduce a
Donde x1 es el factor A (tiempo) y x2 es el factor B (temperatura).
Los diseños de superficie de respuesta más utilizados para ajustar modelos de segundo orden se conocen como DCC (diseño central compuesto), propuestos por Box and Wilson[2]. Los DCC son diseños factoriales 2k con 2k combinaciones adicionales llamadas puntos axiales. Las coordenadas de los puntos axiales de los ejes del factor son
Para un diseño con dos factores el valor de α es 1.414 [3].
Debido a que no se pueden estimar los seis parámetros del modelo (las β ) porque sólo existen cinco corridas independientes, se hace necesario aumentar el diseño con cuatro corridas axiales. El experimento completo se muestra en la siguiente tabla:
Cuadro 4. Diseño central compuesto para ajustar el modelo de segundo orden
Fuente: Montgomery. Diseño y análisis de experimentos (Limusa Wiley)
El Análisis de Varianza indica que los efectos lineales y cuadráticos de los factores son significativos:
Tabla 3. Análisis de Varianza del modelo de segundo orden
El modelo de regresión que se ajusta a los datos es el siguiente:
que es el modelo de segundo orden buscado y cuya gráfica es una superficie en el espacio tridimensional:
Figura 3. Superficie de respuesta y curvas de nivel para el modelo de segundo orden
El mapa de contorno indica que bajo las condiciones actuales de operación (85 minutos y 175ºF) el rendimiento del proceso es de 79.94. El programa STATGRAPHICS[7] entrega las condiciones óptimas de operación:
Tabla 4. Condiciones óptimas de operación
Este punto donde se encuentra el máximo rendimiento del proceso, es un punto estacionario, con A = 0.389 y B = 0.305. En términos de las variables naturales, el punto óptimo se encuentra mediante:
Donde finalmente se concluye que las condiciones óptimas del proceso son t = 87 y T = 176.5. El valor del rendimiento óptimo predicho es de 80.21.
Para verificar la validez del modelo es necesario realizar el análisis de los residuales. Debe recordarse que uno de los supuestos del modelo es que los errores experimentales son variables aleatorias independientes que siguen una distribución normal con media cero y varianza constante. Las gráficas de diagnóstico de los residuales y pruebas estadísticas no paramétricas como la de Kolmogorov-Smirnov indicarán si los residuales satisfacen los supuestos del modelo.
Conclusiones
ANDERSON y WHITCOMB. RSM Simplified: optimizing process using Response Surface
Methods for Design of Experiments. Productivity, Inc. New York
BOX, G.E.P y WILSON K.G. “On the experimental attainment of optimum conditions”. Journal of the Royal Statitistical Society. B13, 1-45. 1951
FIGUEROA, G. Optimización de una Superficie de Respuesta utilizando JMP IN. Departamento de Matemáticas. Universidad de Sonora. Mosaicos matemáticos No. 11. 2003
KUEHL, R. Diseño de Experimentos. Thomson Learning. Segunda edición. 2001
MONTGOMERY, D. Diseño y Análisis de Experimentos. Editorial Limusa. Segunda edición. 2005
MONTGOMERY, D. y MYERS, R. Response Surface Methodology: Process and Product Optmization using Designed Experiments. Jhon Wiley and Sons. New York.
http://www.statgraphics.com/downloads.htm. Sitio de descarga gratis de copia de evaluación durante 30 días.
1 UNIVERSIDAD FRANCISCO DE PAULA SANTANDER. Departamento de Matemáticas y Estadística. E-mail: gustavoovalles@hotmail.com