Diseño experimental para una mezcla de q componentes y n variables de proceso para investigar las propiedades reológicas de geles de pectina.
Abstract
El problema de modelar una o varias respuestas dentro de un espacio con alta dimensionalidad requiere diseñar un plan de muestreo que logre captar eficazmente las irregularidades en el espacio. Recientemente, el proceso Gaussiano arbolado ha sido utilizado en experimentos por computadora para ajustar modelos estadísticos cuya estructura de correlación varía dentro de un hipercubo en el que todos los factores son independientes. En este trabajo, se utilizó una variación del algoritmo NTLBG para generar diseños experimentales uniformes dentro del hipercubo I ̅_4 y dentro de tres Símplices. Se utilizó, además, una transformación para mapear los puntos dentro de cada Símplex hacia el espacio euclidiano. De este modo, el espacio experimental es una combinación de un hípercubo de cuatro dimensiones y tres Símplices, i.e., I ̅_4×T_4×T_2×T_2, que se mapeó al hipercubo I ̅_9 para el análisis.
Por otro lado, se comparó un enfoque inteligente basado en Active Learning Cohn (ALC) para hacer crecer el diseño experimental inicial con base en los resultados, en un proceso iterativo de experimentación/simulación-análisis, contra un enfoque estático con un tamaño inicial que igualó al del enfoque inteligente en cada iteración.
Los resultados obtenidos sugieren que es conveniente comenzar con un diseño muy pequeño, i.e. n_0 = 20, y añadir nuevas corridas experimentales en las regiones de mayor incertidumbre, en lugar de comenzar con un diseño experimental de mayor tamaño n_0 >> 20. En la práctica, un diseño experimental de tamaño 150 podría considerarse excesivamente grande, pero si se considera que el espacio experimental tiene 9 dimensiones independientes (12 dimensiones en total), esta metodología es mucho más eficiente que la utilizada en diseños factoriales fraccionales, pues explora cada variable en un número mayor de niveles con un número reducido de experimentos.
Finalmente, dada la naturaleza estocástica de la exploración de la distribución a posteriori de los parámetros, es necesario permitir una exploración exhaustiva en busca del árbol con máxima densidad a posteriori. _______________ EXPERIMENTAL DESIGN FOR A MIXTURE OF q COMPONENTS AND n PROCESS VARIABLES IN ORDER TO MODEL THE RHEOLOGICAL PROPERTIES OF PECTIN GELS. ABSTRACT: The problem of fitting a statistical model in a high-dimensional space requires a sampling plan that effectively captures the irregularities in the space. Recently, the treed Gaussian Process has been successfully used in computer experiments where the assumption of stationarity in the correlation structure between independent factors is inadequate. In this work, we used a variation of the NTLBG algorithm in order to create uniform designs in the hypercube I ̅_4 and in three Simplices. Moreover, we used a transformation to map the vectors from each Simplex onto the Euclidian space. Thus, the experimental space is a combination of a four-dimension hypercube and three Simplices, i.e., I ̅_4×T_4×T_2×T_2, mapped onto the hypercube I ̅_9 for analysis. On the other hand, we compared an intelligent approach based on Active Learning Cohn (ALC) to grow the initial experimental design based on the results, in an iterative process of simulation- analysis, against a static approach where the initial size of the experiment matches that of the intelligent approach in each iteration. Results suggest that it is preferable to start with a design of a smaller size of n_0 = 20, and to grow it intelligently by adding additional runs in the regions where uncertainty is greater, rather than start with a uniform design of a bigger size n_0 >> 20. In practice, an experimental design of size ≥ 150 could be deemed excessively big but, considering that the experimental space has 9 independent dimensions (12 dimensions in total), this methodology is way more efficient than fractional factorial, because it explores each variable in a greater number of levels with a reduced number of experiments. Finally, given the stochastic nature of the exploration of the a posteriori distribution, it is necessary to allow an exhaustive exploration to search for the maximum a posteriori (MAP) tree.
Collections
- Tesis MC, MT, MP y DC [102]