Data Warehouse y minería de datos como alternativas al análisis de datos forestales
Abstract
El presente trabajo surge de la necesidad de analizar grandes volúmenes de datos originados durante el Inventario Nacional Forestal y de Suelos (INFyS) 2004-2009. El objetivo fue “Diseñar un Data Warehouse y la aplicación de modelos de minería de datos como alternativas para el análisis de información forestal”. La metodología de la investigación fue cualitativa, de diseño y evaluación de software. Se tomó la base de datos del INFyS 2004-2009 y se reconstruyó su diagrama entidad-relación. Usando la información de la base de datos del INFyS 2004-2009 como insumo, se compararon cuatro modelos de minería de datos para la clasificación del género arbóreo Quercus, y se seleccionó el mejor modelo mediante los criterios de gráfica de elevación y de precisión. A partir de esta base de datos, también se diseñó un almacén de datos o “Data Warehouse” para la construcción de cubos de análisis para volumen de madera, biomasa y carbono. El software utilizado fue SQL Server 2008 que contiene el entorno para Desarrollo de Inteligencia de Negocios, el cual cuenta con los proyectos de Servicio de Análisis y Servicio de Integración, utilizados para desarrollar los paquetes que se obtuvieron como productos de la presente investigación. Además, se programaron interfaces para la visualización y análisis de la información, de las cuales dos fueron desarrolladas con las herramientas de Visual Studio 2010 para interactuar con la información del cubo de análisis y dos forman parte de las herramientas de SQL Server. La principal conclusión a la que se llegó es que a partir de la base de datos del Inventario Nacional Forestal y de Suelos 2004-2009 si es posible aplicar modelos de minería de datos para la clasificación del género arbóreo Quercus y también es posible diseñar un Data Warehouse para el análisis del volumen de madera, biomasa y carbono. _______________ DATA WAREHOUSE AND DATAMINING LIKE ALTERNATIVES TO FOREST DATA ANALYSIS. ABSTRACT: This work emerge from the necessity to analyze large amounts of data from the National Forest and Soil Inventory (INFyS) 2004-2009. The goal is "Designing a Data Warehouse and the application of data mining models like alternatives to analyze forest information". The methodology for the research was qualitative and designing and evaluation of software. An entity-relationship diagram was building using the INFyS 2004-2009 database. Four data mining models was comparing for the tree genus Quercus classification, using INFyS 2004-2009 database. The best model was selected using elevation graph and precision criterial. A Data Warehouse was building to analyze wood volume, biomass and carbon using a multidimensional cube. The software used was SQL Server 2008 that contains the Business Intelligence Development Studio environment; this environment has projects like Analysis Services and Integration Services used to develop the packets obtained of this research. Different interfaces was used in visualization and analysis information, two of this was developed with Visual Studio 2010 tools for interact with the analysis cube information. The main conclusion obtained was that from the National Forest and Soil Inventory 2004-2009, is possible applied data mining models for the tree genus Quercus classification, and to design a Data Warehouse to analyze wood volume, biomass and carbon.