Tesis MC, MT, MP y DCTesis y trabajos de gradohttp://hdl.handle.net/10521/45472024-03-29T15:54:45Z2024-03-29T15:54:45ZUso de GPUS para el ajuste de redes neuronales bayesianas regularizadas.Rodríguez Muñoz, Octavio.http://hdl.handle.net/10521/49682023-03-13T17:34:54Z2021-01-01T00:00:00ZUso de GPUS para el ajuste de redes neuronales bayesianas regularizadas.
Rodríguez Muñoz, Octavio.
Una de las herramientas provenientes de la inteligencia artificial que más se utiliza en la actualidad para realizar análisis de datos son las redes neuronales artificiales (RNA). Estas surgen del intento de los investigadores de emular el modelo de aprendizaje del cerebro humano. A lo largo de los años, se han ido desarrollando técnicas que ayudan a optimizar las RNA, tanto en la parte matemática como computacional, esto último, valiéndose de los avances que han llevado a obtener procesadores más veloces y además con nuevas caracterı́sticas como el multi núcleo y el multiproceso, mismas que hasta hace un par de décadas, sólo eran posibles en equipos de alto desempeño como supercomputadoras y clústers de cómputo paralelo. La llegada de dicha potencia de cálculo a los equipos destinados al usuario común ası́ como el desarrollo de tecnologı́as coadyuvantes para el cálculo de gráficos para el mercado de los video juegos (GPUs), han logrado que en la actualidad sea posible contar con una alta capacidad de paralelización en equipos tan accesibles como una computadora portatil o de escritorio. Es este último desarrollo tecnológico el que ha motivado el estudio de algoritmos de optimización que si bien, en muchos casos, ya habı́an sido paralelizados para equipos de alto rendimiento, requieren modificaciones para poder operar en los equipos que cuentan con GPUs para realizar los cálculos en paralelo. Sumado a lo anterior, se siguen explorando las capacidades de las GPUs para tratar algunos problemas de paralelización, sobre todo, cuando se trata de grandes cantidades de datos. Este trabajo se enfoca en el ajuste de una red neuronal de una sola capa oculta aplicando regularización Bayesiana y cómputo paralelo, este último se realiza mediante el lenguaje y la arquitectura CUDA para GPUs. Para poder realizar algunos cálculos se hizo uso de bibliotecas como cuBLAS y CuSolver. Finalmente, se evaluó el desempeño del programa con dos implementaciones previas del algoritmo, para cómputo secuencial (biblioteca de funciones brnn del paquete estadı́stico R) y para cómputo paralelo mediante MPI. _______________ USE OF GPUS FOR FITTING BAYESIAN REGULARIZED NEURAL NETWORKS. ABSTRACT: One of the tools from artificial intelligence that is most used today to perform data analysis is artificial neural networks (ANN). These arise from the attempt of researchers to emulate the learning model of the human brain. Over the years, techniques have been developed that help to optimize ANN, both in the mathematical and computational part, the latter, making use of the advances that have led to faster processors and also with new features such as multi core and multiprocessing, the same as until a couple of decades ago, were only possible on high-performance equipment such as supercomputers and parallel computing clusters. The arrival of this computing power to the equipment intended for the common user as well as the development of auxiliary technologies for the calculation of graphics for the video games market (GPUs), have made it possible to have a high capacity today of parallelization in equipment as accessible as a laptop or desktop computer. It is this latest technological development that has motivated the study of optimization algorithms that, although, in many cases, had already been parallelized for high-performance equipment, require modifications to be able to operate on equipment that has GPUs to perform calculations in parallel. In addition to the above, the capabilities of GPUs are still being explored to deal with some parallelization problems, especially when it comes to largedata sets. This work focuses on the fitting process of a single hidden layer neural network applying Bayesian regularization and parallel computation, the latter is done using the CUDA language and architecture for GPUs. In order to perform some calculations, libraries such as cuBLAS and CuSolver were used. Finally, the performance of the program was compared with two previous implementations of the algorithm, for sequential computation (brnn library in R language) and for parallel computation using open MPI.
Tesis (Maestría en Ciencias, especialista en Cómputo Aplicado).- Colegio de Postgraduados, Campus Montecillo, 2021.
2021-01-01T00:00:00ZAplicación de aprendizaje automático para evaluar el rendimiento escolar a partir de la prueba enlace.Morales Hernández, Miguel Ángelhttp://hdl.handle.net/10521/48002022-10-24T16:43:55Z2021-12-01T00:00:00ZAplicación de aprendizaje automático para evaluar el rendimiento escolar a partir de la prueba enlace.
Morales Hernández, Miguel Ángel
El logro académico de los estudiantes está relacionado con diferentes variables que lo afectan, algunas son de características personales de los alumnos, estructurales o de ubicación geográfica de las escuelas, características del entorno escolar entre otras. La capacidad para predecir el rendimiento académico de los estudiantes ofrece beneficios a los profesores, alumnos y a las escuelas, para poder generar programas estratégicos de prevención o acompañamiento de estudiantes con bajo desempeño, detección de alumnos con alta probabilidad de deserción e identificación de características de los estudiantes que permita un buen aprovechamiento. A través de algoritmos de aprendizaje automático, es posible clasificar a estudiantes de acuerdo con características determinadas, por ejemplo, la calificación que obtuvieron en una materia o todo su historial académico. En esta investigación se implementan tres algoritmos de aprendizaje automático supervisado, bosque aleatorio, red neuronal multicapa y potenciación del gradiente para clasificar a estudiantes de la prueba ENLACE en tres clases o niveles de logro, 0: insuficiente, 1: elemental, 2: bueno o excelente en las asignaturas de español y matemáticas de 2008 y 2011. Se consideraron 13 variables predictoras que pueden influir en la clasificación. Bosque aleatorio se aplica para seleccionar las variables más importantes que se incluirán en los modelos; red neuronal multicapa y potenciación del gradiente para clasificar a los alumnos de tres entidades, Tlaxcala, Guerrero y Nuevo León. Los resultados muestran que es importante conocer previamente la calificación de los alumnos en español para clasificarlos en matemáticas y la calificación en matemáticas para predecir su clasificación en español, esto como una medida general de capacidad. Con la red neuronal multicapa se obtienen mejores resultados de clasificación en todas las entidades para español y con el modelo de potenciación del gradiente se obtienen mejores precisiones de clasificación para matemáticas. Al comparar los niveles de logro por sexo en las tres entidades, se observa que en español y matemáticas la proporción de mujeres en los niveles de logro académico 1 y 2 es mayor a la de los hombres. _______________ MACHINE LEARNING APP FOR TO ASSESSS SCHOOL PERFORMANCE FROM THE ENLACE TEST. ABSTRACT: The academic achievement of students is related to different variables that affect it, some personal characteristics of the students, structural or geographic location of the schools, characteristics of the school environment, among others. The ability to predict the academic performance of students offers benefits to teachers, students, and schools, to be able to generate strategic programs for the prevention or monitoring of students with low performance, detection of students with a high probability of dropping out and identification of characteristics of the students that allow good achievement. Through machine learning algorithms, it is possible to classify students according to certain characteristics, for example, the grade they obtained in a subject or their entire academic history. In this research, three supervised machine learning algorithms, random forest, multilayer neural network and gradient boosting are implemented to classify ENLACE test students into three classes or levels of achievement, 0: insufficient, 1: elementary, 2: good or excellent in spanish and mathematics subjects 2008 and 2011. Thirteen predictor variables that may influence the classification were considered. Random forest is applied to select the most important variables to be included in the models; Multilayer neural network and gradient boosting to classify students from three entities, Tlaxcala, Guerrero, and Nuevo León. The results show that it is important to previously know the qualification of the students in spanish to classify them in mathematics and the qualification in mathematics to predict their classification in spanish, this as a general measure of ability. With the multilayer neural network, better classification results are obtained in all entities for spanish and with the gradient boosting model, better classification accuracies are obtained for mathematics. When comparing achievement levels by sex in the three entities, it is observed that in spanish and mathematics the proportion of women in academic achievement levels 1 and 2 is higher than that of men.
Tesis (Maestría en Ciencias, especialista en Cómputo Aplicado).- Colegio de Postgraduados, Campus Montecillo, 2021.
2021-12-01T00:00:00ZSolución Web para simular escenarios financieros alternos de plantaciones forestales.Zárate Sánchez, José Guillermohttp://hdl.handle.net/10521/39732022-02-24T21:28:37Z2017-09-01T00:00:00ZSolución Web para simular escenarios financieros alternos de plantaciones forestales.
Zárate Sánchez, José Guillermo
El presente trabajo expone el desarrollo de una aplicación web para simular escenarios de costos en proyectos de plantaciones forestales. Una herramienta de éste tipo permite a los tomadores de decisiones realizar análisis de escenarios de inversión, considerando factores de costos y beneficios que pudieran influir en proyectos de este tipo. Así el tomador de decisiones podrá, de forma rápida, estimar si realizar dicha inversión dará beneficios o no. Para la realización del trabajo se tomó como base el modelo del simulador para estimar costos en plantaciones forestales y reforestaciones (SIMCOPLAN) y algunas características programas que realizan operaciones similares. Además, se recabó información respecto a la metodología de cálculo de indicadores financieros en plantaciones forestales. La información recabada sirvió para generar y clasificar los requisitos del simulador y a partir de éstos se desarrollaron los diferentes procedimientos, algoritmos y funciones para realizar las interfaces y los programas de la aplicación. Para la codificación de la aplicación se utilizó una computadora con Windows 7 en la cual se instalaron los paquetes para desarrollo de aplicaciones Microsof® Visual Studio® 2013 Communnity y el sistema gestor de bases de datos Microsoft® SQL Server® 2012 Express Edition. Se utilizaron los lenguajes ASP.Net y C# como lenguajes de interfaz y soporte de la aplicación. La programación en la base de datos se realizó en Transact-SQL. Posteriormente, se desarrolló la aplicación y se instaló un prototipo en un servidor de hospedaje. Las pruebas de funcionamiento demostraron que la aplicación funciona de manera adecuada y realiza de manera correcta los cálculos que realiza el SIMCOPLAN, además, al estar parametrizado permite la captura de diversos escenarios con los parámetros definidos por el usuario lo cual permite observar claramente el efecto de los cambios en parámetros como la tasa de descuento, inflación, precio de los productos e insumos, los costos y las intervenciones de aclareo sobre el escenario final. _______________ A WEB SOLUTION TO SIMULATE ALTERNATE FINANCIAL SCENARIOS OF FOREST PLANTATIONS. ABSTRACT: This study exposes the development of a web application to simulate costs scenarios on
forest plantations projects. With a tool like this, decision makers can make analysis of investment scenarios, considering factors of costs and benefits whose could have effect on forest plantations projects. Thus, the decision makers can estimate by a quick way if do the investment will give benefits or not. To make the application there was took as base the simulator to estimate cost in forest
plantations and reforestation (SIMCOPLAN) and some characteristics of programs that do similar operations. Moreover, there was collected information about methodology to
calculate financial indicators in forest plantations projects. The collected information was used to generate and classify the application requirements. The requirements were the beginning to develop the procedures, algorithms and functions to make the application interfaces and programs. To codify the application there was used a computer with Windows 7. On this computer were installed the packages to application development Microsoft® Visual Studio® 2013 Community and SQL Server® 2012 Express Edition as Management Database System. The application interface and support programs were wrote using ASP.Net and C#. The codification in the database was made using Transact-SQL. Finally, the application was developed and installed as a prototype on a hosting web server. The functionality tests show that this application works correctly. It does the operations that the SIMCOMPLAN does. In addition, it use a parametric model and it lets to insert several scenarios with parameters defined by the user and look clearly the effect of the parameters changes as discount rate, inflation rate, products and supplies price , the costs rates and the tree cutting interventions over the final scenario.
Tesis (Maestría en Ciencias, especialista en Cómputo Aplicado).- Colegio de Postgraduados, 2017.
2017-09-01T00:00:00ZPrototipo de un Sistema Informático web apoyado de tecnología Data Warehouse para un proceso de acreditación educativa.Barrera Velasco, Diana Paolahttp://hdl.handle.net/10521/37712022-02-24T21:18:42Z2015-12-01T00:00:00ZPrototipo de un Sistema Informático web apoyado de tecnología Data Warehouse para un proceso de acreditación educativa.
Barrera Velasco, Diana Paola
El presente trabajo tuvo por objetivo proponer un Prototipo de un Sistema Informático web apoyado de tecnología Data Warehouse (SIGCEA), que sirva como apoyo para un proceso de acreditación educativa ante COMEAA del programa educativo Ingeniero Agrónomo Especialista en Fitotecnia (IAEF) de la Unidad Académica de Fitotecnia (UAF) de la Universidad Autónoma Chapingo (UACh) y además permita identificar algunas tendencias que coadyuven en planes de mejora continua. Se definió la metodología, en primer lugar con un estudio para conocer las necesidades en la UAF a través del Diagrama de fuerzas, Diagrama de Ishikawa e Histograma de Pareto, en base a los resultados obtenidos se propuso el SIGCEA, por lo que se definió una metodología empleada para el desarrollo del SIGCEA apoyada en conceptos y buenas prácticas de la ingeniería del software. Se expusieron cada una de las fases propuestas para el desarrollo del software. Al final se muestran los resultados de una parte del SIGCEA, en especial la sección V. Alumnos del COMEAA, la estructura de la base de datos, el mapa general de navegación, algunos interfaces, reportes y tendencias obtenidas a través del Data Warehouse y se proponen algunos algoritmos de Minería de Datos cuando se tenga . El sistema web propuesto tiene contemplado, evolución, escalabilidad y portabilidad de acuerdo a las necesidades de la UAF y de cambios que puedan proponer en el COMEAA. _______________ PROTOTYPE OF A COMPUTER SYSTEM TECHNOLOGY SUPPORTED WEB DATA WAREHOUSE FOR EDUCATIONAL
ACCREDITATION PROCESS. ABSTRACT: The present study aimed to propose a prototype of a computer system supported web Data Warehouse (SIGCEA) technology, which serves as support for a process of educational accreditation to COMEAA of the Academic Unit of educational program Agronomist Specialist in Plant Science (IAEF) of Plant (UAF) of the Autonomous University of Chapingo (UACh) and also to identify some trends that contribute to continuous improvement plans. The methodology is defined, first with a study to determine the needs in the UAF through force diagram, Ishikawa Diagram and Histogram Pareto, based on the results obtained SIGCEA set, so it is defined a methodology for the development of SIGCEA supported in concepts and good practices of software engineering. They were exposed each of the stages proposed for software development. At the end the results of part of SIGCEA shown, especially V. Students of COMEAA, the structure of the database, the general navigation map, some interfaces, reports and trends section obtained through the Data Warehouse and propose some data mining algorithms when you have. The web proposed system is contemplated, evolution, scalability and portability according to the needs of the UAF and can propose changes in the COMEAA.
Tesis (Maestría en Ciencias, especialista en Cómputo Aplicado).- Colegio de Postgraduados, 2015.
2015-12-01T00:00:00Z