Show simple item record

dc.contributor.authorHernández Juárez, Evelio
dc.contributor.authorHERNANDEZ JUAREZ, EVELIO
dc.creatorHERNANDEZ JUAREZ, EVELIO; 216560
dc.date.accessioned2018-09-18T22:36:10Z
dc.date.available2018-09-18T22:36:10Z
dc.date.issued2015
dc.identifier.urihttp://hdl.handle.net/10521/2812
dc.descriptionTesis (Doctorado en Ciencias, especialista en Estadística).- Colegio de Postgraduados, 2015.es_MX
dc.description.abstractPara organismos eucariontes, en un gen, además de las regiones codificantes de proteínas (exones) se encuentran regiones no codificantes conocidas como intrones. Existen diferentes enfoques para encontrar las fronteras entre intrones y exones, uno de ellos trata de distinguir cambios en la composición (proporción) de sus nucleótidos y en este contexto usar la segmentación recursiva basada en medidas de divergencia; en esta metodología se necesita definir un “umbral” (parámetro que sirve como criterio de parada). En este estudio se propone que la elección del umbral sea basada en la distribución Monte Carlo de la máxima divergencia, y que dicho umbral dependa del tamaño de la secuencia considerada. Bajo la misma perspectiva de encontrar diferencias en la proporción de nucleótidos dentro de las secuencias, se propone usar la búsqueda de puntos de cambio en datos categóricos. Para este fin se optó por la alternativa de reformular la búsqueda como un problema de selección de variables y para ello se usó LASSO Binomial. Usando secuencias simuladas para probar ambas metodologías se obtuvieron resultados, en términos de precisión, comparables con los de estudios existentes. _______________ TWO METHODS FOR THE PREDICTION OF INTRONS AND EXONS INTO A GENE. ABSTRACT: For eukaryotic organisms, within a gen in addition to protein coding regions (exons) there are noncoding regions know as introns. There are different approaches to find the boundaries between introns and exons, one of those tries to distinguish changes in the composition (proportion) of its nucleotides and in this context the recursive segmentation based on measures of divergence can be used. To implement this methodology a threshold (a parameter that serves as a stopping criterion) needs to be define. Here it is proposed that the choice of the threshold be through by Montecarlo distribution of the maximum divergence; moreover, that such the threshold depends on the size of the sequence under study. Under the same perspective of finding differences in the proportion of nucleotides within the sequences, the search of change points in categorical data can be used. For this purpose, the alternative of reformulating the search as a problem of selection of variables was used following the LASSO binomial. Simulated sequences were used to test both methods and results similar to those of previous studies were obtained.es_MX
dc.description.sponsorshipConsejo Nacional de Ciencia y Tecnología (CONACyT).es_MX
dc.formatpdfes_MX
dc.language.isospaes_MX
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0es_MX
dc.subjectIntrones y exoneses_MX
dc.subjectProporción de nucleótidoses_MX
dc.subjectMedidas de divergenciaes_MX
dc.subjectSelección de variableses_MX
dc.subjectIntrons and exonses_MX
dc.subjectNucleotide proportiones_MX
dc.subjectDivergence measureses_MX
dc.subjectVariable selectiones_MX
dc.subjectEstadísticaes_MX
dc.subjectDoctoradoes_MX
dc.subject.classificationCIENCIAS FÍSICO MATEMÁTICAS Y CIENCIAS DE LA TIERRA::MATEMÁTICAS::ESTADÍSTICAes_MX
dc.titleDos métodos para la predicción de intrones y exones en un gen.es_MX
dc.typeTesises_MX
Tesis.contributor.advisorRamírez Valverde, Gustavo
Tesis.contributor.advisorPérez Elizalde, Sergio
Tesis.contributor.advisorSantacruz Varela, Amalio
Tesis.contributor.advisorRamírez Valverde, Benito
Tesis.contributor.advisorSotres Ramos, David
Tesis.date.submitted2015
Tesis.date.accesioned2015
Tesis.date.available2015
Tesis.typeTesises_MX
Tesis.format.mimetypepdfes_MX
Tesis.format.extent1,549 KBes_MX
Tesis.subject.nalProteínases_MX
Tesis.subject.nalProteinses_MX
Tesis.subject.nalNucleótidoses_MX
Tesis.subject.nalNucleotideses_MX
Tesis.subject.nalMétodo Monte Carloes_MX
Tesis.subject.nalMonte Carlo methodes_MX
Tesis.subject.nalAlgoritmoses_MX
Tesis.subject.nalAlgorithmses_MX
Tesis.subject.nalADNes_MX
Tesis.subject.nalDNAes_MX
Tesis.rightsAcceso abiertoes_MX
Articulos.subject.classificationEstadísticaes_MX
dc.type.conacytdoctoralThesises_MX
dc.identificator1||12||1209es_MX
dc.contributor.directorRAMIREZ VALVERDE, GUSTAVO; 8688
dc.audiencegeneralPublices_MX


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

http://creativecommons.org/licenses/by-nc-nd/4.0
Except where otherwise noted, this item's license is described as http://creativecommons.org/licenses/by-nc-nd/4.0