Base de datos para factores de transcripción de Glycine max, Triticum aestivum y Zea maiz
Abstract
Los factores de transcripción (FTs) son proteínas que incrementan o disminuyen la tasa
transcripcional de uno o varios genes. Los FTs desempeñan un papel fundamental en el
control de casi todos los procesos biológicos: crecimiento, metabolismo, respuesta a factores ambientales, etc. En plantas cultivadas, son de particular importancia aquellos relacionados con la respuesta al estrés (sequía, salinidad, bajas temperaturas, plagas, enfermedades, etc.). La identificación de FTs, su posterior anotación y la construcción de bases de datos públicas constituye un importante recurso para el estudio de los procesos que controlan la expresión génica. Se construyó la base de datos FT-MTS que contiene información de 13,975 genes identificados como FTs en los genomas de Glycine max, Triticum aestivum y Zea maiz. Para ampliar la información sobre dichos FTs, se hizo una completa anotación que incluye: descripción de cada familia, alineamientos múltiples, dominios de unión, arquitectura de dominios, estructura 3D de proteínas homologas y grupos de ortólogos. Además, se incluyeron referencias a bases de datos externas que contienen descripción de dominios (Pfam), descripción de estructuras 3D (Protein Data Bank) y literatura relacionada (Pub-MED). Finalmente, se construyó una interfaz web (http://174.123.176.26:3000) que permite a los usuarios realizar búsquedas en la base de datos, descargar las secuencias de cada FT, descargar los alineamientos múltiples de cada dominio y comparar sus secuencias con las de los FTs vía BLAST o HMMER. _______________ TRANSCRIPTION FACTOR DATABASE OF GLYCINE MAX, TRITICUM AESTIVUM AND ZEA MAIZ. ABSTRACT: Transcription factors (TFs) are proteins that enhance or decrease the transcriptional rate of one of several genes. TFs play key roles regarding the control of almost all biologic processes: growth, metabolism, response to environmental facors, etc. In crop plants, TFs related to response to stress are particularly important (drought, salinity, low temperatures, plagues, plant diseases, etc.). Identification of TFs, their subsequent annotation and the construction of public databases constitute a valuable resource to study the processes that control genetic
expression. A database named FT-MTS was built containing information about 13,975 genes identified as TFs in the Glycine max, Triticum aestivum y Zea maiz genomes. In order to broaden the information about those TFs, other data was recorded: description of every family, multiple sequence alignments, binding domains, domain architectures, 3D structure of homologous proteins and ortholog clusters. References to external databases containing domain descriptions (Pfam), 3D structure description (Protein Data Bank) and related literature (PubMED) were also included. A web interface p://174.123.176.26:3000) was built, so that users may search the data base, download the sequences for each TF and multiple sequence alignments of each domain, and compare their sequences with the TFs using BLAST or HMMER.