Busque entre los 169499 recursos disponibles en el repositorio
Para que las células funcionen correctamente, la información génica debe expresarse fielmente en ARN o proteínas. Un paso clave en la expresión génica es la traducción de ARNm a proteína, donde el reconocimiento de uno de los tres codones de parada (TAA, TGA o TAG) por la maquinaria traduccional es esencial para terminar la traducción en la posición correcta, y garantizar la función de la proteína sintetizada. Sin embargo, en determinadas ocasiones, los ribosomas pueden ignorar el codón de terminación y en cambio recodificarlo continuando la traducción en la región 3' UTR, incorporando aminoácidos hasta que la maquinaria ribosomal reconoce un codón de parada posterior. En consecuencia, se sintetizan nuevos productos polipeptídicos extendidos en su extremo C-terminal que pueden adquirir un nuevo dominio funcional. Esta ausencia de reconocimiento del codón de terminación se denomina lectura del codón de parada (denotado en adelante como LCP). Aunque existe evidencia de proteínas funcionales derivadas de eventos de LCP en diversos genomas, aún se desconocen ampliamente las condiciones que inducen este fenómeno. Por esta razón, se ha discutido la presunción de que la LCP puede constituir un error de decodificación en la traducción, debido a errores moleculares en un entorno regulador que conducen a la expresión de diferentes isoformas de proteínas. No obstante, recientes experimentos en eucariotas sugieren que los eventos de LCP son algo más generalizados de lo que se suponía previamente, y que podrían estar regulados. En este sentido, varios autores han propuesto que la LCP podría ocurrir por la acción programada de componentes moleculares específicos, aún no identificados; generando la hipótesis que la LCP es un mecanismo para ampliar la diversidad de los proteomas. Por otro lado, las nuevas tecnologías de secuenciación han puesto de manifiesto algunas dificultades del proceso de anotación genómica. En este sentido, se ha detectado una considerable cantidad de eventos de traducción en regiones previamente consideradas no codificantes, tanto en las extensiones de marcos de lectura por LCP, como en la traducción de pequeños marcos de lectura en los 5' UTRs. Muchos de estos péptidos no convencionales descubiertos conllevan estructuras génicas que aguardan clasificación, y cuestionan la anotación existente de muchos genes conocidos. Al respecto, una anotación eficiente requiere no sólo el registro de nuevos elementos funcionales, sino además corregir la delimitación imprecisa de muchos ORFs conocidos. En esta tesis se realizó una identificación exhaustiva de eventos de LCP en el transcriptoma de D. melanogaster mediante la evaluación de perfiles de densidad ribosomal, construidos a partir de datos públicos derivados del secuenciamiento de los fragmentos transcriptómicos protegidos por ribosomas (Ribo-Seq). Además, se realizó una estimación de la tasa de fuga ribosomal asociada a cada evento de LCP identificado. Con base en la identificación de miles de eventos de LCP, se realizó una caracterización estadística de la frecuencia de uso de nucleótidos en la región proximal al codón de parada en cada transcripto. La asociación de estas dos informaciones a través de un modelo de regresión lineal, permitió dilucidar que el contexto de nucleótidos es un factor molecular determinante en la regulación de la terminación eficiente de la traducción. Este análisis permitió inferir la existencia de patrones que funcionan a modo de señal para la ocurrencia de la LCP. Estos son dependientes de cada codón de parada, sugiriendo la existencia de al menos dos mecanismos que alteran el proceso de terminación traduccional. Estos resultados son también evidencia de que la LCP no constituye un mero error de decodificación, sino que responde a la presencia de factores moleculares programados para la expresión diferencial de productos génicos de baja abundancia. Más allá de contribuir a la mejora en la anotación genómica de la mosca de la fruta, esta tesis profundiza en el conocimiento de los mecanismos que regulan la LCP y proporciona un avance en la comprensión de la expresión génica. En particular, este conocimiento puede ampliar el potencial de las estrategias terapéuticas para patologías genéticas causadas por mutaciones sin sentido, como la fibrosis quística.