DISS. ETH NO. 18803 COMPARATIVE ANALYSIS OF mrna TARGETS FOR HUMAN PUF-FAMILY RNA-BINDING PROTEINS A dissertation submitted to ETH ZURICH for the degree of Doctor of Sciences presented by ALESSIA GALGANO Laurea Magistrale in Biomolecular Sciences, University of Turin, Italy Born October 5, 1981 Citizen of Italy Accepted on the recommendation of Prof. Dr. Michael Detmar Prof. Dr. Frédéric Allain Dr. André Gerber 2010
1. SUMMARY 1.1 Summary Post-transcriptional gene regulation is largely mediated by RNA-binding proteins (RBPs) which play a major role in modulating mrna expression at multiple levels, from RNA processing to translation and degradation. Thereby, genome-wide identification of mrnas regulated by RBPs is crucial to decipher post-transcriptional gene regulatory systems. The conserved PUF (PUmilio-Fem3-binding factor)-family of RNA-binding proteins represses gene expression post-transcriptionally by binding to sequence elements in 3 -untranslated region (3 -UTR) of mrnas. Despite their well-studied implications in development and neurogenesis in diverse model organisms, the mammalian members of the PUF family were poorly characterized and mrna targets were mostly unknown. To systematically identify mrnas associated with the two human PUF proteins, PUM1 and PUM2, the ribonucleoprotein immunoprecipitation microarray (RIP-Chip) approach was optimized in HeLa S3 cancer cells. Endogenously formed ribonucleoprotein complexes were purified with specific antibodies, and associated mrnas were analyzed with DNA microarrays. Using this approach, we have identified a largely overlapping set of hundreds of mrnas which were reproducibly associated with the paralogous PUM proteins, many of them encoding functionally related proteins. A characteristic PUF binding motif was highly enriched among PUM-bound mrnas and validated with RNA pull-down assays. Interestingly, though VEGF-A was not selected as a PUM target, the 3 -UTR binds to 6
PUM in vitro and harbors three canonical PUF binding motifs. Preliminary experiments suggested that PUM1 may positively regulate VEGF-A expression by promoting translation, as recently reported for another PUF protein in C. elegans. Furthermore, an extensive bioinformatics analysis revealed that PUF motifs as well as surrounding sequences exhibit higher conservation in PUM-bound mrnas compared to non-bound mrnas, suggesting that PUM function may be modulated by additional proteins which bind conserved elements. Strikingly, we found that PUF motifs are enriched around predicted microrna (mirna) binding sites and that highconfidence mirna binding sites are significantly enriched in the 3 -UTR of experimentally determined PUM1 and PUM2 targets, strongly predicting extensive connections of human PUM proteins with the mirna regulatory system. These results indicate that cross-talk between translational regulation through RBPs and mirnas may be more frequent than previously appreciated, and give a framework for deciphering the molecular mechanisms by which PUF proteins regulate their target mrnas. In this perspective, further analysis of PUM1-miRNA interactions on VEGF-A 3 -UTR may help understanding VEGF-A post-transcriptional regulation, with potential application in controlling VEGF-A promoted angiogenesis in cancer. 7
1.2 Riassunto La regolazione genica post-trascrizionale è in gran parte mediata da proteine che legano gli RNA, le quali svolgono un ruolo importante nel modulare l'espressione degli mrna a più livelli, dalla modificazione dell RNA fino alla traduzione e alla degradazione. Per questo motivo, l'identificazione sistematica degli mrna regolati dalle proteine che legano gli RNA è fondamentale per decifrare sistemi post-trascrizionali di regolazione dell espressione genica. La famiglia PUF (PUmilio-Fem3-binding factor) di proteine che legano l RNA è evolutivamente conservata, e reprime l'espressione genica a livello post-trascrizionale legandosi a sequenze localizzate nelle 3'-UTR (3 -sequenze non tradotte) degli mrna. Nonostante le loro ben studiate implicazioni nello sviluppo embrionale e nella neurogenesi in diversi organismi modello, le PUF dei mammiferi erano scarsamente caratterizzate e gli mrna associati a queste proteine erano per lo più sconosciuti. Per identificare sistematicamente gli mrna associati alle due proteine PUF umane, denominate PUM1 e PUM2, il metodo RIP-Chip (immunoprecipitazione di complessi ribonucleoproteici-microarray) è stato ottimizzato nelle cellule tumorali HeLa S3. I complessi ribonucleoproteici formati endogenamente sono stati purificati con anticorpi specifici, e gli mrna associati sono stati analizzati con la tecnica del DNAmicroarray. Usando questo approccio, abbiamo individuato due serie composte ciascuna da centinaia di mrna in gran parte coincidenti che sono associati in modo riproducibile alle due paraloghe proteine PUM, e codificano in larga parte per proteine funzionalmente correlate. Un caratteristico motivo di legame di PUF è stato individuato 8
significativamente arricchito tra gli mrna associati alle protein PUM, e successivamente validato con esperimenti di RNA pull-down. È interessante notare che, sebbene VEGF-A non sia stato identificato come mrna associato a PUM, la 3'-UTR di VEGF-A si lega a PUM in vitro e contiene tre canoniche sequenze di legame per proteine PUF. Esperimenti preliminari suggeriscono che PUM1 possa regolare positivamente l espressione di VEGF-A attraverso la promozione della traduzione dell mrna, come recentemente riportato per un'altra proteina PUF in C. elegans. Inoltre, un estesa analisi bioinformatica ha rivelato che non solo i motivi PUF, ma anche le sequenze circostanti risultano maggiormente conservate tra gli mrna associati a PUM rispetto agli mrna non associati a PUM, suggerendo che la funzione delle proteine PUM può essere modulata da altre proteine che legano sequenze conservate nella 3 -UTR. Sorprendentemente, abbiamo scoperto che i motivi PUF sono significativamente arrichiti in mrna che hanno siti di legami per i microrna (mirna), e che siti di legame di mirna altamente coservati sono notevolmente arricchiti nelle 3'- UTR degli mrna associati a PUM1 e PUM2. Questo consente di prevedere un importante interazione tra le proteine umane PUM e il sistema di regolazione posttrascrizionale mediato dai mirna. Questi risultati indicano che le interazioni tra proteine che legano gli RNA e i mirna per la regolazione post-trascrizionale possano essere più frequenti rispetto a quanto precedentemente descritto, e forniscono un quadro per decifrare i meccanismi molecolari attraverso cui le proteine PUF regolano i loro mrna bersaglio. In questa prospettiva, un'analisi più approfondita delle interazioni tra PUM1 e mirna sulla 3'-UTR di VEGF-A può aiutare a comprendere meglio come VEGF-A sia regolato a livello post- 9
trascrizionale, con potenziali applicazioni nel controllo dell angiogenesi promossa da VEGF-A nei tumori. 10