BANCHE DATI DI SEQUENZE PROTEICHE E GENOMICHE E ANALISI DELLE SEQUENZE

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "BANCHE DATI DI SEQUENZE PROTEICHE E GENOMICHE E ANALISI DELLE SEQUENZE"

Transcript

1 Cittaro Davide BANCHE DATI DI SEQUENZE PROTEICHE E GENOMICHE E ANALISI DELLE SEQUENZE Caratterizzazione sequenza ID: BF La ricerca in entrez di BF da i seguenti risultati. IDENTIFIERS dbest Id: EST name: uy66d08.y1 GenBank Acc: BF GenBank gi: CLONE INFO Clone Id: Source: DNA type: PRIMERS Sequencing: PolyA Tail: IMAGE: (5') IMAGE Consortium, LLNL cdna Primer name ambiguous Unknown SEQUENCE TAACTTTGTACTAATTTTGGAGGGGAAACCATCTTTTTTAGATACACTTTAAAATGGAAA AACATTTCTTATGGATTCCATCAGGAGCTGTTTTAGGTGCAGTGAGAAATACCCTGCAGG TTCTGCTCAGCCTCTGCCAGTGGCTGCCTCACGTTCCCACAGCAAGACCTGGGAGGGACC TGCTGTGGAAGCTGTGGGTGCAGGCTGGGATAGATAGGGAGGGCATGCCTCGCTTTGGAT GAGGGATCCATTTAAACACTACCGTTTGGAATTGAGGGCTAGAAGGAGAACATGATTTCC TGCAGGAGGGACAAAGGCTGAGTGTTCACGTGCCAGCAGGCTCCAGAACACACCAGGGTT AAAGTTTAACTTTCTGTATGAATTCATTGTTGGGCCCAAATCCGCATAGGAGCACGGTGA TCCCGCGCTCGGGTTTCTGTAGCCTTTTCACAAGTC Quality: High quality sequence stops at base: 360 Entry Created: Oct Last Updated: Dec COMMENTS This clone is available royalty-free through LLNL ; contact the IMAGE Consortium for further information. MGI: LIBRARY Lib Name: McCarrey Eddy round spermatid Organism: Mus musculus Strain: CD-1 Sex: male Organ: testis Tissue type: round spermatids, pooled from multiple mice Develop. stage: 60 day Lab host: DH10B (phage-resistant) Vector: pbluescript SK+ (Stratagene) R. Site 1: XhoII R. Site 2: EcoRI Description: cdna oligo dt-primed [5'-(GA)10-ACTAGTCTCGAGTTTTTTTTTTTTT-3' ] and directionally cloned using 5' linkers 5'-AATTCGGCACGAG-3' and 5'-CTCGTGCCG-3'. Size selection of >400bp material gives average insert size ranging from 1-2

2 kb. Library was mass excised (from lambda-unizap-xr) and resulting single-stranded phagemids were prepped and tranformed into DH10B. Library contains 98.5% recombinants. References: J. Androl. 20: and Gene 25: Library constructed and donated by J. McCarrey, Ph.D. (Southwest Foundation for Biomedical Research, Dept. of Genetics); excision done by E.M. Eddy, Ph.D. (National Institutes of Health, National Institute of Environmental Health Sciences). Original lambda-based library is available through ATCC, catalog # SUBMITTER Name: Marra M/WashU-NCI Mouse EST Project 1999 Institution: Washington University School of Medicine Address: 4444 Forest Park Parkway, Box 8501, St. Louis, MO 63108, USA Tel: Fax: CITATIONS Title: The WashU-NCI Mouse EST Project 1999 Authors: Year: 1999 Status: Unpublished Marra,M., Hillier,L., Kucaba,T., Martin,J., Beck,C., Wylie,T., Underwood,K., Steptoe,M., Theising,B., Allen,M., Bowers,Y., Person,B., Swaller,T., Gibbons,M., Pape,D., Harvey,N., Schurk,R., Ritter,E., Kohn,S., Shin,T., Jackson,Y., Cardenas,M., McCann,R., Waterston,R., Wilson,R. MAP DATA Il confronto della EST trovata contro la banca dati con blastn ha dato i seguenti risultati: Sequences producing significant alignments: (bits) Value gi dbj AK Mus musculus adult female vagin gi dbj AK Mus musculus adult male colon c gi dbj AK Mus musculus adult male testis gi dbj AK Mus musculus adult male testis gi gb BC Homo sapiens, clone IMAGE: e-07 gi ref NM_ Homo sapiens hypothetical prot e-07 gi emb AL Human DNA sequence from clone RP e-07 gi dbj AK Homo sapiens cdna FLJ25604 fis, e-07 gi gb AC Homo sapiens chromosome 3 clone gi ref XM_ Rattus norvegicus similar to C gi ref XM_ Rattus norvegicus similar to C gi gb AC Homo sapiens chromosome 19 clone gi gb AC AC Homo sapiens chromosome gi gb AC AC Homo sapiens chromosome gi gb AF AF Mus musculus ribosomal pr gi dbj AK Mus musculus 9.5 days embryo pa Dei primi quattro risultati trovati, cioè gli allineamenti con le maggiori performances, riportiamo l allineamento:

3 >gi dbj AK Mus musculus adult female vagina cdna, RIKEN full-length enriched library, clone: l10 product:ral-a EXCHANGE FACTOR RALGPS2 homolog [Mus musculus], full insert sequence Length = 3339 Score = 904 bits (456), Expect = 0.0 Identities = 456/456 (100%) Strand = Plus / Plus Query: 1 taactttgtactaattttggaggggaaaccatcttttttagatacactttaaaatggaaa 60 Sbjct: 2209 taactttgtactaattttggaggggaaaccatcttttttagatacactttaaaatggaaa 2268 Query: 61 aacatttcttatggattccatcaggagctgttttaggtgcagtgagaaataccctgcagg 120 Sbjct: 2269 aacatttcttatggattccatcaggagctgttttaggtgcagtgagaaataccctgcagg 2328 Query: 121 ttctgctcagcctctgccagtggctgcctcacgttcccacagcaagacctgggagggacc 180 Sbjct: 2329 ttctgctcagcctctgccagtggctgcctcacgttcccacagcaagacctgggagggacc 2388 Query: 181 tgctgtggaagctgtgggtgcaggctgggatagatagggagggcatgcctcgctttggat 240 Sbjct: 2389 tgctgtggaagctgtgggtgcaggctgggatagatagggagggcatgcctcgctttggat 2448 Query: 241 gagggatccatttaaacactaccgtttggaattgagggctagaaggagaacatgatttcc 300 Sbjct: 2449 gagggatccatttaaacactaccgtttggaattgagggctagaaggagaacatgatttcc 2508 Query: 301 tgcaggagggacaaaggctgagtgttcacgtgccagcaggctccagaacacaccagggtt 360 Sbjct: 2509 tgcaggagggacaaaggctgagtgttcacgtgccagcaggctccagaacacaccagggtt 2568 Query: 361 aaagtttaactttctgtatgaattcattgttgggcccaaatccgcataggagcacggtga 420 Sbjct: 2569 aaagtttaactttctgtatgaattcattgttgggcccaaatccgcataggagcacggtga 2628 Query: 421 tcccgcgctcgggtttctgtagccttttcacaagtc 456 Sbjct: 2629 tcccgcgctcgggtttctgtagccttttcacaagtc 2664 >gi dbj AK Mus musculus adult male colon cdna, RIKEN full-length enriched library, clone: o22 product:ral-a EXCHANGE FACTOR RALGPS2 homolog [Mus musculus], full insert sequence Length = 2932 Score = 904 bits (456), Expect = 0.0 Identities = 456/456 (100%) Strand = Plus / Plus

4 Query: 1 taactttgtactaattttggaggggaaaccatcttttttagatacactttaaaatggaaa 60 Sbjct: 2233 taactttgtactaattttggaggggaaaccatcttttttagatacactttaaaatggaaa 2292 Query: 61 aacatttcttatggattccatcaggagctgttttaggtgcagtgagaaataccctgcagg 120 Sbjct: 2293 aacatttcttatggattccatcaggagctgttttaggtgcagtgagaaataccctgcagg 2352 Query: 121 ttctgctcagcctctgccagtggctgcctcacgttcccacagcaagacctgggagggacc 180 Sbjct: 2353 ttctgctcagcctctgccagtggctgcctcacgttcccacagcaagacctgggagggacc 2412 Query: 181 tgctgtggaagctgtgggtgcaggctgggatagatagggagggcatgcctcgctttggat 240 Sbjct: 2413 tgctgtggaagctgtgggtgcaggctgggatagatagggagggcatgcctcgctttggat 2472 Query: 241 gagggatccatttaaacactaccgtttggaattgagggctagaaggagaacatgatttcc 300 Sbjct: 2473 gagggatccatttaaacactaccgtttggaattgagggctagaaggagaacatgatttcc 2532 Query: 301 tgcaggagggacaaaggctgagtgttcacgtgccagcaggctccagaacacaccagggtt 360 Sbjct: 2533 tgcaggagggacaaaggctgagtgttcacgtgccagcaggctccagaacacaccagggtt 2592 Query: 361 aaagtttaactttctgtatgaattcattgttgggcccaaatccgcataggagcacggtga 420 Sbjct: 2593 aaagtttaactttctgtatgaattcattgttgggcccaaatccgcataggagcacggtga 2652 Query: 421 tcccgcgctcgggtttctgtagccttttcacaagtc 456 Sbjct: 2653 tcccgcgctcgggtttctgtagccttttcacaagtc 2688 >gi dbj AK Mus musculus adult male testis cdna, RIKEN full-length enriched library, clone: g01 product:ral-a EXCHANGE FACTOR RALGPS2 homolog [Mus musculus], full insert sequence Length = 3346 Score = 904 bits (456), Expect = 0.0 Identities = 456/456 (100%) Strand = Plus / Plus Query: 1 taactttgtactaattttggaggggaaaccatcttttttagatacactttaaaatggaaa 60 Sbjct: 2235 taactttgtactaattttggaggggaaaccatcttttttagatacactttaaaatggaaa 2294 Query: 61 aacatttcttatggattccatcaggagctgttttaggtgcagtgagaaataccctgcagg 120 Sbjct: 2295 aacatttcttatggattccatcaggagctgttttaggtgcagtgagaaataccctgcagg 2354

5 Query: 121 ttctgctcagcctctgccagtggctgcctcacgttcccacagcaagacctgggagggacc 180 Sbjct: 2355 ttctgctcagcctctgccagtggctgcctcacgttcccacagcaagacctgggagggacc 2414 Query: 181 tgctgtggaagctgtgggtgcaggctgggatagatagggagggcatgcctcgctttggat 240 Sbjct: 2415 tgctgtggaagctgtgggtgcaggctgggatagatagggagggcatgcctcgctttggat 2474 Query: 241 gagggatccatttaaacactaccgtttggaattgagggctagaaggagaacatgatttcc 300 Sbjct: 2475 gagggatccatttaaacactaccgtttggaattgagggctagaaggagaacatgatttcc 2534 Query: 301 tgcaggagggacaaaggctgagtgttcacgtgccagcaggctccagaacacaccagggtt 360 Sbjct: 2535 tgcaggagggacaaaggctgagtgttcacgtgccagcaggctccagaacacaccagggtt 2594 Query: 361 aaagtttaactttctgtatgaattcattgttgggcccaaatccgcataggagcacggtga 420 Sbjct: 2595 aaagtttaactttctgtatgaattcattgttgggcccaaatccgcataggagcacggtga 2654 Query: 421 tcccgcgctcgggtttctgtagccttttcacaagtc 456 Sbjct: 2655 tcccgcgctcgggtttctgtagccttttcacaagtc 2690 >gi dbj AK Mus musculus adult male testis cdna, RIKEN full-length enriched library, clone: l04 product:ral-a EXCHANGE FACTOR RALGPS2 homolog [Mus musculus], full insert sequence Length = 4398 Score = 904 bits (456), Expect = 0.0 Identities = 456/456 (100%) Strand = Plus / Plus Query: 1 taactttgtactaattttggaggggaaaccatcttttttagatacactttaaaatggaaa 60 Sbjct: 2337 taactttgtactaattttggaggggaaaccatcttttttagatacactttaaaatggaaa 2396 Query: 61 aacatttcttatggattccatcaggagctgttttaggtgcagtgagaaataccctgcagg 120 Sbjct: 2397 aacatttcttatggattccatcaggagctgttttaggtgcagtgagaaataccctgcagg 2456 Query: 121 ttctgctcagcctctgccagtggctgcctcacgttcccacagcaagacctgggagggacc 180 Sbjct: 2457 ttctgctcagcctctgccagtggctgcctcacgttcccacagcaagacctgggagggacc 2516 Query: 181 tgctgtggaagctgtgggtgcaggctgggatagatagggagggcatgcctcgctttggat 240 Sbjct: 2517 tgctgtggaagctgtgggtgcaggctgggatagatagggagggcatgcctcgctttggat 2576

6 Query: 241 gagggatccatttaaacactaccgtttggaattgagggctagaaggagaacatgatttcc 300 Sbjct: 2577 gagggatccatttaaacactaccgtttggaattgagggctagaaggagaacatgatttcc 2636 Query: 301 tgcaggagggacaaaggctgagtgttcacgtgccagcaggctccagaacacaccagggtt 360 Sbjct: 2637 tgcaggagggacaaaggctgagtgttcacgtgccagcaggctccagaacacaccagggtt 2696 Query: 361 aaagtttaactttctgtatgaattcattgttgggcccaaatccgcataggagcacggtga 420 Sbjct: 2697 aaagtttaactttctgtatgaattcattgttgggcccaaatccgcataggagcacggtga 2756 Query: 421 tcccgcgctcgggtttctgtagccttttcacaagtc 456 Sbjct: 2757 tcccgcgctcgggtttctgtagccttttcacaagtc 2792 Alcune osservazioni preliminari possono essere fatte: - L allineamento con le quattro sequenze è totale. - Le quattro sequenze provengono da Mus musculus (da cui proviene anche la EST BF149559) - Le quattro sequenze sono caratterizzate in tre tessuti differenti di topo (tra cui il testicolo, da cui proviene la EST BF149559) Per il momento focalizziamo l attenzione sui due geni espressi nel testicolo (ID: AK e ID: AK029993): LOCUS AK bp mrna linear HTC 05-DEC-2002 DEFINITION Mus musculus adult male testis cdna, RIKEN full-length enriched library, clone: g01 product:ral-a EXCHANGE FACTOR RALGPS2 homolog [Mus musculus], full insert sequence. ACCESSION AK VERSION AK GI: KEYWORDS HTC; CAP trapper. SOURCE Mus musculus (house mouse) ORGANISM Mus musculus Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. [..] FEATURES Location/Qualifiers source /organism="mus musculus" /strain="c57bl/6j" /db_xref="fantom_db: g01" /db_xref="mgi: " /db_xref="taxon:10090" /clone=" g01" /sex="male" /tissue_type="testis" /clone_lib="riken full-length enriched mouse cdna library" /dev_stage="adult" misc_feature /note="ral-a EXCHANGE FACTOR RALGPS2 homolog [Mus musculus] (SPTR Q9ERD6, evidence: FASTY, 90.1%ID,

7 100%length, match=1797) putative" /db_xref="mgi: " BASE COUNT 951 a 735 c 808 g 852 t ORIGIN 1 gggtggcgga ggccccggcg tcgcctcagc ctctcaggaa tgatgcattt gtggccttgg 61 acatgaagta atcagacctc tgttgctgtt actgtaggct caggggctga tgaggaaagc 121 atggacctaa tgaacgggca ggcaagcagt gttactatcg cagccactgt ttccgagaag 181 agtagcagct ctggcaccct aagcgagaag ggctaccgca cagatgcgta agttgatgct 241 accggtttga tgttcttaag gttacgccag aagaatacgc gggtcagata acactaatgg 301 atgttccagt gtttaaagct attcagccag atgaactttc aagttgtgga tggaataaaa 361 aagaaaaata tagttctgca ccaaatgcag ttgctttcac aagaagattt aatcacgtaa 421 gcttttgggt tgtaagagag attctccatg ctcaaacact gaaaataaga gcagaagttt 481 tgagccacta tattaagact gctaagaaac tatatgaact taacaacctt cacgcactta 541 tggctgtggt ttctggctta cagagtgcgc cgattttccg gttgactaag acgtgggcgt 601 tattaagtcg aaaagacaaa actacctttg aaaaactaga atatgtaatg agtaaagaag 661 ataactacaa aagactcaga gactatataa gcagcttaaa gatgactcct tgcattccct 721 atttaggcat ctatttgtct gacttgacct acattgactc cgcgtaccca tccaccggca 781 gcattctaga aaatgagcaa agatcaaatc tgatgaacaa cattcttcga ataatttctg 841 atttgcagca gtcctgtgaa tatgatattc ccatattgcc tcatgtccaa aaatacctga 901 actctgttca gtatatagaa gaactacaaa agtttgtgga agacgataat tacaagctct 961 ccttaaagat agaaccagga gcaagtactc cacgctcggc tgcctccagg gaggacctag 1021 caggtcctga cataggcgcc tcaccccagg gagggaggaa gagtagtgct gctgctgctg 1081 ccgccgcggc tgccgaggga gccttactgc cacagacgcc accttcccct cggaacctca 1141 ttccacacgg acacaggaag tgccacagcc tgggttacaa tttcattcat aagatgaaca 1201 cagcagagtt taagagcgca acgttcccaa acgcagggcc acggcacctg ctggatgata 1261 gtgtcatgga gccgcacgca ccgtcgcgag gccaggctga gagctctaca ctttccagtg 1321 gaatatccat agggagcagt gatggttctg aactaagcga agagacctca tggccggctt 1381 ttgaaaggaa cagattatac cattctctcg gcccggtgac aagagtgccg cgaaatggct 1441 atcgaagcca cacgaaggcc agcagctctg cggagtcgga agatttggcg gtgcatctgt 1501 accccggagc tgttactatt caaggtgtgc tccggaggaa aaccttgcta aaagaaggca 1561 agaaacccac agtagcatct tggacaaagt attgggcagc cttgtgtgga acacagcttt 1621 tttactatgc cgccaaatct ctgaaggcta cagaaagaaa gcatttcaaa tcaacgtcaa 1681 ataagaatgt gtctgtggtg ggctggatgg tgatgatggc tgacgaccca gagcatccag 1741 acctctttct gctgactgac tccgagaaag gaaattcata caagtttcaa gctggcagca 1801 ggatgaatgc aatgctgtgg tttaaacact tgagcgcggc ctgccagagt aacaagcaac 1861 aggttcctac aaacttgatg acttttgagt aaacgcctga gacagaagag gagtgctatt 1921 gttcccgtgt ggaaccggga cctgccgaga gccccagccg caccatcccg tgccaggaag 1981 agcccccagg ctccagccca gcctccggag ctcagaacca aaagcactaa tttcagggaa 2041 tgaagtgaga tgttcccaga gaaaaacgat ggagttgcaa agcaaactgc catgaacttc 2101 gcttcttctc tccgaactga cctgtggaag ccactgcctt aacagagtgc gaggagagcc 2161 gacaccaaat agtgtgtgtg cgtcttctgg cggtgctgtg cttggaataa attgtagcta 2221 atttgcattt cttttaactt tgtactaatt ttggagggga aaccatcttt tttagataca 2281 ctttaaaatg gaaaaacatt tcttatggat tccatcagga gctgttttag gtgcagtgag 2341 aaataccctg caggttctgc tcagcctctg ccagtggctg cctcacgttc ccacagcaag 2401 acctgggagg gacctgctgt ggaagctgtg ggtgcaggct gggatagata gggagggcat 2461 gcctcgcttt ggatgaggga tccatttaaa cactaccgtt tggaattgag ggctagaagg 2521 agaacatgat ttcctgcagg agggacaaag gctgagtgtt cacgtgccag caggctccag 2581 aacacaccag ggttaaagtt taactttctg tatgaattca ttgttgggcc caaatccgca 2641 taggagcacg gtgatcccgc gctcgggttt ctgtagcctt ttcacaagtc aggtgggtta 2701 tccagccacg ggtgtcccag ggaagaccct ggtgtttctt gtgctgttgc cccttgcagt 2761 gtttaatgtg cagtatgcca gacttatttt ttattgaatt tgtttttgtt cagtatgagg 2821 ttcaaaagca tacttgttta aaaggttctt catgtatatg tatgtatttt attgtaagac 2881 aaagcaattt taagaagaat aaaggcaaag tttgcagttc taggaattga aaatataaaa 2941 ccttttcttg tatgacttca caaaatgtac cagaacattg tattcagaaa gttactgtcg 3001 gtccccagtg tgaaaaccat gtttgttagt aactgaccaa gcattggaga gagctctcct 3061 aggcaataac acatttaatt tttaaaacga atgttggact tgacatagct tagaatttta 3121 accaaaaata acgcttgact gttgagggtc cccactttta cagtggctcc gtgtgcaaag 3181 gccttgactg acagacacct cctagcaaac tgctctttgg gtctcatgta aaatgtctca 3241 cattgtgtcc ttcaagaatt gtatacttta tcagaagtat tttatcacca agcccattga 3301 gcttaactag aaaatactgt ctatacagta attacagtaa ttagct

8 LOCUS AK bp mrna linear HTC 05-DEC-2002 DEFINITION Mus musculus adult male testis cdna, RIKEN full-length enriched library, clone: l04 product:ral-a EXCHANGE FACTOR RALGPS2 homolog [Mus musculus], full insert sequence. ACCESSION AK VERSION AK GI: KEYWORDS HTC; CAP trapper. SOURCE Mus musculus (house mouse) ORGANISM Mus musculus Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Rodentia; Sciurognathi; Muridae; Murinae; Mus. [..] FEATURES Location/Qualifiers source /organism="mus musculus" /strain="c57bl/6j" /db_xref="fantom_db: l04" /db_xref="taxon:10090" /clone=" l04" /sex="male" /tissue_type="testis" /clone_lib="riken full-length enriched mouse cdna library" /dev_stage="adult" misc_feature /note="ral-a EXCHANGE FACTOR RALGPS2 homolog [Mus musculus] (SPTR Q9ERD6, evidence: FASTY, 90.1%ID, 100%length, match=1797)" BASE COUNT 1249 a 925 c 1045 g 1179 t ORIGIN 1 tcccccgagc gccggcggca ggcgctgaat gagagacgcc gactgctcgg ttgggcgagc 61 gattgcctcg gagccgcggg cgaagcggag gcgacggccg cggctgcaca ggaatgatgc 121 atttgtggcc ttggacatga agtaatcaga cctctgttgc tgttactgta ggctcagggg 181 ctgatgagga aagcatggac ctaatgaacg ggcaggcaag cagtgttact atcgcagcca 241 ctgtttccga gaagagtagc agctctgagt cactaagcga gaagggctct gaattgaaga 301 aaagctttga tgctgtggtg tttgatgttc ttaaggttac gccagaagaa tacgcgggtc 361 agataacact aatggatgtt ccagtgttta aagctattca gccagatgta tccctacatc 421 atcaccctta gaacagtcct tttaagagtg ttggaaccta caagacgtaa gagaagctgt 481 gactcctgtg aattgagtca ttctctcata gggaactttc aagttgtgga tggaataaaa 541 aagaaaaata tagttctgca ccaaatgcag ttgctttcac aagaagattt aatcacgtaa 601 gcttttgggt tgtaagagag attctccatg ctcaaacact gaaaataaga gcagaagttt 661 tgagccacta tattaagact gctaagaaac tatatgaact taacaacctt cacgcactta 721 tggctgtggt ttctggctta cagagtgcgc cgattttccg gttgactaag acgtgggcgt 781 tattaagtcg aaaagacaaa actacctttg aaaaactaga atatgtaatg agtaaagaag 841 ataactacaa aagactcaga gactatataa gcagcttaaa gatgactcct tgcattccct 901 atttaggcat ctatttgtct gacttgacct acattgactc cgcgtaccca tccaccggca 961 gcattctaga aaatgagcaa agatcaaatc tgatgaacaa cattcttcga ataatttctg 1021 atttgcagca gtcctgtgaa tatgatattc ccatattgcc tcatgtccaa aaatacctga 1081 actctgttca gtatatagaa gaactacaaa agtttgtgga agacgataat tacaagctct 1141 ccttaaagat agaaccagga gcaagtactc cacgctcggc tgcctccagg gaggacctag 1201 caggtcctga cataggcgcc tcaccccagg gagggaggaa gagtagtgct gctgctgctg 1261 ccgccgcggc tgccgaggga gccttactgc cacagacgcc accttcccct cggaacctca 1321 ttccacacgg acacaggaag tgccacagcc tgggttacaa tttcattcat aagatgaaca 1381 cagcagagtt taagagcgca acgttcccaa acgcagggcc acggcacctg ctggatgata 1441 gtgtcatgga gccgcacgca ccgtcgcgag gccaggctga gagctctaca ctttccagtg 1501 gaatatccat agggagcagt gatggttctg aactaagcga agagacctca tggccggctt 1561 ttgaaagctc tgcggagtcg gaagatttgg cggtgcatct gtaccccgga gctgttacta 1621 ttcaaggtgt gctccggagg aaaaccttgc taaaagaagg caagaaaccc acagtagcat 1681 cttggacaaa gtattgggca gccttgtgtg gaacacagct tttttactat gccgccaaat 1741 ctctgaaggc tacagaaaga aagcatttca aatcaacgtc aaataagaat gtgtctgtgg

9 1801 tgggctggat ggtgatgatg gctgacgacc cagagcatcc agacctcttt ctgctgactg 1861 actccgagaa aggaaattca tacaagtttc aagctggcag caggatgaat gcaatgctgt 1921 ggtttaaaca cttgagcgcg gcctgccaga gtaacaagca acaggttcct acaaacttga 1981 tgacttttga gtaaacgcct gagacagaag aggagtgcta ttgttcccgt gtggaaccgg 2041 gacctgccga gagccccagc cgcaccatcc cgtgccagga agagccccca ggctccagcc 2101 cagcctccgg agctcagaac caaaagcact aatttcaggg aatgaagtga gatgttccca 2161 gagaaaaacg atggagttgc aaagcaaact gccatgaact tcgcttcttc tctccgaact 2221 gacctgtgga agccactgcc ttaacagagt gcgaggagag ccgacaccaa atagtgtgtg 2281 tgcgtcttct ggcggtgctg tgcttggaat aaattgtagc taatttgcat ttcttttaac 2341 tttgtactaa ttttggaggg gaaaccatct tttttagata cactttaaaa tggaaaaaca 2401 tttcttatgg attccatcag gagctgtttt aggtgcagtg agaaataccc tgcaggttct 2461 gctcagcctc tgccagtggc tgcctcacgt tcccacagca agacctggga gggacctgct 2521 gtggaagctg tgggtgcagg ctgggataga tagggagggc atgcctcgct ttggatgagg 2581 gatccattta aacactaccg tttggaattg agggctagaa ggagaacatg atttcctgca 2641 ggagggacaa aggctgagtg ttcacgtgcc agcaggctcc agaacacacc agggttaaag 2701 tttaactttc tgtatgaatt cattgttggg cccaaatccg cataggagca cggtgatccc 2761 gcgctcgggt ttctgtagcc ttttcacaag tcaggtgggt tatccagcca cgggtgtccc 2821 agggaagacc ctggtgtttc ttgtgctgtt gccccttgca gtgtttaatg tgcagtatgc 2881 cagacttatt ttttattgaa tttgtttttg ttcagtatga ggttcaaaag catacttgtt 2941 taaaaggttc ttcatgtata tgtatgtatt ttattgtaag acaaagcaat tttaagaaga 3001 ataaaggcaa agtttgcagt tctaggaatt gaaaatataa aaccttttct tgtatgactt 3061 cacaaaatgt accagaacat tgtattcaga aagttactgt cggtccccag tgtgaaaacc 3121 atgtttgtta gtaactgacc aagcattgga gagagctctc ctaggcaata acacatttaa 3181 tttttaaaac gaatgttgga cttgacatag cttagaattt taaccaaaaa taacgcttga 3241 ctgttgaggg tccccacttt tacagtggct ccgtgtgcaa aggccttgac tgacagacac 3301 ctcctagcaa actgctcttt gggtctcatg taaaatgtct cacattgtgt ccttcaagaa 3361 ttgtatactt tatcagaagt attttatcac caagcccatt gagcttaact agaaaatact 3421 gtctatacag taattacagt aattagctaa aaaaaagaaa ttagtccaag agaaaatgaa 3481 gagccttttc tgagtgtttc taatttgaat aattcaaaga cgtcatgtga cagaaatacc 3541 ttatttgaga cttcctagac aagcagggaa aggcacatat tgccgtgaga gaatgatttt 3601 tcagataacg gtctaagcta acccgtgttg tgttgagtat acgcagacag atccgcagtg 3661 gccagcgggg ctacagcgca ggctttcccc gtgtgtctta cttttgtctt gcctcttttt 3721 tttttttttt tttaaagcaa ttccttagtt tgttttgctc cagaataatg ttttaaatag 3781 tatgcatact gtttttgaga tactgtgaat gagagccccg tggctgttgt agtactactc 3841 tgtcatgaat atgctaaagc cgttacaatg taggtgaatc aggtctgggg agatgggcag 3901 ctcgcacagg ccagcctcac agttttgcca aagagaaagg gctgagatgg gcgttgtatt 3961 tggtacaccc agctctggac acttacgggt gtgtagagga agaaccggat tcagatttga 4021 tcagccaggc cctattagca ccatggctcc tggctgaaag taaaactatt tttctacctt 4081 gagattgctc taaagatcag tcattgcttt ttaggatgat tttagaaacc gtgagagatg 4141 cattagagta ggtgagttgt tttttatctg taattcacca aatggtatca gattataatt 4201 gaagcaaaga aaacattgcc aaactatatt aaatatttga gtattttact tactggagaa 4261 tgaatcctgt tatgcttacc ctcaggtgta aattagttct caccagctca tttcccacag 4321 acagtaaagc tcatttgttt ctctcatagc caaggagaac tctttcagaa actcgattaa 4381 aatttaaact ttacaagc Per la ricerca delle ORF si è tenuto in considerazione solo il frame di lettura (+) dal momento che ciò che stiamo analizzando è un mrna: sequenza AK Frame Da A Length

10 Sequenza AK Frame Da A Length Le sequenze tradotte delle ORF di maggiori dimensioni ritrovate sopra sono rispettivamente: >AK ORF: Frame +3 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAEVLSHYIKTAK KLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSKEDNYKRLRDYISSLKMTPCI PYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRIISDLQQSCEYDIPILPHVQKYLNSVQYIEEL QKFVEDDNYKLSLKIEPGASTPRSAASREDLAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRN LIPHGHRKCHSLGYNFIHKMNTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDG SELSEETSWPAFERNRLYHSLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEHPDLFLLTDSE KGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE >AK ORF: Frame +3 MAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSKEDNYKRLRDYISSLKMTPCIPYLGIYLSDLT YIDSAYPSTGSILENEQRSNLMNNILRIISDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKL SLKIEPGASTPRSAASREDLAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHS LGYNFIHKMNTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWPA FESSAESEDLAVHLYPGAVTIQGVLRRKTLLKEGKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHF KSTSNKNVSVVGWMVMMADDPEHPDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNL MTFE Entrambe le sequenze sono state utilizzate per una ricerca di omologhi in banca dati tramite Blastp. I risultati ottenuti sono identici per le due proteine, eccezion fatta per gli scores ed i relativi E- value. Questa differenza è da imputarsi oltre che ad una diversa lunghezza delle due putative proteine anche al fatto che nella seconda di esse (AK029993) è assente un breve tratto nella sezione C-terminale. Per AK Sequences producing significant alignments: (bits) Value tr!q8bz37 RAL-A exchange factor RALGPS2 homolog [Mus musculus (M tr!q8bzu2 RAL-A exchange factor RALGPS2 homolog [Mus musculus (M tr!q9erd6 Ral-A exchange factor RalGPS2 [ G01RIK] [Mus mus tn!aah47391 Similar to RIKEN cdna G01 gene [Homo sapiens tr!q9d2y M22Rik protein [ G01RIK] [Mus musculus (M tr!q8c134 RAL-A exchange factor RALGPS2 homolog [Mus musculus (M tr!q8bvr9 Similar to RAL guanine nucleotide exchange factor RALG tr!o15059 Hypothetical protein KIAA0351 [KIAA0351] [Homo sapiens e-175 tr!q9h4v2 DJ595C2.1.2 (KIAA0351) (Fragment) [DJ595C2.1] [Homo sa e-133 tr!q9nw78 Hypothetical protein [Homo sapiens (Human)] 442 e-123

11 tr!q9nz16 Ral guanine nucleotide exchange factor RalGPS1A [Homo e-116 tr!q8n7g9 Hypothetical protein FLJ25604 [Homo sapiens (Human)] 416 e tn!aao51688 Similar to Dictyostelium discoideum (Slime mold). Nu e-21 sp!p04821!cc25_yeast Cell division control protein 25 [CDC25] [S e-21 Per AK029993: Sequences producing significant alignments: (bits) Value tr!q8bz37 RAL-A exchange factor RALGPS2 homolog [Mus musculus (M tr!q8bzu2 RAL-A exchange factor RALGPS2 homolog [Mus musculus (M tr!q9erd6 Ral-A exchange factor RalGPS2 [ G01RIK] [Mus mus tn!aah47391 Similar to RIKEN cdna G01 gene [Homo sapiens tr!q9d2y M22Rik protein [ G01RIK] [Mus musculus (M tr!q9h4v2 DJ595C2.1.2 (KIAA0351) (Fragment) [DJ595C2.1] [Homo sa tr!q8c134 RAL-A exchange factor RALGPS2 homolog [Mus musculus (M e-177 tr!o15059 Hypothetical protein KIAA0351 [KIAA0351] [Homo sapiens e-136 tr!q8bvr9 Similar to RAL guanine nucleotide exchange factor RALG e tr!q8t6g6 Ras GTP exchange factor K [GEFK] [Dictyostelium discoi e-15 sp!p04821!cc25_yeast Cell division control protein 25 [CDC25] [S e-14 Dal momento che le due proteine prese in esame identificano medesimi risultati nella ricerca in banca dati, ho ritenuto interessante visualizzare l allineamento tra le due mediante dotplot, al fine di evidenziarne le similitudini. Di seguito è riportato unicamente il Dot-Plot relativo utilizzando una matrice di identità per il confronto. In ascisse è riportata la sequenza relativa a AK019543, in ordinate quella relativa a AK E evidente come nella seconda manchi una parte di sequenza nella regione N-terminale (80 aa) e parte nella regione C-terminale (27 aa). Può essere interessante AK AK notare che la sequenza AK consta di 424 aminoacidi e se a questi si sommano i 107 mancanti si ottiene un totale di 531 aminoacidi, esattamente il numero contenuto nella sequenza AK E ragionevole supporre che mentre la sezione di 27 aa mancante verso il C-terminale sia il risultato di una delezione, gli 80 aa mancanti all Nterminale siano il risultato di una mutazione che ha modificato l ampiezza della ORF originaria eventualmente con l introduzione di un codone di stop prematuro; per verificare queste ipotesi si è proceduto per prima cosa ad effettuare un allineamento pairwise tra le due sequenze nucleotidiche in questione e si è visto che la sequenza nucleotidica AK presenta una inserzione di 105 bp che copre l intervallo , a monte dell inizio della traduzione.

12 Score = 171 bits (89), Expect = 5e-39 Identities = 89/89 (100%) AK019543: 245 gtttgatgttcttaaggttacgccagaagaatacgcgggtcagataacactaatggatgt 304 AK029993: 320 gtttgatgttcttaaggttacgccagaagaatacgcgggtcagataacactaatggatgt 379 AK019543: 305 tccagtgtttaaagctattcagccagatg 333 AK029993: 380 tccagtgtttaaagctattcagccagatg 408 Score = 1982 bits (1031), Expect = 0.0 Identities = 1043/1055 (98%) AK019543: 333 gaactttcaagttgtggatggaatnnnnnnnnnnnntatagttctgcaccaaatgcagtt 392 AK029993: 513 gaactttcaagttgtggatggaataaaaaagaaaaatatagttctgcaccaaatgcagtt 572 AK019543: 393 gctttcacaagaagatttaatcacgtaagcttttgggttgtaagagagattctccatgct 452 AK029993: 573 gctttcacaagaagatttaatcacgtaagcttttgggttgtaagagagattctccatgct 632 AK019543: 453 caaacactgaaaataagagcagaagttttgagccactatattaagactgctaagaaacta 512 AK029993: 633 caaacactgaaaataagagcagaagttttgagccactatattaagactgctaagaaacta 692 AK019543: 513 tatgaacttaacaaccttcacgcacttatggctgtggtttctggcttacagagtgcgccg 572 AK029993: 693 tatgaacttaacaaccttcacgcacttatggctgtggtttctggcttacagagtgcgccg 752 La sequenza inserita in questa posizione provoca la terminazione prematura della traduzione. Di seguito è riportata la traduzione della regione a monte dell ORF trovata in AK029993, in blu è evidenziata la sequenza inserita AK gaagaatacgcgggtcag 362 E E Y A G Q ataacactaatggatgttccagtgtttaaagctattcagccagatgtatccctacatcat 422 I T L M D V P V F K A I Q P D V S L H H cacccttagaacagtccttttaagagtgttggaacctacaagacgtaagagaagctgtga 482 H P - N S P F K S V G T Y K T - E K L - ctcctgtgaattgagtcattctctcatagggaactttcaagttgtggatggaataaaaaa 542 L L - I E S F S H R E L S S C G W N K K gaaaaatatagttctgcaccaaatgcagttgctttcacaagaagatttaatcacgtaagc 602 E K Y S S A P N A V A F T R R F N H V S ttttgggttgtaagagagattctccatgctcaaacactgaaaataagagcagaagttttg 662 F W V V R E I L H A Q T L K I R A E V L agccactatattaagactgctaagaaactatatgaacttaacaaccttcacgcacttatg 722 S H Y I K T A K K L Y E L N N L H A L M gctgtggtttctggcttacagagtgcgccgattttccgg A V V S G L Q S A P I F R

13 AK gaagaatacgcgggtcagataacactaatggat 302 E E Y A G Q I T L M D gttccagtgtttaaagctattcagccagatgaactttcaagttgtggatggaataaaaaa 362 V P V F K A I Q P D E L S S C G W N K K gaaaaatatagttctgcaccaaatgcagttgctttcacaagaagatttaatcacgtaagc 422 E K Y S S A P N A V A F T R R F N H V S ttttgggttgtaagagagattctccatgctcaaacactgaaaataagagcagaagttttg 482 F W V V R E I L H A Q T L K I R A E V L agccactatattaagactgctaagaaactatatgaacttaacaaccttcacgcacttatg 542 S H Y I K T A K K L Y E L N N L H A L M gctgtggtttctggcttacagagtgcgccgattttccgg A V V S G L Q S A P I F R In prossimità delle frecce nere sono i codoni di inizio, in prossimità della freccia verde è il codone di inizio di AK analogo a quello di AK (le sequenze che seguono sono identiche). In prossimità della freccia rossa è il punto in cui si inserisce la sequenza aggiuntiva rispetto ad AK Tale sequenza aggiuntiva, come è possibile vedere, si inserisce senza alterare il frame di lettura (+3) dal momento che è composta da un numero di basi multiplo di 3. I numerosi codoni di stop presenti nella sequenza inserita spiegano come mai le ORF siano così differenti. A questo punto per caratterizzare la sequenza di partenza si considererà unicamente l mrna AK che, teoricamente, codifica per una proteina integra. Riprendendo quindi gli allineamenti significativi ottenuti con Blastp, sono stati considerati solamente i primi tre dal momento che ottengono i migliori risultati. Di seguito i relativi allineamenti: >tr!q8bz37 RAL-A exchange factor RALGPS2 homolog [Mus musculus (Mouse)] Length = 555 Score = 1069 bits (2764), Expect = 0.0 Identities = 531/531 (100%), Positives = 531/531 (100%) Query: 1 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE 60 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE Sbjct: 25 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE 84 Query: 61 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK 120 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK Sbjct: 85 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK 144 Query: 121 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII 180 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII Sbjct: 145 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII 204 Query: 181 SDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED 240 SDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED Sbjct: 205 SDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED 264 Query: 241 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM 300 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM Sbjct: 265 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM 324 Query: 301 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP 360 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP Sbjct: 325 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP 384

14 Query: 361 AFERNRLYHSLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE 420 AFERNRLYHSLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE Sbjct: 385 AFERNRLYHSLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE 444 Query: 421 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH 480 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH Sbjct: 445 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH 504 Query: 481 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE 531 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE Sbjct: 505 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE 555 >tr!q8bzu2 RAL-A exchange factor RALGPS2 homolog [Mus musculus (Mouse)] Length = 590 Score = 1068 bits (2761), Expect = 0.0 Identities = 530/531 (99%), Positives = 531/531 (100%) Query: 1 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE 60 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE Sbjct: 60 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE 119 Query: 61 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK 120 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK Sbjct: 120 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK 179 Query: 121 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII 180 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII Sbjct: 180 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII 239 Query: 181 SDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED 240 SDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED Sbjct: 240 SDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED 299 Query: 241 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM 300 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM Sbjct: 300 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM 359 Query: 301 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP 360 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP Sbjct: 360 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP 419 Query: 361 AFERNRLYHSLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE 420 AFERNRLYH+LGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE Sbjct: 420 AFERNRLYHTLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE 479 Query: 421 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH 480 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH Sbjct: 480 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH 539 Query: 481 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE 531 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE Sbjct: 540 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE 590 >tr!q9erd6 Ral-A exchange factor RalGPS2 [ G01RIK] [Mus musculus (Mouse)] Length = 590 Score = 1068 bits (2761), Expect = 0.0 Identities = 530/531 (99%), Positives = 531/531 (100%)

15 Query: 1 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE 60 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE Sbjct: 60 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE 119 Query: 61 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK 120 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK Sbjct: 120 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK 179 Query: 121 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII 180 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII Sbjct: 180 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPSTGSILENEQRSNLMNNILRII 239 Query: 181 SDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED 240 SDLQQSCEYDIP+LPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED Sbjct: 240 SDLQQSCEYDIPMLPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGASTPRSAASRED 299 Query: 241 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM 300 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM Sbjct: 300 LAGPDIGASPQGGRKSSAAAAAAAAAEGALLPQTPPSPRNLIPHGHRKCHSLGYNFIHKM 359 Query: 301 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP 360 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP Sbjct: 360 NTAEFKSATFPNAGPRHLLDDSVMEPHAPSRGQAESSTLSSGISIGSSDGSELSEETSWP 419 Query: 361 AFERNRLYHSLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE 420 AFERNRLYHSLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE Sbjct: 420 AFERNRLYHSLGPVTRVPRNGYRSHTKASSSAESEDLAVHLYPGAVTIQGVLRRKTLLKE 479 Query: 421 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH 480 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH Sbjct: 480 GKKPTVASWTKYWAALCGTQLFYYAAKSLKATERKHFKSTSNKNVSVVGWMVMMADDPEH 539 Query: 481 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE 531 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE Sbjct: 540 PDLFLLTDSEKGNSYKFQAGSRMNAMLWFKHLSAACQSNKQQVPTNLMTFE 590 Le tre proteine suggerite sono praticamente identiche tra di loro, le uniche differenze sono evidenziate in rosso. La prima proteina (Q8BZ37) è lunga solo 555 aminoacidi dal momento che le manca una sequenza di 35 aminoacidi all estremità N-terminale (rispetto alle altre due sequenze mancano gli aminoacidi nell intervallo 20-55). In tabella sono riportate le differenze aminoacidiche nella sequenza. Proteina Posizione 252 (217) Posizione 429 (394) Q8BZ37 Ile Ser Q8BZU2 Ile Thr Q9ERD6 Met Ser La nostra proteina putativa si allinea perfettamente con Q8BZ37 ma rispetto a questa la sequenza è più corta e mancano 25 aminoacidi nella all estremità N-terminale. I rispettivi mrna con relativa traduzione sono riportati di seguito:

16 AK ggacctaatgaacgggcaggcaagcagtgttactatcgcagccactgtttccgagaagag 182 G P N E R A G K Q C Y Y R S H C F R E E tagcagctctggcaccctaagcgagaagggctaccgcacagatgcgtaagttgatgctac Q L W H P K R E G L P H R C V S - C Y cggtttgatgttcttaaggttacgccagaagaatacgcgggtcagataacactaatggat 302 R F D V L K V T P E E Y A G Q I T L M D gttccagtg V P V AK (Q8BZ37) atggacctaatgaacggg 216 M D L M N G caggcaagcagtgttactatcgcagccactgtttccgagggtcagataacactaatggat 276 Q A S S V T I A A T V S E G Q I T L M D gttccagtg V P V Ancora una volta l inserzione di una sequenza interferisce con il meccanismo di traduzione. La presenza di tanti mrna simili che possiedono lunghe inserzioni e delezioni l uno rispetto agli altri suggerisce di verificare se gli mrna fin ora incontrati siano il risultato di splicing alternativo di un unico gene, splicing che evidentemente avviene diversamente nei vari tessuti. In effetti la ricerca del Locus G01 (indicato come cross-reference dopo il primo blastn) nel genoma di topo identifica una regione nel cromosoma I lunga bp. Tale regione risulta comprendere 27 esoni. Analizzando la sequenza nucleotidica per ciascun esone e confrontandola con i 4 mrna trovati all inizio delle analisi, si può dedurre il seguente schema: AK AK AK AK AF In questo schema valgono le seguenti corrispondenze: ID mrna ID proteina Tessuto di origine AK Testicolo AK Testicolo AK Q8BZ37 Vagina AK Q8BZU2 Colon AF Q9ERD6 Testicolo La sequenza AF non risulta dal primo Blastn effettuato ma è stata ottenuta come cross-reference della proteina Q9ERD6, ottenuta con Blastp. Per ogni mrna è riportata la sequenza di esoni di cui è composto. In particolare si nota che la sequenza AK possiede l esone 5 in più rispetto agli altri e non possiede l esone 22. In effetti tali differenze di sequenza giustificano le differenze nella sequenza aminoacidica riscontrate precedentemente (spostamento del codone di inizio più a valle e differenza di 27 aminoacidi al C-terminale). L esone 5 si inserisce senza alterare il frame di lettura e inserisce codoni di stop. L assenza dell esone 3 nella sequenza AK giustifica la differenza di 35 aminoacidi tra la relativa proteina Q8BZ37 e la proteina Q8BZU2 (relativa alla sequenza AK033549).

17 In più viene annotato che l esone 3 della sequenza AK è differente dagli altri nella propria regione al 5 : i primi 75 nucleotidi dell esone in questione non si allineano perfettamente alla sequenza regolare dell esone 3. Esone 3 AK AAGAGTAGCAGCTCTGGCACCCTAAGCGAGAAGGGCTACCGCACAGATGCGTAA Esone 3 regolare AAGAGTAGCAGCTCTGAGTCACTAAGCGAGAAGGGCTCTGAATTGAAGAAAAGC Esone 3 AK GTTGATGCTACCG-GTTTGATG... Esone 3 regolare TTTGATGCTGTGGTGTTTGATG... Gli mrna che presentano lo stesso schema di splicing sono AK e AF312924, entrambi caratterizzati nel testicolo di topo. Le ORF individuate su questi mrna sono una di 531 aa (AK019543, frame +3) e una di 590 aa (AF312924, frame +1, id:q9erd6). La lettura in frame +1 della sequenza AK porta ad una interruzione della traduzione a causa dei codoni di stop presenti sull esone anomalo, quindi la traduzione deve partire più a valle e con un frame di lettura differente (questo perché l esone anomalo è più corto di un nucleotide). Per questo motivo la previsione della proteina relativa a tale sequenza è più corta. Nel procedere a caratterizzare la proteina derivante dalla sequenza AK si è analizzata la stessa parallelamente alla proteina Q9ERD6 tradotta dalla sequenza AF312924, proprio perché caratterizzate entrambe da un simile pattern di splicing e a partire dal medesimo tessuto. La ricerca di motivi in prosite porta agli stessi risultati per entrambe le proteine. In una estesa regione centrale è presente un PH-domain (pleckstrin homology) (ID: PS50003), dominio diffuso in proteine coinvolte nella trasduzione del segnale entro le cellule come anche in proteine facenti parte del citoscheletro. La funzione di questo dominio non è chiara. E stato suggerito che possa servire per il legame con le subunià β/γ di proteine G eterotrimeriche, oppure possa legare lipidi, residui Ser/Thr fosforilati o infine possa servire per ancorare la proteina alla membrana. La ricerca di motivi di Q9ERD6 all interno della banca dati SMART ha dato i seguenti risultati: name begin end E-value low complexity RasGEF e-92 low complexity PH e-09 Il dominio RasGEF indica che siamo in presenza di un fattore di scambio di guaninnucleotide per le GTP-asi Ras-like. Le proteine Ras sono interruttori cellulari che legano GTP (stato attivo) e lo idrolizzano a GDP (stato inattivo). Lo stato di attività delle proteine Ras dipende dall attività di proteine che favoriscono l attività GTPasica e di proteine che permettono il rilascio di GDP e l uptake di GTP. Queste ultime sono i fattori di scambio di guanin-nucleotide. Proteine che agiscono in questo modo sono classificate, sulla base della

18 similarità di sequenza, come CDC24 o CDC25. Il dominio RasGEF è necessario per l attività di queste proteine. Il dominio PH individuato in SMART è il medesimo individuato da Prosite. SMART non è in grado di analizzare la sequenza proposta per AK dal momento che la relativa proteina non è presente in banca dati. In ogni caso la proteina per AK manca di 59 aa all estremità N-terminale rispetto a Q9ERD6 e tra essi 14 fanno parte del dominio RasGEF il che potrebbe comportare una perdita di funzionalità di tale proteina. Tale differenza di sequenza proteica è imputabile prima di tutto ad una differenza nella sequenza nucleotidica che introduce un codone di stop prematuro in AK019543: AF312914: 121 tccgagaagagtagcagctctgagtcactaagcgagaagggct 163 AK019543: 172 tccgagaagagtagcagctctggcaccctaagcgagaagggct 214 Se consideriamo invece la proteina deducibile dall altro mrna estratto da testicolo (ID AK029993) possiamo supporre, in prima istanza, che la mancanza di più di 130 aa all estremità N-terminale rispetto a Q9ERD6 comporti la perdita della funzione di scambio GDP GTP. In questo caso la differenza di sequenza è imputabile al diverso pattern di splicing evidenziato in precedenza. La proteina Q9ERD6 è un piccolo scambiatore GDP GTP (RalGPS2) identificato in topo, agisce come fattore di scambio per proteine Ral il cui meccanismo d azione è del tutto simile alle proteine Ras sopra descritte. Ripetendo la ricerca di omologhi con BLAST si trova che la nostra proteina da AK mostra una certa similarità con alcune proteine CDC25, in particolare con un fattore CDC25 di topo (ID P27671). L omologia è tra la regione N-terminale della nostra proteina e la regione di della CDC25: in questa regione, infatti, è presente il dominio RasGEF (che si estende nella regione tra 1025 e 1259). >sp!p27671!gnrp_mouse Guanine nucleotide releasing protein (GNRP) (Ras-specific nucleotide exchange factor CDC25) (CDC25Mm) [RASGRF1] [Mus musculus (Mouse)] Length = 1262 Score = 132 bits (333), Expect = 1e-30 Identities = 78/232 (33%), Positives = 129/232 (55%), Gaps = 8/232 (3%) Query: 1 MDVPVFKAIQPDELSSCGWNKKEKYSSAPNAVAFTRRFNHVSFWVVREILHAQTLKIRAE 60 +D VFK+I +E GW K EKY P + T+ FNHVS ++ EI+ + + RA Sbjct: 1038 LDHLVFKSIPYEEFFGQGWMKAEKYERTPYIMKTTKHFNHVSNFIASEIIRNEDISARAS 1097 Query: 61 VLSHYIKTAKKLYELNNLHALMAVVSGLQSAPIFRLTKTWALLSRKDKTTFEKLEYVMSK A L+N +A++ + S + + IFRL KTW +S++ K+ +KL+ ++S Sbjct: 1098 AIEKWVAVADICRCLHNYNAVLEITSSINRSAIFRLKKTWLKVSKQTKSLLDKLQKLVSS 1157 Query: 121 EDNYKRLRDYISSLKMTPCIPYLGIYLSDLTYIDSAYPS-TGSILENEQRSNLMNNILRI K LR+ + + PC+PYLG+YL+DL +I+ P+ T L N I+R Sbjct: 1158 DGRFKNLRESLRNCD-PPCVPYLGMYLTDLVFIEEGTPNYTEDGLVNFSKMRMISHIIRE 1216 Query: 180 ISDLQQSCEYDIPILPHVQKYLNSVQYIEELQKFVEDDNYKLSLKIEPGAST 231 I QQ+ Y I P V +YL ++E E+ Y+ SL IEP T Sbjct: 1217 IRQFQQT-TYKIDPQPKVIQYL-----LDESFMLDEESLYESSLLIEPKLPT 1262 La P27671 presenta un motivo di Prosite tipico delle CDC25, tale motivo è assai simile ad una sottosequenza della proteina in analisi:

19 Prosite ID PS00720: [GAP]-[CT]-V-P-[FY]-x(4)-[LIVMFY]-x-[DN]-[LIVM] P27671 AK PCVPYLGMYLTDL 138 PCiPYLGIYLSDL Come si può vedere la nostra proteina mostra un motivo (all interno del dominio RasGEF) che si distingue dal motivo delle CDC25 per una sostituzione V I. L allineamento di P27671 con la proteina Q9ERD6 risulta assolutamente simile, e Q9ERD6 presenta un motivo per le CDC25 uguale a quello di AK Per fare ipotesi sulla funzionalità delle proteine derivate da AK e AK è stata fatta una ricerca in banca dati per proteine omologhe di cui è nota la struttura e/o le regioni funzionalmente importanti. L unica struttura nota del dominio RasGEF si può trovare nel complesso H-RAS/SOS-1 umano (ID: 1BKD). La proteina SOS-1 contiene un dominio RasGEF. Questa struttura è stata determinata dopo l espressione in E. coli e non è possibile risalire da essa alla regione catalitica della proteina. Nel tentativo di valutare se le delezioni nel dominio RasGEF sono importanti per la funzione della proteina si è tentato allora di effettuare un allineamento multiplo nella speranza che gli aminoacidi mancanti non fossero altamente conservati nel dominio. Questa via non è facilmente applicabile: i fattori GEF caratterizati in swiss-prot presentano il dominio RasGEF nella regione C-terminale (mentre si trova al N-terminale nella nostra proteina) e questo interferisce parecchio con il tentativo di Clustal-W di effettuare un allineamento multiplo. Per evitare di creare enormi gap alllineando correttamente i domini RasGEF, Clustal-W preferisce mettere la nostra query in registro con le altre non allineando correttamente i domini (come schematizzato di seguito). A B Per evitare di creare gaps alle estremità (A) Clustal-W opta per mettere la sequenza query (in blu) in registro con le rimanenti (B), rinunciando all allineamento del dominio RasGEF (in rosso) Di contro l allineamento con sequenze di piccoli fattori GEF, che presentano il dominio RasGEF nella regione N-terminale, non consente di discriminare le regioni importanti dal momento che le sequenze di tali fattori depositate in banca dati sono talmente simili tra di loro da risultare in un multiallineamento quasi perfetto. Tali sequenze, infatti, appartengono essenzialmente al topo, al ratto o all uomo. In più le sequenze di tali fattori sono depositate nella banca dati TrEMBL, e quindi probabilmente diverse dalle sequenze delle proteine mature all interno delle cellule. Per questi motivi si è scelto di recuperare il multiallineamento del dominio RasGEF dalla banca dati Pfam e confrontare la proteina putativa con esso. Dall allineamento multiplo è possibile vedere che la regione N-terminale del dominio RasGEF è piuttosto variabile tra le proteine riportate: vi sono inserzioni/delezioni di aminoacidi e solo pochi di essi sono conservati in tutti i domini. Inoltre sono evidenziate alcune proteine il cui dominio RasGEF è più corto nella regione N-terminale (es. Q9BWF0, Q9QYS6, O616059). Vista la variabilità della regione N-terminale del dominio RasGEF si può supporre che la proteina derivante dalla sequenza AK possa essere funzionale pur mancando di 14 aminoacidi. Diverso è il caso della proteina derivante da AK a cui manca una grossa regione del dominio RasGEF. In effetti nel multiallineamento presentato in Pfam ci sono proteine che presentano così grandi delezioni. Purtroppo tutte queste sequenze non sono associate a proteine di cui sia effetivamente nota la funzionalità e nulla si può dire quindi sulla funzionalità della nostra proteina. Emblematico, a questo proposito, il caso di Q8N858

20 (proteina umana) a cui mancano i medesimi aminoacidi di AK all estremità N- terminale. Un allineamento pairwise tra queste due sequenze trova similarità solo nel dominio RasGEF e null altro. Di seguito è riportato il multiallineamento dei 161 domini RasGEF depositati in Pfam relativamente alla regione N-terminale del dominio stesso, in rosso è evidenziata la proteina relativa a AK019543, inserita ed allineata manualmente. Q9Z1C8 DLVS...AK...D.LAGQLTEHDWNLFNRIHQVELIH YVLGPQ Q8R1R1 DLVS...AK...D.LAGQLTDHDWNLFNRIHQVELIH YVLGPQ Q8VCC8 DLVS...AK...D.LAGQLTDHDWNLFNRIHQVQ EH O95634 DLVS...AK...D.LAGQLTDHDWSLFNSIHQVELIH YVLGPQ O95398 DLVS...AK...D.LAGQLTDHDWSLFNSIHQVELIH YVLGPQ Q8WVN0 DLVS...AK...D.LAGQLTDHDWSLFNSIHQVELIH YVLGPQ Q9Z1C7 ELMS...SK...D.LAYQMTTYDWELFNCVLELELIY HTFGRH Q8VIP9 ELMS...SK...D.LAYQMTTYDWELFNCVHELELIY HTFGRH Q9CW52 ELMS...SK...D.LAYQMTTYDWELFNCVHELELIY HTFGRH Q9EQZ6 ELMS...SK...D.LAYQMTTYDWELFNCVHELELIY HTFGRH Q9Z1P0 ELMS...SK...D.LAYQMTTYDWELFNCVHELELIY HTFGRH O95636 ELMS...SK...D.LAYQMTIYDWELFNCVHELELIY HTFGRH Q8TAA4 ELMS...SK...D.LAYQMTIYDWELFNCVHELELIY HTFGRH Q8WZA2 ELMS...SK...D.LAYQMTIYDWELFNCVHELELIY HTFGRH Q9V9A3 EILS...TK...E.LAYHITLFEWDLFWAVHEYELLY HTFGRH Q92565 LGMN...TW...D.LALELMNFDWSLFNSIHEQELIY FTFSRQ Q9UHV5 HRVE...PE...D.VANHLTAFHWELFRCVHELEFVD YVFHGE YNX5_CAEEL HLID...SQ...E.LAHQLFLFHLQLLRSTDSNELLY QVIGRE Q9Y4G8 LQLS...TV...E.VATQLSMRNFELFRNIEPTEYID DLFKLR Q8NI21 LQLS...TI...E.VATQLSMRDFDLFRNIEPTE--Y IDDL Q8TEU6 LQLS...TI...E.VATQLSMRDFDLFRNIEPTE--Y IDDL Q8TEU7 LQLS...TI...E.VATQLSMRDFDLFRNIEPTE--Y IDDL Q96PC1 LQLS...TI...E.VATQLSMRDFDLFRNIEPTE--Y IDDL Q9UHV4 LQLS...TI...E.VATQLSMRDFDLFRNIEPTE--Y IDDL Q8TEA3 LQLS...TI...E.VATQLSMRDFDLFRNIEPTE--Y IDDL Q8R3E5 LQLS...TI...E.VATQLSMRDFDLFRNIEPTE--Y IDDL Q9VMF3 LHLN...AY...E.LAIQLTLQDFANFRQIESTEYVD ELFELR Q95V18 LHLN...AY...E.LAIQLTLQDFGTFRQIESTEYVD ELFEL- Q21218 LSLN...AQ...V.VAAQLTLQDFSVFSAIEPTEFLD NL Q95NL8 LSLN...AQ...V.VAAQLTLQDFSVFSAIEPTEFLD NL Q95WR8 LSLN...AQ...V.VAAQLTLQDFSVFSAIEPTEFLD NL Q9D3B6 VCSD...PL...V.LAQQLTHIELERVNSIRPED-LM QIISHM Q8TBF1 VCCD...PL...V.LAQQLTHIELDRVSSIYPEDLMQ IVSH Q8N9B8 VCCD...PL...V.LAQQLTHIELDRVSSIYPEDLMQ IVSH Q9D300 VCSD...PY...T.LAQQLTHVELERLRHIGPEEFVQ.Afvn----KDPLAGTKP Q95KH6 VCSD...PY...T.LAQQLTHVELERLRHIGPEEFVQ.Afvn----KDPLASTKP Q8NA49 VCSD...PY...T.LAQQLTHVELERLRHIGPEEFVQ.Afvn----KDPLASTKP Q8N431 VCSD...PY...T.LAQQLTHVELERLRHIGPEEFVQ.Afvn----KDPLASTKP Q96MY8 VCND...PY...T.LAQQLTHIELERLNYIGPEEFVQ.Afvq----KDPLDNDKS Q8JZL7 VCSD...PY...T.LAQQLTHIELERLNYIGPEEFVQ.Afvq----KDPLDNDKS Q8T9J6 MCPS...CA...H.LAHQLTAIELERLSHIGPEEFVQ AFAKDYQQQ Q8SYL9 MCPS...CA...H.LAHQLTAIELERLSHIGPEEFVQ AFAKDYQQQ Q9VNR5 MCPS...CA...H.LAHQLTAIELERLSHIGPEEFVQ AFAKDYQQQ O Q8MLG3 ---S...AF...E.LAHQLYAIEYAYLSQIRLEEFVEiLekd----ELKTCISQT Q95S44 ---S...AF...E.LAHQLYAIEYAYLSQIRLEEFVEiLekd----ELKTCISQT Q9V S...AF...E.LAHQLYAIEYAYLSQIRLEEFVEiLekd----ELKTCISQT Q21758 LCND...AK...T.VAQQLTHIEMERFSMVGVDEIVQsla.s----DPLSEIGRH Q9USU1 YAYT...PE...E.FASQMTLLEFDYLKQIPSREWIF RSWVSR CC25_SACKL LDID...SL...D.YAKQLTIKEHSLFYKISPFECLD RTWGNK CC25_YEAST LDID...PY...T.YATQLTVLEHDLYLRITMFECLD RAWGTK SC25_YEAST LAVD...PV...L.FATQLTILEHEIYCEITIFDCLQ KIWKNK Q12037 LAVD...PV...L.FATQLTILEHEIYCEITIFDCLQ KIWKNK CC25_CANAL MDID...YV...E.LARQLTLREFKLYCKITKFACLA KVWGKK

Sperimenta il BioLab Attività di Bioinformatica Caccia al gene

Sperimenta il BioLab Attività di Bioinformatica Caccia al gene Sperimenta il BioLab Attività di Bioinformatica Caccia al gene Università degli Studi di Milano Settore Didattico, via Celoria 20, Milano Laboratorio 105 INTRODUZIONE Questa attività pratica ha come scopo

Dettagli

ESERCITAZIONE 3. OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST

ESERCITAZIONE 3. OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST ESERCITAZIONE 3 OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST L'esercitazione prevede l'utilizzo di risorse web per effettuare ricerche di similarità con la proteina GRB2 (growth factor

Dettagli

Bioinformatica. Marin Vargas, Sergio Paul

Bioinformatica. Marin Vargas, Sergio Paul Bioinformatica Marin Vargas, Sergio Paul 2013 Wikipedia: La bioinformatica è una disciplina scientifica dedicata alla risoluzione di problemi biologici a livello molecolare con metodi informatici. La bioinformatica

Dettagli

4. Ricerca di sequenze in banche dati e allineamento multiplo

4. Ricerca di sequenze in banche dati e allineamento multiplo 4. Ricerca di sequenze in banche dati e allineamento multiplo Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni di BLAST disponibili sono organizzate in base al

Dettagli

Sequenziamento e analisi di genomi completi

Sequenziamento e analisi di genomi completi Sequenziamento e analisi di genomi completi Genoma L'insieme del materiale genetico di un organismo o cellula. (Hans Winkler, 1920) Un genoma è sequenziato quando viene stabilita interamente la successione

Dettagli

Corso di Biologia Molecolare

Corso di Biologia Molecolare Corso di Biologia Molecolare Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Acidi nucleici Il ruolo degli acidi nucleici è quello di custodire e trasmettere

Dettagli

Informatica e biotecnologie I parte

Informatica e biotecnologie I parte Informatica e biotecnologie I parte Banche dati biologiche Bioinformatica La Bioinformatica è una disciplina che affronta con metodiche proprie delle Scienze dell'informazione problemi propri della Biologia.

Dettagli

DOMANDA FREQUENTE: QUALE E LA FUNZIONE DI UNA CERTA PROTEINA? SI AUMENTA O SI DIMINUISCE L ESPRESSIONE DELLA PROTEINA

DOMANDA FREQUENTE: QUALE E LA FUNZIONE DI UNA CERTA PROTEINA? SI AUMENTA O SI DIMINUISCE L ESPRESSIONE DELLA PROTEINA DOMANDA FREQUENTE: QUALE E LA FUNZIONE DI UNA CERTA PROTEINA? OVERESPRESSIONE DELLA PROTEINA ESPRESSIONE ECTOPICA CON UN VETTORE DI ESPRESSIONE ABOLIZIONE DELLA ESPRESSIONE DELLA PROTEINA INTERFERENZA

Dettagli

Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA

Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Bioinformatica - Scienza interdisciplinare coinvolgente la biologia, l informatica, la matematica e la statistica per l

Dettagli

Recettori di superficie

Recettori di superficie Recettori di superficie Esistono 3 classi principali di recettori di superficie 1. Recettori annessi a canali ionici 2. Recettori accoppiati alle proteine G 3. Recettori associati ad enzimi Recettori

Dettagli

Ogni tipo ha il suo alfabeto di riferimento, e metodi specifici, nonché metodi per la conversione da un tipo all altro (trascrizione, traduzione)

Ogni tipo ha il suo alfabeto di riferimento, e metodi specifici, nonché metodi per la conversione da un tipo all altro (trascrizione, traduzione) BioPython Descrizione Il progetto BioPython è un associazione di sviluppatori di codice Python liberamente disponibile per bioinformatica La homepage del progetto è http://www.biopython.org Il codice viene

Dettagli

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novapdf printer (http://www.novapdf.com) CROMATINA E CROMOSOMI UNA SCALA DI GRANDEZZE (E. coli) RNA + proteine Histon-like + DNA 4,64 Mb UNA SCALA DI GRANDEZZE (H. sapiens) TTCAGGAAATGACCCCTTTGCCCCGTCTGAAGGTAGTGCAGAGGCTGCACCTGAGCTGGACCTCTTTGCAATGAAGCCACCT

Dettagli

Dott.ssa Renata Tisi. Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it

Dott.ssa Renata Tisi. Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Il ruolo degli acidi nucleici è quello di custodire e trasmettere l informazione genetica nelle cellule,

Dettagli

Bioinformatica (3) Banche dati biologiche. Dott. Alessandro Laganà

Bioinformatica (3) Banche dati biologiche. Dott. Alessandro Laganà Bioinformatica (3) Banche dati biologiche Dott. Alessandro Laganà Banche dati biologiche Organismi e sequenze biologiche Rappresentazione digitale dei dati biologici e formati Banche dati generiche: NCBI,

Dettagli

Downloaded from www.immunologyhomepage.com. Riarrangiamento dei geni per le Immunoglobuline e sviluppo dei linfociti B

Downloaded from www.immunologyhomepage.com. Riarrangiamento dei geni per le Immunoglobuline e sviluppo dei linfociti B Downloaded from www.immunologyhomepage.com Riarrangiamento dei geni per le Immunoglobuline e sviluppo dei linfociti B I geni che codificano i recettori per gli antigeni (BCR e TCR) sono presenti in uno

Dettagli

Informatica e biotecnologie II parte

Informatica e biotecnologie II parte Informatica e biotecnologie II parte Analisi di sequenze: allineamenti CGCTTCGGACGAAATCGCATCAGCATACGATCGCATGCCGGGCGGGATAAC CGAAATCGCATCAGCATACGATCGCATGC Bioinformatica La Bioinformatica è una disciplina

Dettagli

Analisi della sequenza nucleotidica AP001519 (gene BH3701) Davide Cittaro Valerio Reguzzi Marco Stefani

Analisi della sequenza nucleotidica AP001519 (gene BH3701) Davide Cittaro Valerio Reguzzi Marco Stefani Analisi della sequenza nucleotidica AP001519 (gene BH3701) Davide Cittaro Valerio Reguzzi Marco Stefani Informazioni di base Sequenza estratta dal batterio Bacillus halodurans Codice di accesso sequenza

Dettagli

Lezione 2: Allineamento di sequenze. BLAST e CLUSTALW

Lezione 2: Allineamento di sequenze. BLAST e CLUSTALW Lezione 2: Allineamento di sequenze BLAST e CLUSTALW Allineamento di sequenze Allineamenti L avvento della genomica moderna permette di analizzare le similitudini e le differenze tra organismi a livello

Dettagli

Caccia al gene della Fibrosi Cistica

Caccia al gene della Fibrosi Cistica Caccia al gene della Fibrosi Cistica Scenario e simulazione di consulenza genetica Siete un genetista medico e lavorate in un consultorio genetico. Si presenta da voi una coppia che richiede consulenza

Dettagli

Struttura e funzione dei geni. Paolo Edomi - Genetica

Struttura e funzione dei geni. Paolo Edomi - Genetica Struttura e funzione dei geni 1 Il DNA è il materiale genetico La molecola di DNA conserva l informazione genetica: topi iniettati con solo DNA di batteri virulenti muoiono 2 Proprietà del DNA Il DNA presenta

Dettagli

scaricato da www.sunhope.it

scaricato da www.sunhope.it Recettori a tirosina chinasi I recettori a tirosina chinasi presentano vari domini Una regione di legame (extracellulare) Una regione transmembrana Una coda intracellulare con numerose tirosine scaricato

Dettagli

SINTESI DELL RNA. Replicazione. Trascrizione. Traduzione

SINTESI DELL RNA. Replicazione. Trascrizione. Traduzione SINTESI DELL RNA Replicazione Trascrizione Traduzione L RNA ha origine da informazioni contenute nel DNA La TRASCRIZIONE permette la conversione di una porzione di DNA in una molecola di RNA con una sequenza

Dettagli

Basi di dati biologiche

Basi di dati biologiche Basi di dati biologiche Seminario per il corso di Basi di Dati II Luana Rinaldi luana.rinaldi@gmail.com AGENDA: Introduzione alla bioinformatica; Concetti Biologici; Banche dati biologiche; Collaborazioni

Dettagli

I Genomi degli Eucarioti:

I Genomi degli Eucarioti: I Genomi degli Eucarioti: Eucromatina ed Eterocromatina Eucromatina: regioni cromosomiche non condensate, attivamente trascritte e ad alta densità genica. Eterocromatina: (facoltativa o costitutiva): cromatina

Dettagli

Introduzione al corso di bioinformatica e analisi dei genomi AA 2015-2016. Docente: Silvia Fuselli fss@unife.it

Introduzione al corso di bioinformatica e analisi dei genomi AA 2015-2016. Docente: Silvia Fuselli fss@unife.it Introduzione al corso di bioinformatica e analisi dei genomi AA 2015-2016 Docente: Silvia Fuselli fss@unife.it Possibili testi di riferimento Introduction to Genomics, A.M. Lesk, Oxford Capitoli 1, 3,

Dettagli

Banche Dati Secondarie. geni trascritti proteine profili strutture

Banche Dati Secondarie. geni trascritti proteine profili strutture Banche Dati Secondarie geni trascritti proteine profili strutture definizione Banca dati il cui contenuto deriva da una banca dati primaria DB sec DB primario informazione PROSITE SWISS Prot patterns Profiles

Dettagli

Una proteina nella rete: Caccia al tesoro bioinformatica

Una proteina nella rete: Caccia al tesoro bioinformatica Una proteina nella rete: Caccia al tesoro bioinformatica Nel corso di questa attivita utilizzeremo alcune delle piu importanti banche dati disponibili in rete per cercare informazioni su una proteina.

Dettagli

Corso di Biologia Molecolare

Corso di Biologia Molecolare Corso di Biologia Molecolare Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 renata.tisi@unimib.it Acidi nucleici Il ruolo degli acidi nucleici è quello di custodire e trasmettere

Dettagli

Fibrillina Sindrome di Marfan sindrome di Marfan sindrome di Marfan Sindrome di Marfan Fibrillina 1

Fibrillina Sindrome di Marfan sindrome di Marfan sindrome di Marfan Sindrome di Marfan Fibrillina 1 Genoma La determinazione e la conoscenza dell intera sequenza genomica è la condizione necessaria per comprendere la biologia di un determinato organismo Il genoma contiene le istruzioni (geni) per la

Dettagli

Fattori di crescita FATTORI DI CRESCITA. Recettori

Fattori di crescita FATTORI DI CRESCITA. Recettori FATTORI DI CRESCITA FATTORI DI CRESCITA Fattori di crescita FATTORI DI CRESCITA Recettori FATTORI DI CRESCITA Proliferazione Differenziamento FATTORI DI CRESCITA? Come fa una interazione tra due molecole

Dettagli

Universita` di Verona Laura Specialistica in Biotecnologie Agro-Industriali Corso di Bioinformatica A.A. 2005-2006

Universita` di Verona Laura Specialistica in Biotecnologie Agro-Industriali Corso di Bioinformatica A.A. 2005-2006 Universita` di Verona Laura Specialistica in Biotecnologie Agro-Industriali Corso di Bioinformatica A.A. 2005-2006 Docente: Dr. Nicola Vitulo Dipartimento di Biologia, CRIBI Viale G.Colombo3, 35131 Padova

Dettagli

Next-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi.

Next-generation sequencing, annotazione, ed espressione genica. Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi. Next-generation sequencing, annotazione, ed espressione genica Giulio Pavesi Dip. Bioscienze Università di Milano giulio.pavesi@unimi.it Il primo passo... Abbiamo la sequenza completa del DNA di un organismo:

Dettagli

Scuola Universitaria Interfacoltà per le Biotecnologie Primo anno della Laurea specialistica in Biotecnologie molecolari Anno Accademico 2004-2005

Scuola Universitaria Interfacoltà per le Biotecnologie Primo anno della Laurea specialistica in Biotecnologie molecolari Anno Accademico 2004-2005 Scuola Universitaria Interfacoltà per le Biotecnologie Primo anno della Laurea specialistica in Biotecnologie molecolari Anno Accademico 2004-2005 ALESSIA PERINO La leptina è una piccola proteina non glicosilata

Dettagli

Sequenziamento ed analisi dell esoma intero (All Exon)

Sequenziamento ed analisi dell esoma intero (All Exon) Sequenziamento ed analisi dell esoma intero (All Exon) Obiettivi La procedura ha l obiettivo di sequenziare solo le regioni trascritte e codificanti del genoma che rappresentano, almeno nell uomo, circa

Dettagli

Meccanismi molecolari di trasduzione del segnale. Le vie di trasduzione del segnale sono molto specifiche ed estremamente sensibili.

Meccanismi molecolari di trasduzione del segnale. Le vie di trasduzione del segnale sono molto specifiche ed estremamente sensibili. Meccanismi molecolari di trasduzione del segnale. Le vie di trasduzione del segnale sono molto specifiche ed estremamente sensibili. La sensibilita delle vie di trasduzione dipende da 3 fattori: -l affinita

Dettagli

http://biocloud.unica.it biocloud@unica.it Emanuele Pascariello emanuele.pascariello@gmail.com

http://biocloud.unica.it biocloud@unica.it Emanuele Pascariello emanuele.pascariello@gmail.com Giornate sugli sbocchi professionali Del corso di Laurea in Biotecnologie Industriali (BIOTIN) Oristano 23/24 Aprile 2013 URL email http://biocloud.unica.it biocloud@unica.it Emanuele Pascariello emanuele.pascariello@gmail.com

Dettagli

Dal DNA alle proteine: La trascrizione e la traduzione

Dal DNA alle proteine: La trascrizione e la traduzione Dal DNA alle proteine: La trascrizione e la traduzione DNA RNA Trascrizione RNA PROTEINE Traduzione Dove avvengono? GLI EUCARIOTI I PROCARIOTI Cambell, Reece Biologia ZANICHELLI Trascrizione Sintesi di

Dettagli

STRUTTURA E FUNZIONE DI BIOMOLECOLE

STRUTTURA E FUNZIONE DI BIOMOLECOLE 1 STRUTTURA E FUNZIONE DI BIOMOLECOLE Predizione della Struttura Tridimensionale della proteina umana ETHE-1 con Homology Modeling Sofia Cividini 2 INTRODUZIONE Lo scopo del presente lavoro è stato quello

Dettagli

Anomalie. Transcrittasi inversa Codice genetico mitocondriale RNA splicing RNA editing RNA interference RNA switch Pseudogeni Trasposoni

Anomalie. Transcrittasi inversa Codice genetico mitocondriale RNA splicing RNA editing RNA interference RNA switch Pseudogeni Trasposoni Anomalie Transcrittasi inversa Codice genetico mitocondriale RNA splicing RNA editing RNA interference RNA switch Pseudogeni Trasposoni 17 Transcrittasi inversa 18 Codice genetico mitocondriale 19 Codone

Dettagli

Molecular basis of the X-linked Dyskeratosis disease: insights from Drosophila

Molecular basis of the X-linked Dyskeratosis disease: insights from Drosophila Molecular basis of the X-linked Dyskeratosis disease: insights from Drosophila La ricerca è stata finalizzata allo studio della Discheratosi congenita X-linked (X-DC), una malattia genetica caratterizzata

Dettagli

Definizione di genoteca (o library) di DNA

Definizione di genoteca (o library) di DNA Definizione di genoteca (o library) di DNA Collezione completa di frammenti di DNA, inseriti singolarmente in un vettore di clonaggio. Possono essere di DNA genomico o di cdna. Libreria genomica: collezione

Dettagli

Una proteina nella rete: Introduzione alla bioinformatica

Una proteina nella rete: Introduzione alla bioinformatica Una proteina nella rete: Introduzione alla bioinformatica L era genomica ha assistito ad una crescita esponenziale delle informazioni biologiche rese disponibili dai progressi nel campo della biologia

Dettagli

3. Confronto tra due sequenze

3. Confronto tra due sequenze 3. Confronto tra due sequenze Esercizio 1: uso di DotLet Il programma DotLet è accessibile dal sito http://myhits.isb-sib.ch/cgi-bin/dotlet, dove può essere utilizzato attraverso un interfaccia utente

Dettagli

e dei genotipi tossici

e dei genotipi tossici Metodi molecolari l per il riconoscimento dei cianobatteri e dei genotipi tossici Susanna Vichi Dip. Ambiente e Connessa Prevenzione Primaria Istituto Superiore di Sanità, Roma Workshop Sorveglianza delle

Dettagli

Plasmidi come vettori di clonaggio

Plasmidi come vettori di clonaggio Plasmidi come vettori di clonaggio Un vettore plasmidico di buona qualità deve possedere le seguenti proprietà: 1. Piccole dimensioni (

Dettagli

Lo splicing alternativo aumenta in modo considerevole la complessità del trascrittoma (e quindi del proteoma).

Lo splicing alternativo aumenta in modo considerevole la complessità del trascrittoma (e quindi del proteoma). Geni sovrapposti Lo splicing alternativo aumenta in modo considerevole la complessità del trascrittoma (e quindi del proteoma). % Splicing Alternativo Oltre il 90% dei geni umani è in grado di esprimere

Dettagli

The Role of Nucleoporin Genes in Human Leukemias

The Role of Nucleoporin Genes in Human Leukemias The Role of Nucleoporin Genes in Human Leukemias INTRODUZIONE Il mio progetto di ricerca, finanziato dall Associazione Damiano per l Ematologia, si è inserito in un più ampio studio di caratterizzazione

Dettagli

Paola Bonizzoni. Università degli Studi di Milano-Bicocca

Paola Bonizzoni. Università degli Studi di Milano-Bicocca Paola Bonizzoni Università degli Studi di Milano-Bicocca Biologia Bioinformatica: Ricostruzione evoluzione Analisi di sequenze Folding di Proteine Simulazione di processi biologici Informatica 2 In un

Dettagli

La brevettazione in campo medico e biotecnologico. Università degli Studi di Ferrara, 29 marzo 2007

La brevettazione in campo medico e biotecnologico. Università degli Studi di Ferrara, 29 marzo 2007 La brevettazione in campo medico e biotecnologico Università degli Studi di Ferrara, 29 marzo 2007 La brevettazione delle sequenze di acido nucleico Elena Comoglio Jacobacci & Partners S.p.A. Brevetti

Dettagli

C2. Il rilascio del fattore sigma marca il passaggio alla fase di allungamento della trascrizione.

C2. Il rilascio del fattore sigma marca il passaggio alla fase di allungamento della trascrizione. Soluzioni ai problemi del Capitolo 12 Domande concettuali C1. A. I geni dei trna codificano molecole di trna e i geni degli rrna le molecole di rrna che si trovano nei ribosomi. Esistono anche dei geni

Dettagli

PATOLOGIE GENETICHE DELLA TRASDUZIONE DEL SEGNALE

PATOLOGIE GENETICHE DELLA TRASDUZIONE DEL SEGNALE PATOLOGIE GENETICHE DELLA TRASDUZIONE DEL SEGNALE Sono malattie associate a difetti in geni che codificano per proteine che trasmettono segnali extracellulari all interno della cellula RECETTORI DI SUPERFICIE

Dettagli

Normale controllo della crescita cellulare

Normale controllo della crescita cellulare Normale controllo della crescita cellulare STOP STOP Cellula normale STOP Alterato controllo della crescita cellulare X STOP STOP Cellula tumorale STOP X Le cellule tumorali presentano alterazioni cromosomiche

Dettagli

Mediatore chimico. Recettore. Trasduzione del segnale. Risposta della cellula

Mediatore chimico. Recettore. Trasduzione del segnale. Risposta della cellula Mediatore chimico Recettore Trasduzione del segnale Risposta della cellula I mediatori chimici sono prodotti da cellule specializzate e sono diffusi nell organismo da apparati di distribuzione Sistemi

Dettagli

Banche Dati: NCBI e BLAST. Progettazione primer per PCR mediante software on line: Primer3

Banche Dati: NCBI e BLAST. Progettazione primer per PCR mediante software on line: Primer3 Banche Dati: NCBI e BLAST Progettazione primer per PCR mediante software on line: Primer3 Sorgenti di informazione Le banche dati di interesse biologico Le banche dati di sequenze nucleotidiche e proteiche

Dettagli

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi.

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. DNA - RNA Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Esistono 4 basi azotate per il DNA e 4 per RNA Differenze

Dettagli

Allineamento locale: BLAST

Allineamento locale: BLAST Allineamento locale: BLAST BLAST (Basic Local Alignment Search Tool) è il più diffuso programma di allineamento locale delle sequenze. Per vari anni il metodo FASTA (da non confondere con l omonimo formato)

Dettagli

Lo Splicing dell RNA. Geni non interrotti

Lo Splicing dell RNA. Geni non interrotti Lo Splicing dell RNA I geni interrotti negli eucarioti si ritrovano in ogni classe: geni nucleari codificanti per proteine, rrna e trna. I geni interrotti sono presenti anche nei mitocondri e nei cloroplasti,

Dettagli

SOLUZIONI AI PROBLEMI DEL CAPITOLO 21. Domande concettuali

SOLUZIONI AI PROBLEMI DEL CAPITOLO 21. Domande concettuali SOLUZIONI AI PROBLEMI DEL CAPITOLO 21 Domande concettuali C1. La genomica strutturale studia la composizione di un genoma. Lo scopo è di mappare tutti i geni nel genoma e alla fine di determinare la sequenza

Dettagli

SUPERAVVOLGIMENTO DEL DNA (ORGANIZZAZIONE TERZIARIA DEL DNA)

SUPERAVVOLGIMENTO DEL DNA (ORGANIZZAZIONE TERZIARIA DEL DNA) SUPERAVVOLGIMENTO DEL DNA (ORGANIZZAZIONE TERZIARIA DEL DNA) ORGANIZZAZIONE TERZIARIA DEL DNA Il DNA cellulare contiene porzioni geniche e intergeniche, entrambe necessarie per le funzioni vitali della

Dettagli

RNA polimerasi operone. L operatore è il tratto

RNA polimerasi operone. L operatore è il tratto La regolazione genica nei procarioti Alcune proteine vengono prodotte dalla cellula ad un ritmo relativamente costante e l attività dei geni che codificano queste proteine non è regolata in modo sofisticato.

Dettagli

Replicazione del DNA

Replicazione del DNA Replicazione del DNA la replicazione del DNA viene effettuata da ENZIMI: DNA-polimerasi (catalizza la formazione del legame fosfodiestere) ogni filamento fa da stampo (enzima diretto dallo stampo) le DNA-polimerasi

Dettagli

La trascrizione negli eucarioti. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie

La trascrizione negli eucarioti. Prof. Savino; dispense di Biologia Molecolare, Corso di Laurea in Biotecnologie La trascrizione negli eucarioti Il promotore eucariotico L inizio della trascrizione negli eucarioti necessita della RNA polimerasi e dei fattori di trascrizione. Qualsiasi proteina sia necessaria per

Dettagli

LA TRADUZIONE E IL CODICE GENETICO

LA TRADUZIONE E IL CODICE GENETICO LA TRADUZIONE E IL CODICE GENETICO La traduzione La traduzione è il processo di sintesi di una catena polipeptidica, un polimero costituito da amminoacidi legati insieme da legami peptidici Le molecole

Dettagli

Biologia Molecolare. CDLM in CTF 2010-2011 La modificazione dell RNA e la traduzione

Biologia Molecolare. CDLM in CTF 2010-2011 La modificazione dell RNA e la traduzione Biologia Molecolare CDLM in CTF 2010-2011 La modificazione dell RNA e la traduzione La maturazione del trascritto primario I microrna Le componenti del macchinario di traduzione Il meccanismo della traduzione

Dettagli

La traduzione: dall mrna alle proteine

La traduzione: dall mrna alle proteine La traduzione: dall mrna alle proteine Le infezioni batteriche sono una grave causa di malattie e morte in Europa e negli USA. Le infezioni batteriche si curano con antibiotici che colpiscono l espressione

Dettagli

via Santena, 19-10126 Torino - Italy UNIVERSITÀ DEGLI STUDI Tel: +39 011 6334480 Fax: +39 011 6706582 DI TORINO

via Santena, 19-10126 Torino - Italy UNIVERSITÀ DEGLI STUDI Tel: +39 011 6334480 Fax: +39 011 6706582 DI TORINO Associazione Un Vero Sorriso Onlus via Morghen, 5 10143 Torino Torino, 21/02/2011 Progetto di ricerca: Utilizzo di oligonucleotidi antisenso per correggere l effetto di mutazioni di splicing in pazienti

Dettagli

Polimorfismi LEZIONE 6. By NA 1

Polimorfismi LEZIONE 6. By NA 1 Polimorfismi LEZIONE 6 By NA 1 * Polimorfismo Variazione presente nella popolazione con una frequenza superiore a 1% Variazioni nell aspetto By NA 2 Polimorfismo proteico Variazione presente nella popolazione

Dettagli

I marcatori genetici e loro applicazioni nelle produzioni animali. Dott.ssa Chiara Targhetta

I marcatori genetici e loro applicazioni nelle produzioni animali. Dott.ssa Chiara Targhetta I marcatori genetici e loro applicazioni nelle produzioni animali Dott.ssa Chiara Targhetta LOCUS localizzazione genomica unica all interno di un cromosoma; permette di definire la posizione di un gene

Dettagli

La possibilita di conoscere i geni deriva dalla capacita di manipolarli:

La possibilita di conoscere i geni deriva dalla capacita di manipolarli: La possibilita di conoscere i geni deriva dalla capacita di manipolarli: -isolare un gene (enzimi di restrizione) -clonaggio (amplificazione) vettori -sequenziamento -funzione Il gene o la sequenza

Dettagli

Esistono Open Tools di Microsoft per migliorare le attività di ricerca scientifica

Esistono Open Tools di Microsoft per migliorare le attività di ricerca scientifica CL3 - Biotecnologie Esistono Open Tools di Microsoft per migliorare le attività di ricerca scientifica Le informazioni necessarie al progresso scientifico sono spesso difficili da trovare, sommerse nelle

Dettagli

Introduzione al corso di bioinformatica e analisi dei genomi AA 2014-2015. Docente: Silvia Fuselli fss@unife.it

Introduzione al corso di bioinformatica e analisi dei genomi AA 2014-2015. Docente: Silvia Fuselli fss@unife.it Introduzione al corso di bioinformatica e analisi dei genomi AA 2014-2015 Docente: Silvia Fuselli fss@unife.it Fonti e testi di riferimento Dan Graur: http://nsmn1.uh.edu/dgraur/ >courses > bioinformatics

Dettagli

MODIFICAZIONI POST-TRASCRIZIONALI. 5 NT non tradotto 3 NT

MODIFICAZIONI POST-TRASCRIZIONALI. 5 NT non tradotto 3 NT MODIFICAZIONI POST-TRASCRIZIONALI 5 NT non tradotto 3 NT Numero introni per gene n esoni = n introni +1 Media esoni: 150 basi Introni: anche migliaia di basi Sequenze consenso presenti sul pre-mrna e

Dettagli

Tecniche molecolari per lo studio degli acidi nucleici

Tecniche molecolari per lo studio degli acidi nucleici Tecniche molecolari per lo studio degli acidi nucleici Prof.ssa Flavia Frabetti aa. 2010-11 Estrazione acidi nucleici (DNA o RNA) Verifica tramite elettroforesi su gel di agarosio Amplificazione o clonaggio

Dettagli

Organizzazione del genoma umano II

Organizzazione del genoma umano II Organizzazione del genoma umano II Lezione 7 & Pseudogeni I Pseudogeni non processati : convenzionali ed espressi * Copie non funzionali del DNA genomico di un gene. Contengono esoni, introni e spesso

Dettagli

TUTTI UGUALI, TUTTI DIVERSI Caccia al gene

TUTTI UGUALI, TUTTI DIVERSI Caccia al gene Centro Università di Milano-Scuola per la diffusione delle bioscienze e delle biotecnologie www.cusmibio.unimi.it TUTTI UGUALI, TUTTI DIVERSI Caccia al gene 1 Tutti uguali, tutti diversi Caccia al gene

Dettagli

Mutagenesi: introduzione di alterazioni in una sequenza nucleotidica. Mutagenesi random: le mutazioni avvengono a caso su un tratto di DNA.

Mutagenesi: introduzione di alterazioni in una sequenza nucleotidica. Mutagenesi random: le mutazioni avvengono a caso su un tratto di DNA. Mutagenesi: introduzione di alterazioni in una sequenza nucleotidica Mutagenesi random: le mutazioni avvengono a caso su un tratto di DNA. In genere si ottengono trattando il DNA con agenti chimici (es.

Dettagli

La mutazione è una modificazione della sequenza delle basi del DNA

La mutazione è una modificazione della sequenza delle basi del DNA La mutazione è una modificazione della sequenza delle basi del DNA Le mutazioni sono eventi rari e importanti in quanto sono alla base dell evoluzione biologica Le mutazioni possono essere spontanee (dovute

Dettagli

Apoptosi. Copyright (c) by W. H. Freeman and Company

Apoptosi. Copyright (c) by W. H. Freeman and Company Apoptosi La morte cellulare e la sua regolazione La morte cellulare programmata è un processo fondamentale che controlla lo sviluppo degli organismi pluricellulari; L apoptosi porta all eliminazione di

Dettagli

Bioinformatica (modulo bioinf. dei genomi moderni )

Bioinformatica (modulo bioinf. dei genomi moderni ) Bioinformatica (modulo bioinf. dei genomi moderni ) Dr. Marco Fondi Lezione # 5 Corso di Laurea in Scienze Biologiche, AA 2011-2012 giovedì 3 novembre 2011 1 Sequenziamento ed analisi di genomi: la genomica

Dettagli

Mutazioni. Un cambiamento nel materiale genetico che non venga riparato dai meccanismi di riparo costituisce una mutazione

Mutazioni. Un cambiamento nel materiale genetico che non venga riparato dai meccanismi di riparo costituisce una mutazione Mutazioni Un cambiamento nel materiale genetico che non venga riparato dai meccanismi di riparo costituisce una mutazione Le mutazioni possono essere spontanee oppure causate da agenti fisici, chimici

Dettagli

www.fisiokinesiterapia.biz TRASCRIZIONE

www.fisiokinesiterapia.biz TRASCRIZIONE www.fisiokinesiterapia.biz TRASCRIZIONE TRASCRIZIONE Processo mediante il quale una sequenza di DNA (un gene) viene copiata in una sequenza di RNA Dalla trascrizione derivano gli mrna, che verranno tradotti

Dettagli

ncdna Per ncdna si intende il DNA intronico, intergenico e altre zone non codificanti del genoma.

ncdna Per ncdna si intende il DNA intronico, intergenico e altre zone non codificanti del genoma. ncdna Per ncdna si intende il DNA intronico, intergenico e altre zone non codificanti del genoma. ncdna è caratteristico degli eucarioti: Sequenze codificanti 1.5% del genoma umano Introni in media 95-97%

Dettagli

Lezione 2 Capitolo 18 del testo

Lezione 2 Capitolo 18 del testo Test genetico Lezione 2 Capitolo 18 del testo Cos e un test genetico/diagnostico M Il test genetico di per se non e solo utilizzato in diagnostica: sono un insieme di tecniche che vengono utilizzate per

Dettagli

TRASDUZIONE DEL SEGNALE

TRASDUZIONE DEL SEGNALE TRASDUZIONE DEL SEGNALE TRASDUZIONE DEL SEGNALE Specificità (specificità riconoscimento) Amplificazione e diversificazione della risposta (cascata enzimatica) Integrazione tra segnali Spegnimento del segnale

Dettagli

la probabilità q di avere un ricombinante è 0,286/2 = 0,143; la probabilità p di avere un parentale è quindi (1-0,286)/2 = 0,714/2 = 0,357.

la probabilità q di avere un ricombinante è 0,286/2 = 0,143; la probabilità p di avere un parentale è quindi (1-0,286)/2 = 0,714/2 = 0,357. Analizziamo i figli: per 3 volte A è stato trasferito insieme a B e per 2 volte a insieme a b (5 parentali); per 2 volte A con b e B con a (2 ricombinanti). Secondo l ipotesi dell indipendenza, ci aspettiamo

Dettagli

SAPIENZA Università di Roma Laurea magistrale in Ingegneria delle Nanotecnologie A.A. 2014-2015 Corso di Laboratorio di Biofotonica

SAPIENZA Università di Roma Laurea magistrale in Ingegneria delle Nanotecnologie A.A. 2014-2015 Corso di Laboratorio di Biofotonica SAPIENZA Università di Roma Laurea magistrale in Ingegneria delle Nanotecnologie A.A. 2014-2015 Corso di Laboratorio di Biofotonica Prof. Francesco Michelotti SAPIENZA Università di Roma Facoltà di Ingegneria

Dettagli

LEZIONE X FUNZIONAMENTO E APPLICAZIONI DELLA PCR. Dott. Paolo Cascio

LEZIONE X FUNZIONAMENTO E APPLICAZIONI DELLA PCR. Dott. Paolo Cascio LEZIONE X FUNZIONAMENTO E APPLICAZIONI DELLA PCR Dott. Paolo Cascio Tecnica della reazione a catena della DNA polimerasi o PCR (Polymerase Chain Reaction) 1) Introdotta da Kary Mullis alla metà degli anni

Dettagli

Linkage. Lezione 4 (riprendere il testo di Genetica ) By NA

Linkage. Lezione 4 (riprendere il testo di Genetica ) By NA Linkage Lezione (riprendere il testo di Genetica ) Tipi di mappe: mappe genetiche Mappe genetiche : si basano sulla frequenza di ricombinazione fra locus identificati attraverso marcatori di varia natura:

Dettagli

TECNICHE DI BIOLOGIA MOLECOLARE. LA REAZIONE POLIMERASICA A CATENA Principi teorici e aspetti pratici

TECNICHE DI BIOLOGIA MOLECOLARE. LA REAZIONE POLIMERASICA A CATENA Principi teorici e aspetti pratici TECNICHE DI BIOLOGIA MOLECOLARE LA REAZIONE POLIMERASICA A CATENA Principi teorici e aspetti pratici POLYMERASE CHAIN REACTION (PCR) 1955 A. Kronembreg e coll. (Stanford University) scoprono la DNA-polimerasi

Dettagli

Citosol Ribosomi Sintesi proteica

Citosol Ribosomi Sintesi proteica CITOSOL (1) Citosol Ribosomi Sintesi proteica Biotecnologie_2012 Tutta la porzione non strutturata che costituisce la parte liquida del citoplasma. In esso si trovano in soluzione tutte le molecole necessarie

Dettagli

Nel 1997 un gruppo di ricercatori dell Università di Monaco, guidato. Genomi e genomica. DOMANDE CHIAVE Come si ottengono

Nel 1997 un gruppo di ricercatori dell Università di Monaco, guidato. Genomi e genomica. DOMANDE CHIAVE Come si ottengono Genomi e genomica 14 DOMANDE CHIAVE Come si ottengono le sequenze del DNA genomico? Come viene decifrata l informazione contenuta nel genoma? Che cosa può rivelare la genomica comparata sulla struttura

Dettagli

GENETICA DEL TUMORE DEL COLON-RETTO

GENETICA DEL TUMORE DEL COLON-RETTO GENETICA DEL TUMORE DEL COLON-RETTO EPIDEMIOLOGIA In tutto l'occidente, il cancro del colon-retto occupa, per incidenza, il secondo posto tra i tumori maligni, preceduto dal tumore al polmone nell'uomo

Dettagli

Legami chimici. Covalente. Legami deboli

Legami chimici. Covalente. Legami deboli Legami chimici Covalente Legami deboli Legame fosfodiesterico Legami deboli Legami idrogeno Interazioni idrofobiche Attrazioni di Van der Waals Legami ionici Studio delle macromolecole Lipidi

Dettagli

CORSO DI AGGIORNAMENTO PER GLI INSEGNANTI DELLE SCUOLE MEDIE SUPERIORI INGEGNERIA GENETICA E SUE APPLICAZIONI

CORSO DI AGGIORNAMENTO PER GLI INSEGNANTI DELLE SCUOLE MEDIE SUPERIORI INGEGNERIA GENETICA E SUE APPLICAZIONI CORSO DI AGGIORNAMENTO PER GLI INSEGNANTI DELLE SCUOLE MEDIE SUPERIORI INGEGNERIA GENETICA E SUE APPLICAZIONI mercoledì 5 maggio 2004 La regolazione dell'espressione genica prof. Giovanna Viale - Università

Dettagli

Lezione 8. DNA sequencing informatics

Lezione 8. DNA sequencing informatics Lezione 8 DNA sequencing informatics Il materiale di questa lezione è contenuto nel libro Next-generation DNA sequencing informatics Edited by Stuart M Brown Disponibile in biblioteca (CHIOSTRO 572.8633

Dettagli

Genomica Servizio Sequenziamento DNA

Genomica Servizio Sequenziamento DNA Genomica Servizio Sequenziamento DNA Listino prezzi 1 maggio 2005 Value Read Codice Descrizione Prezzo / Lettura 1001-000000 Tubi 13,50 1001-000010 Tubi con etichetta codice a barre 12,00 1094-000050 Etichette

Dettagli

BIOSEGNALAZIONE. La ricezione e la trasmissione delle informazioni extracellulari Parte II

BIOSEGNALAZIONE. La ricezione e la trasmissione delle informazioni extracellulari Parte II BIOSEGNALAZIONE La ricezione e la trasmissione delle informazioni extracellulari Parte II Tipi generali di trasduttori di segnali RECETTORI CON ATTIVITA TIROSIN CHINASICA (RTK) INS: insulin VEGF: vascular

Dettagli

Introduzione al Pattern Recognition Statistico

Introduzione al Pattern Recognition Statistico Introduzione al Pattern Recognition Statistico Roberto Tagliaferri Dipartimento di Informatica Università di Salerno ( Sa ) 84084 Fisciano e-mail robtag@unisa.it Statistical Pattern Recognition Introduzione

Dettagli

TRADUZIONE LA TRADUZIONE E QUEL PROCESSO ATTRAVERSO CUI SI PASSA DAL LINGUAGGIO RIBONUCLEOTIDICO DELL RNA A QUELLO AMINOACIDICO DELLE PROTEINE. IL CODICE GENETICO E L INSIEME DI CODONI (TRIPLETTE NUCLEOTIDICHE)

Dettagli

Elementi di Patologia Generale Dott.ssa Samantha Messina Lezione: Patologia Genetica

Elementi di Patologia Generale Dott.ssa Samantha Messina Lezione: Patologia Genetica Elementi di Patologia Generale Dott.ssa Samantha Messina Lezione: Patologia Genetica Anno accademico 2009/2010 I anno, II semestre CdL Infermieristica e Fisioterapia PATOLOGIA GENETICA Oggetto di studio

Dettagli