Bioinformatica :studio dei problemi biologici attraverso le metodologie dell'informatica Sinomimi: biochimica computazionale, biologia molecolare computazionale Viceversa: Biocomputazione, algoritmi genetici, reti neurali... :metodi informatici di applicazione generale che si ispirano ai principi della biologia File: bioinformatica_introduzione.odp Riccardo Percudani 1/10/2015
Scopi della bioinformatica Gestione dei dati biologici mantenimento, organizzazione, distribuzione... Analisi dei dati biologici inferenze e predizioni sul significato biologico File: bioinformatica_introduzione.odp Riccardo Percudani 1/10/2015
Oggetti della bioinformatica Sequenze di acidi nucleici >gi 8886401 gb AF162269.1 CCCACTCCTCCATCTCACAAACACTTCTCTATACCCAACAATCCCTTTTACAATCCCTGCTCATTTAGTC AAAATGGTCAAGATTGCTGCTATCATCCTCCTCATGGGCATTCTCGCCAATGCTGCCGCCATCCCTGTCA TTTCAACACCCAAATTACAGAGCCAACCGGCGAGGGCGACCGTGGGGACGTGGCCGAC Sequenze di proteine >P25032 MASSSSATSGDDRPPAAGGGTPAQAHAEWAASMHAYYAAAASAAGHPYAAWPLPPQAQQHGLVAAGAGAAYGAG AVPHVPPPPAGTRHAHASMAAGVPYMA Strutture di macromolecole File: bioinformatica_introduzione.odp Riccardo Percudani 1/10/2015
Sequencing costs have dropped several orders of magnitude, from $10 per finished base in 1990 to today's cost, which are estimated at about 5 or 6 cents per base for finished sequence and about 2 to 4 cents for draft sequence. The Scientist 17, 2003 File: bioinformatica_introduzione.odp Riccardo Percudani 1/10/2015
Flusso dell'informazione negli esseri viventi DNA Sequenza File: bioinformatica_introduzione.odp RNA Struttura Riccardo Percudani Proteine Funzione 1/10/2015
Importanza della bioinformatica Quantità di informazione Valore dell'informazione Esattezza e completezza dell'informazione
Genomica Genoma indica l'insieme del materiale genetico trasmissibile di un essere vivente (Hans Winkler, 1920). La genomica è la disciplina che studia i genomi completi.
- Techniche utilizzate: Microarray RNA-Seq - E' usata tipicamente per confrontare cellule in diverse condizioni (es. 'normale' vs 'tumorale') Expression (Tissue/ Kidney) - Studio dei profili di espressione (quantità di mrna) dei geni in una cellula o tessuto Expression (Tissue/ Kidney) Trascrittomica 1.2 1 0.8 0.6 0.4 0.2 0 Kidney Liver Intestine Brain Placenta 6 5 4 3 2 1 0 Kidney Liver Intestine Brain Placenta
Proteomica - Separazione attraverso gel bidimensionale delle proteine presenti nella cellula - Rilevazione delle proteine attraverso coloranti. Confronto tra diverse condizioni e individuazione delle macchie differenziali - Sequenziamento parziale attraverso spettrometria di massa - Identificazione tramite confronto con un database di sequenze Punto isoelettrico Massa
Il Genoma Umano Homo sapiens: 3 * 109 b.p., ~30.000 geni
e le sue varianti Varianti genetiche (polimorfismi) CONTROLLO (e.g. non-gout) AFFETTI (e.g. gout) Genome-Wide Association Studies (GWAS)
Rilevazione polimorfismi genetici Microarray Es. Illumina HumanOmniExpress: ~700.000 varianti x 24 campioni 200 ng DNA
Rilevazione polimorfismi genetici DNA-Seq: Next Generation Sequencing G Reference G A A A T CONTROLLO A Reads A A T C C C C C AFFETTO
Dimensione del genoma e numero di geni in diversi organismi
Divergenza da antenati comuni con modificazioni 18S rrna tree of life
Organismi modello della biologia Yeast Bacteria (Saccharomyces cerevisiae) (Escherichia coli)
Evoluzione nel tempo dell'informazione biologica Sequenza ancestrale Evento di separazione ATCGGCCACTTTCGCGATCA ATCGGCCACTTTCGCGATCG ATAGGCCACTTTCGCGATCA ATAGGCCACTTTCGCGATTA ATCGGCCACTTTCGTGATCG ATCGGCCACGTTCGTGATCG ATCGGCCACGTTCGCGATCG ATAGGGCACTTTCGCGATTA ATCGCCCACGTTCGCGATCG ATAGGGCACTTT-GCGATTA ATTGCCCACGTTCGCGATCG ATAGGGCACTTT-GCGATGA Sequenze omologhe Omologia = condivisione di un ancestore comune
Separazione dei geni per speciazione
I geni hanno una storia evolutiva più complicata di quella degli organismi GLOBINA EMOGLOBINA MIOGLOBINA -GLOBINA -GLOBINA
L'omologia è dedotta dall'allineamento Sequenze allineate Osservazione ATTGCCCACGTTCGCGATCG ATAGGGCACTTT-GCGATGA ** * *** ** ***** Sequenza ancestrale ATCGGCCACTTTCGCGATCA? Ipotesi ATTGCCCACGTTCGCGATCG ATAGGGCACTTT-GCGATGA
Il problema della bioinformatica Sequenza? Struttura? Funzione? File: bioinformatica_introduzione.odp Riccardo Percudani 1/10/2015
ORARIO DI LEZIONE Bioinformatica Aula informatica polifunzionale, Torre* - Mercoledì 16:30 18:30 Aula B, Podere la Grande - Mercoledì 11:30 13:30 * Postazione fissa o personal laptop Esercitatore: Dott. Pietro Cravedi
MODALITA' di ESAME Bioinformatica - Elaborato contenente una analisi bioinformatica originale di un Gene/proteina. Formato: articolo scientifico. Consegna in data di appello: PDF e cartaceo - Esame orale. Discussione sulla relazione e domande sulla teoria