Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY.

Documenti analoghi
Una proteina nella rete: Introduzione alla bioinformatica

LE MOLECOLE INFORMAZIONALI. Lezioni d'autore Treccani

SUPERAVVOLGIMENTO DEL DNA (ORGANIZZAZIONE TERZIARIA DEL DNA)

Bioinformatica (1) Introduzione. Dott. Alessandro Laganà

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine

Dal DNA all RNA. La trascrizione nei procarioti e negli eucarioti

GENETICA seconda parte

I marcatori molecolari. Dipartimento di Scienze Agronomiche e Genetica Vegetale Agraria Corso di Genetica Agraria Giovanna Attene

INTOLLERANZA AL LATTOSIO: ESEMPIO DI BIODIVERSITA GENETICA

Struttura e funzione dei geni. Paolo Edomi - Genetica

Dal DNA alle proteine: La trascrizione e la traduzione

Corso di Laurea in BIOTECNOLOGIE

Figura 1. Rappresentazione della doppia elica di DNA e struttura delle differenti basi.

Indice dell'opera. Prefazione. Capitolo 1 Introduzione alla genetica Genetica classica e moderna Genetisti e ricerca genetica Sommario

Una nuova strada per capire le modifiche del DNA

OSSERVAZIONI TEORICHE Lezione n. 4

Perché abbiamo deciso di sequenziare il genoma umano

GENOMA. c varia da pochi kb nei virus a milioni di kb in piante e animali

20 febbraio Muore Renato Dulbecco

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri

Bioinformatica: DNA e Algoritmi

Ottimizzazione delle interrogazioni (parte I)

-malattie monogeniche o mendeliane:

Lezione 8. La macchina universale

La regolazione genica nei eucarioti

PROGETTO SCIENZE CLASSI PRIME SECONDARIA I GRADO A.S. 2013/2014

Scopo della lezione. Informatica. Informatica - def. 1. Informatica

Corso di Informatica

Scuola tedesca (1912) Si contrappone all elementismo di Wundt. Analisi vs sintesi

Il DNA: la molecola della vita

PROGETTO EM.MA PRESIDIO

Parte I. Prima Parte

Applicazioni biotecnologiche in systems biology

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi.

Introduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini

Negli eucarioti, per la maggior parte dei geni, entrambe le copie sono espresse dalla cellula, ma una piccola classe di geni è espressa

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

I NUOVI ISTITUTI TECNICI

Tratto dal libro Come vivere 150 anni Dr. Dimitris Tsoukalas

You created this PDF from an application that is not licensed to print to novapdf printer (

Il DNA e la cellula. Versione 2.3. Versione italiana. ELLS European Learning Laboratory for the Life Sciences

Determinazione della struttura di una molecola di RNA tramite una sequenza di numeri primi

Fibrillina Sindrome di Marfan sindrome di Marfan sindrome di Marfan Sindrome di Marfan Fibrillina 1

La mutazione è una modificazione della sequenza delle basi del DNA

CRITERI DI VALUTAZIONE SCUOLA PRIMARIA SCUOLA PRIMARIA

Mon Ami 3000 Varianti articolo Gestione di varianti articoli

Organi Cellule Molecole

HR - Sicurezza. Parma 17/12/2015

CORSO INTEGRATO DI GENETICA

Introduzione agli Algoritmi Genetici Prof. Beatrice Lazzerini

SAGE: Serial Analysis of Gene Expression

Sommario. Definizione di informatica. Definizione di un calcolatore come esecutore. Gli algoritmi.

Informazione e dato. Gabriella Trucco

RNA polimerasi operone. L operatore è il tratto

Il flusso dell informazione genetica. DNA -->RNA-->Proteine

COME VIENE REALIZZATA UNA RICERCA SPERIMENTALE IN BIOLOGIA MOLECOLARE?

Lo sviluppo del cancro è un processo complesso che coinvolge parecchi cambiamenti nella stessa cellula staminale. Poiché tutte le cellule staminali

Introduzione a Visual Basic Lezione 1 Concetti base e istruzioni condizionali

Strutturazione logica dei dati: i file

LINGUAGGI DI PROGRAMMAZIONE

Istituto d Istruzione Superiore Sandro Pertini Campobasso

Dispensa di Informatica I.1

Mendeliana Autosomica Dominante (AD) Autosomica Recessiva (AR) X-linked Recessiva (X-linked R) X-linked Dominante (X-linked D) Y-linked

SCIENZE E TECNOLOGIA

Alberto Viale I CROMOSOMI

BASI DI DATI per la gestione dell informazione. Angelo Chianese Vincenzo Moscato Antonio Picariello Lucio Sansone

A.A INDIRIZZO LA96 Analisi e intervento psicologico per l età adulta. Prof. Claudia Casadio

Biologia Cellulare e DNA «Bigino»

Il genoma dinamico: gli elementi trasponibili

Istituto Tecnico G.Galilei Livorno

Realizzazione di una chat su protocollo HTTP

Nozione di algoritmo. Gabriella Trucco

ISTITUTO COMPRENSIVO MONTEGROTTO TERME SCUOLA PRIMARIA DISCIPLINA: SCIENZE - CLASSE PRIMA OBIETTIVI DI APPRENDIMENTO

Introduzione alla programmazione in C

Metodi statistici per le ricerche di mercato

Organizzazione del genoma umano III

TECNOLOGIA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE ALLA FINE DELLA SCUOLA PRIMARIA

TECNOLOGIE INFORMATICHE DELLA COMUNICAZIONE ORE SETTIMANALI 2 TIPO DI PROVA PER GIUDIZIO SOSPESO PROVA DI LABORATORIO

Informatica per le discipline umanistiche 2 lezione 12

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Laboratorio di Pedagogia Sperimentale. Indice

SOMMARIO. Sistemi Self-Adaptive Motivazioni Ciclo di vita della cellula Paradigma. Future Work

Funzioni in C. Violetta Lonati

Cosa è un foglio elettronico

Sistemi Informativi Aziendali. Sistemi Informativi Aziendali

Appunti del corso di Informatica 1 (IN110 Fondamenti) 4 Linguaggi di programmazione

Genetica umana. Storia. Storia. Storia. Storia. Ramón Lucas Lucas, LC

Excel. A cura di Luigi Labonia. luigi.lab@libero.it

La genetica è la disciplina che si occupa della trasmissione dei caratteri ereditari Si divide in:

STUDI SU MATERIALE GENETICO

Informatica - A.A. 2010/11

SCUOLA SECONDARIA DI I GRADO

AREA PROFESSIONALE - COMPETENZE FINALI GENERALI

12. Evoluzione del Software

Progettaz. e sviluppo Data Base

Dispensa di database Access

1. BASI DI DATI: GENERALITÀ

Sistemi di tracciabilità per un attestato di identità molecolare. FEM 2 - Ambiente S.r.l. Spin-off dell Università degli Studi di Milano-Bicocca

12 - Introduzione alla Programmazione Orientata agli Oggetti (Object Oriented Programming OOP)

SEQUENZIAMENTO DEL DNA

Transcript:

Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY. Lezioni Lincee Palermo, 26 Febbraio 2015

Alla base della vita degli organismi c è il DNA

Dogma Centrale della Biologia Molecolare Geni: porzioni di dna localizzate in precise posizioni all interno della sequenza, che contengono tutte le informazioni necessarie per la produzione di una proteina. La genetica è la branca della biologia, che studia i geni, l'ereditarietà e la variabilità genetica.

Informatica e genetica (bioinformatica 1.0)

Rappresentazione informatica del DNA Alfabeto: {A,T,C,G} Rappresentazione del DNA come sequenza.atcgtagtctgatgctgatctagttcgtatctatcgtacac. Nucleotidi 3*10 12 nucleotidi nel DNA umano!

Sequenziamento: Il sequenziamento del DNA è un processo che serve a mettere in fila le basi (Adenina, Citosina, Guanina e Timina) che costituiscono il frammento di DNA in analisi, in modo da poterlo leggere propriamente ed analizzare. https://www.youtube.com/watch?v=6ldtdwjdwes

Progetto Genoma: Iniziato nel 1990, lo scopo di questo progetto era sequenziare tutto il genoma umano. Nel 2000 la prima bozza, nel 2003 genoma completo. Genomi clonati Taglio di segmenti a dimensione variabile Segmenti non ordinati Assemblaggio Problema informatico Risultato dell assemblaggio Combinazione

Il DNA viene letto da una macchina e produce proteine Abbiamo informazioni su come questa macchina agisce, quando inizia e come viene codificata una proteina a partire da un gene. Dal punto di vista informatico Input di tipo stringa (lunga 3*10 12 caratteri):..atcgtagtctgatgctgatctagttcgtat. Software che legge la stringa, e produce un risultato (proteina).

Abbiamo la sequenza di DNA, e se volessimo trovare I geni? Input di tipo stringa (lunga 3*10 12 caratteri):..atcgtagtctgatgctgatctagttcgtat. Gene (stringa di circa 8000 caratteri):. aatcgtagtctgatgc. Come facciamo a trovare le regioni nel DNA che sono uguali al gene? Tipico problema informatico detto Pattern Matching sul quale molte soluzioni sono state fornite (anche indipendentemente dal problema biologico)

Microarray e bioteconologie

Bioinformatica: Descrivere dal punto di vista numerico e statistico i fenomeni biologici fornendo ai risultati biochimici e biologici un corredo di strumenti analitici e numerici Discipline coinvolte: informatica, matematica applicata, statistica. La bioinformatica principalmente si occupa di: 1) fornire modelli statistici validi per l'interpretazione dei dati provenienti da esperimenti di biologia molecolare e biochimica al fine di identificare tendenze e leggi numeriche 2) generare nuovi modelli e strumenti matematici per riuscire a comprendere i sistemi biologici 3) organizzare le conoscenze acquisite a livello globale in basi di dati al fine di rendere tali dati accessibili a tutti, e ottimizzare gli algoritmi di ricerca dei dati stessi per migliorarne l'accessibilità.

Informatica ed epigenetica (bioinformatica 2.0)

Oservazione: Quasi tutte le cellule del nostro corpo condividono lo stesso DNA, ma l effetto finale è differente Probabilmente, esistono altri meccanismi che generano il fenotipo

Dalla genomica all epigenomica Nuova branca : Epigenomica E la branca della genomica che studia tutte le modificazioni ereditabili che variano l espressione genica pur non alterando la sequenza del DNA»

Da un punto di vista informatico L epigenetica può essere vista come la logica di controllo del software

Organizzazione del DNA Nucleo Nucleosomi Cromatina DNA

Nulceosoma Il nucleosoma è l unità organizzativa fondamentale della cromatina. DNA Linker Istone H1 DNA Linker Nucleosoma: Ottamero Istonico (due molecole di H2A, H2B, H3 e H4) dove ~147 bp di DNA sono saldamente avvolti. 75-90% del DNA è avvolto sui nucleosomi.

Specificità di sequenza Affinità di legame dell ottamero istonico Preferenza di G-C qui Ottamero Istonico Prefernza di A-T qui DNA Nucleosomale

Sappiamo pure quali sequenze piacciono e quali non piacciono ad i nucleosomi Specificità della sequenza e nucleosomi Poly(dA:dT) tracts

Perché studiare la cromatina (nucleosomi) La struttura della cromatina è dinamica ed è coinvolta in molti processi inclusa l espressione genica. Il DNA è avvolto nella cromatina e solo una piccola porzione del genoma è accessibile in ogni tipo di cellula. Le alterazioni nella struttura della cromatina sono coinvolte in diverse malattie, tra cui il cancro.

Tipi di input, stringhe e segnali CATTAAGCCCGTATTTCAATT AAACTCTTCATATT ATGAATTAATGCAGTTCAA GCTTAGTCTGCCTTAT TATAAGCAATAGCTTCTA Presenza di AA, AT, TA Nucleosoma Linker Identificazione di picchi e valli

Ma questo è un problema di apprendimento automatico! Apprendimento Input Etichetta Predizione Estrazione caratteristiche caratteristiche Algoritmo di apprendimento automatico Input Estrazione caratteristiche caratteristiche Modello Etichetta

Approccio 1, input stringhe: Fase di estrazione delle caratteristiche: occorre associare ad un input letterale un insieme di numeri che rappresenteranno l input all algoritmo di apprendimento automatico Es: finestra di dimensione, K=2 s AACTCGTC xs W = AA AC AT AG CA CC CT CG TA TC TT TG GA GC GT GG x s [ 1 1 0 0 0 0 1 1 0 2 0 0 0 0 1 0] 1 1 1 1 2 1 0 0 0 0 0 0 0 0 0 0 7 7 7 7 7 7 Nota: l estrazione delle caratteristiche secondo questo metodo, è motivato dalle considerazioni fatte in precedenza sulla presenza di sequenze di dimensione 2! Lezioni Lincee Palermo, 26 Febbraio 2015

Approccio 2, segnali provenienti da un microarray: Fase di estrazione delle caratteristiche: occorre associare ad un input segnale un insieme di numeri che rappresenteranno l input all algoritmo di apprendimento automatico 2 1.5 1 0.5 0-0.5-1 -1.5 t k 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1-2 0 20 40 60 80 100 120 140 0 0 20 40 60 80 100 120 140 Intervallo Intervallo Nota: l estrazione degli intervalli, ci consente di riconoscere la forma a campana che rappresenta la presenza del nucleosoma. Lezioni Lincee Palermo, 26 Febbraio 2015

Un idea semplice su un algoritmo di apprendimento automatico x i =(x i1,.., x in ) Lezioni Lincee Palermo, 26 Febbraio 2015

Bioinformatica La bioinformatica ha a che fare con le scienze della vita, ovvero con qualcosa che riguarda anche la nostra salute Oggi giorno esistono delle piattaforme biotecnologiche in grado di fornire impressionanti quantità di dati, la cui collezione ed analisi coinvolge necessariamente l infomratica. Bastarifletteresulfatto,chel attivitàdiricercaintaleambitosisvolgeinmodo interdisciplinare ovvero i gruppi che lavorano sulle scoperte scientifiche sono composti da Biologi, Fisici, Matematici, Informatici. Lezioni Lincee Palermo, 26 Febbraio 2015