UNIVERSITA' DEGLI STUDI DI PERUGIA FACOLTA' DI SCIENZE MATEMATICHE, FISICHE E NATURALI

Documenti analoghi
INTELLIGENZA ARTIFICIALE (elementi) 6 cfu

Tassonomia e Sistematica filogenetica

Corso di Zoologia. La diversità animale

INTELLIGENZA ARTIFICIALE (elementi) 6 cfu

Appunti di Ricerca Operativa

Morfometria in Thunnus thynnus: un approccio geometrico e tradizionale

Gruppo 1. SCHEDA GUIDA UdA 1 Referente Componenti Titolo

Laboratorio di Programmazione Laurea in Ingegneria Civile e Ambientale

Genomica Evoluzione e cambiamenti dei genomi. Dott.ssa Inga Prokopenko

BIOLOGIA EVOLUZIONISTICA (3)

UML Introduzione a UML Linguaggio di Modellazione Unificato. Corso di Ingegneria del Software Anno Accademico 2012/13

Documento digitalizzato dallo Staff di UnissResearch

Laboratorio di Programmazione Laurea in Ingegneria Civile e Ambientale

Progettazione per unità di apprendimento Percorso di istruzione di 1 livello, 2 periodo didattico, asse scientifico Unità di apprendimento 1

Scritto da lboninu Domenica 02 Gennaio :51 - Ultimo aggiornamento Domenica 02 Gennaio :59

CURRICOLO DI SCIENZE

The mind is like a parachute, it only works if it is open A. Einstein

Botanica (CFU 5+1) Martedì 11:00-13:00 Venerdì. scienza della diversità I turno 14:00-16:00 2 turno 16:00-18:00. aa

Una Breve Introduzione alla Logica

SCUOLA PRIMARIA I.C. di CRESPELLANO PROGRAMMAZIONE ANNUALE DI STORIA

Ottimizzazione Combinatoria 2 Presentazione

Sistematica e Tassonomia

TEORIE E TECNICHE PER LA COMUNICAZIONE DIGITALE

Corso di Applicazioni di Intelligenza Artificiale LS. Prof. Paola Mello Anno accademico 2008/2009

L' EVOLUZIONE del cosmo, della vita, dell'uomo

PROGRAMMAZIONE MODULARE ANNUALE (A.S. 2016/2017)

On the Origin of Species by Means of Natural Selection, 1859

Certificare le competenze

L'origine del pensiero evolutivo e la sua storia fino a Darwin Darwin, l'origine delle Specie, e la teoria darwiniana

STAMPA ATTIVITÀ FORMATIVE PER ANNO

LE BASI DI DATI. Prima parte Premesse introduttive I MODELLI DEI DATI

Uno Strumento per la ricerca di campi Output e Etichetta in pagine Client

Università di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali

Architettura. Nome Modulo Tipologia lezioni Ore Docente SSD Ruolo Interno Affidamento. Vincenzo Conti

RETI SOCIALI A.A. 2016/2017 DOCENTI LUISA GARGANO ADELE A. RESCIGNO

PROGETTAZIONE ANNUALE PER COMPETENZE Classe I Geografia

Biologia. Esplicitazone del prodotto/compito ESITI DI APPRENDIMENTO

Sviluppo e Gestione di Progetti

Tesi di Laurea I livello

SCUOLA PRIMARIA CURRICOLO DI SCIENZE CLASSE PRIMA. INDICATORI COMPETENZE ABILITA CONOSCENZE 1. Esplorare e descrivere oggetti e materiali

DOCUMENTO DI VALUTAZIONE DELLE EVIDENZE (Sistema Regionale di Istruzione e Formazione Professionale)

Problemi, istanze, soluzioni

Logica per la Programmazione Corso di Laurea in INFORMATICA a.a. 2016/17

Università di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali

ANNO SCOLASTICO 2017/2018. DIPARTIMENTO DI SCIENZE INDIRIZZO Liceo Classico.. CURRICOLO DI SCIENZE NATURALI. Biennio

IL PENSIERO COMPUTAZIONALE

TESI DI LAUREA "Scheduling dei processi: tecniche reticolari e nuovi approcci"

La Logica Lineare e il suo sviluppo in Italia

Logica per la Programmazione Corso di Laurea in INFORMATICA a.a. 2015/16

Algoritmi e Strutture Dati

Sistema Regionale di Istruzione e Formazione Professionale

CURRICOLO DI SCIENZE

Note esplicative alle tabelle

STORIA TRAGUARDI ALLA FINE DELLA SCUOLA PRIMARIA

Elementi di Informatica e Programmazione

Lezioni di Ricerca Operativa

piccoli e semplici procarioti, distinti dal punto di vista fenotipico (dagli

parte I teoria generale lezione 1 introduzione alla semiotica

Università degli Studi di Enna Kore

Istituto di Istruzione Superiore Giovanni Falcone Palazzolo sull Oglio (BS) PROGRAMMAZIONE DIDATTICA ANNUALE SCIENZE: BIOLOGIA.

Corso di SISTEMI INTELLIGENTI M. Prof. Michela Milano" Anno accademico 2011/2012

Problemi, algoritmi, calcolatore

Logica per la Programmazione Corso di Laurea in INFORMATICA a.a. 2016/2017

Le aree dell informatica

ALLEGATO A3.3 Giudizi individuali e collegiali dei candidati: Alviano Mario, Cicirelli Franco Domenico, Correndo Gianluca, Costanzo Domenico

Fondamenti di Informatica

2 OTTIMIZZAZIONE SU GRAFI. E. Amaldi Fondamenti di R.O. Politecnico di Milano 1

Fondamenti di Informatica Laurea in Ingegneria Civile e Ingegneria per l ambiente e il territorio

Perché scegliere il liceo A. B. Sabin?

Programmazione di Geografia Scuola Secondaria di I grado. Classe prima

Selvicoltura sistemica e possibili attivitànegli habitat forestali: dalle utilizzazioni agli interventi complementari

LA METAFORA DELL UFFICIO

CONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI

TAVOLA ROTONDA. Assistente Sanitario, Igienista e Tecnico della Prevenzione: quale integrazione è possibile? Enrico Burato

ISTITUTO DI ISTRUZIONE SUPERIORE Cesare De Titta - E. Fermi

Reti Complesse Biologiche

Attività gruppi CdS Matematica-Laurea Magistrale in Matematica

VITA DI LEV SEMENOVIC VYGOTSKJI

Logica proposizionale

Liceo delle Scienze Umane Liceo Linguistico Liceo Economico Sociale Liceo Musicale

12.1 IL PROBLEMA DEL CAMMINO MINIMO: L ALGORITMO DI DIJKSTRA

Piano di Gestione area SIC Foresta di Monte Arcosu

Le aree dell informatica

CORSO DI BIOLOGIA ANATOMIA E MORFOLOGIA VEGETALE Dr. Nicola Olivieri

La finanza comportamentale applicata al pricing delle opzioni

Laboratorio di Programmazione Laurea in Ingegneria Civile e Ambientale

STRUTTURA DELLE RETI SOCIALI A.A. 2014/15 INTRODUZIONE ALLE RETI

Basi di Dati: Introduzione

Un architettura orientata ai servizi per la localizzazione di dispositivi mobili

Interpreti, compilatori e semantica operazionale

Transcript:

UNIVERSITA' DEGLI STUDI DI PERUGIA FACOLTA' DI SCIENZE MATEMATICHE, FISICHE E NATURALI CORSO DI LAUREA IN INFORMATICA APPLICAZIONE DELL'ANSWER SET PROGRAMMING NELLA SISTEMATICA FILOGENETICA RELATORE: ANDREA FORMISANO TESI DI LAUREA DI: Stefania Cossa Matr. Nr. 175516 ANNO ACCADEMICO 2009-2010

Indice Indice Introduzione 1 1.1. 1.2. 1.3. 6 10 Storia della tassonomia 13 La tassonomia Linneana........................... 13 La teoria dell'evoluzione di Darwin.................. 16 La cladistica di Hennig............................ 17 2 La ricostruzione filogenetica 19 2.1. Albero filogenetico............................... 19 2.2. Ricostruzione filogenetica......................... 20 3 3.1. 3.2. 3.3. 3.4. 3.5. 4 4.1. 4.2. 4.3. 4.4. 4.5. 4.6. Metodi di ricostruzione filogenetica Metodi basati sulle distanze........................ Metodi basati sui caratteri......................... Trovare l'albero ottimale nei sistemi basati sui caratteri.. Tipi di ricerca utilizzati nei sistemi basati sui caratteri... Stimare il grado di fiducia di una ricostruzione filogenetica..................................... 26 26 29 31 32 L'Answer Set Programming Richiami di logica del primo ordine................. Ordini, reticoli e punti fissi........................ Sintassi Answer Set Programming................... Semantica Answer Set Programming................. Tecniche di programmazione ASP................... ASP-solver: Smodels............................. 35 35 37 38 39 43 46 33 6

5 Sistematica filogenetica con ASP 5.1. Richiami sui grafi orientati........................ 5.2. Ricostruzione filogenetica......................... 5.2.1. Descrizione del problema................. 5.2.2. Descrizione del problema con un programma logico................................. 5.2.3. Euristiche utili.......................... 5.3. Ricostruzione di una rete filogenetica................ 5.3.1. Descrizione del problema................. 5.3.2. Soluzione computazionale................. 51 51 52 53 54 58 59 60 64 6 Analisi/comparazione filogenesi ottenute 70 6.1. Calcolare filogenesi simili/diverse................... 70 6.1.1. Complessità risultati...................... 72 6.1.2. Metodi offline........................... 74 6.1.3. Metodi online........................... 74 6.1.4. Misure di distanza per filogenesi simili o diverse................................ 76 6.1.5. Calcolo di filogenesi simili/diverse.......... 78 6.1.6. Risultati sperimentali..................... 81 6.2. Calcolare filogenesi pesate......................... 83 6.2.1. Calcolare soluzioni pesate................. 83 6.2.2. Problema della ricostruzione filogenetica pesata.................................. 87 6.2.3. Calcolo di filogenesi pesate per le lingue indo-europee............................ 87 6.2.4. Calcolo di soluzioni pesate simili/diverse...... 90 6.2.5. Risultati sperimentali..................... 91 7 Esempi di applicazione del Phylo-ASP 94 7.1. Dialetti cinesi................................... 94 7.2. Alcataenia..................................... 105 7

8 Stesura ed esecuzione dell'algoritmo ASP di ricostruzione filogenetica 109 8.1. Stesura del programma ASP....................... 109 8.2. Esempio di esecuzione........................... 111 Conclusioni 117 Riferimenti 119 8

INTRODUZIONE La cladistica (o sistematica filogenetica), sviluppata da Willi Hennig, è lo studio delle relazioni evolutive tra le specie che si basa sui loro tratti comuni. Rappresentate in un diagramma, queste relazioni formano un albero in cui le foglie rappresentano le specie, i nodi interni rappresentano i loro progenitori e gli archi rappresentano le relazioni tra loro. Questo albero viene chiamato albero filogenetico (o filogenesi). Si può considerare la ricostruzione filogenetica come il primo passo per la ricostruzione della storia evolutiva di un insieme di taxa (o unità tassonomiche). Successivamente, infatti, viene ricostruita dalla filogenesi ottenuta una rete filogenetica (temporale) che spiega i contatti (o prestiti) tra le unità tassonomiche. In questo lavoro di tesi, studieremo sia la ricostruzione filogenetica che la ricostruzione delle reti filogenetiche utilizzando l'answer Set Programming (ASP), secondo l'approccio utilizzato da Esra Erdem. Tale approccio basato su questo tipo di programmazione dichiarativa viene chiamato PHYLO-ASP. Per una maggiore comprensione del lavoro svolto dalla Erdem e dai suoi colleghi, mostreremo l'applicabilità e l'efficienza di questo metodo su due dei campi da loro affrontati: l'analisi storica dei linguaggi e l'analisi storica del sistema parassita-ospite. A questo punto viene spontaneo domandarsi: ma perché e per chi, nella pratica, è importante effettuare questi studi? Storie di singole lingue fornisco, ad esempio, informazioni da cui si possono dedurre principi di cambiamento della lingua. Queste informazioni non sono interessanti soltanto per i linguisti storici, ma anche per gli archeologi, i genetisti umani e i fisici antropologi. Per esempio, un'accurata ricostruzione della storia evolutiva di alcune lingue può aiutare a rispondere a domande circa le migrazioni umane, il tempo in cui certi manufatti sono stati realizzati e quando i popoli antichi hanno iniziato ad usare i cavalli nell'agricoltura. Per quanto riguarda i parassiti, invece, sappiamo che essi si presentano in ogni parte del mondo, causando malnutrizione, malattie e, talvolta, anche la morte di chi li ospita. La loro analisi storica fornisce informazioni sulla loro provenienza e sul periodo in cui hanno iniziato ad infettare i loro ospiti. Le filogenie dei parassiti insieme alle filogenie dei loro ospiti e la loro distribuzione geografica, possono essere utilizzate per comprendere le mutazioni delle abitudini alimentari della specie ospite, la struttura e la storia degli ecosistemi ed identificare la storia di malattie umane ed animali. Tali informazioni consentono di effettuare previsioni circa l'età e la durata di specifici gruppi di animali di una particolare regione o di un particolare periodo e di identificare regioni di evoluzione hot spot, utili per valutare l'importanza di habitat specifici e regioni geografiche, e la diversità di aree di criticità genealogica ed ecologica. In questo modo si identificano i membri più vulnerabili della comunità da cui è possibile fare previsioni più attendibili circa l'impatto delle perturbazioni (naturali o causate dall'uomo) sulla 10

struttura degli ecosistemi e la loro stabilità. Una volta capita l'importanza che queste informazioni possano fornire, si arriva facilmente alla conclusione che, utilizzando un metodo computazionale come il PHYLO-ASP, si può ottenere una vera e propria semplificazione dei metodi tradizionalmente utilizzati dagli esperti, che si ritrovano a non dover più calcolare tutte le filogenesi possibili manualmente, risparmiando così una buona parte di tempo ed energie. 11