Basi di dati biologiche

Размер: px
Начинать показ со страницы:

Download "Basi di dati biologiche"

Транскрипт

1 Basi di dati biologiche Seminario per il corso di Basi di Dati II Luana Rinaldi

2 AGENDA: Introduzione alla bioinformatica; Concetti Biologici; Banche dati biologiche; Collaborazioni tra banche dati; Ricerca in banche dati biologiche;

3 Introduzione alla bioinformatica Bioinformatics is the study of the information content and information flow in biological systems and processes. [Michael Liebman in Bioinformatics: An Editorial Perspective ] (

4 Nascita della bioinformatica fine anni 80 [Hwa Lim ( Bioinformatics Applicazione di tecniche informatiche nel dominio applicativo delle scienze della vita Definizione: Studio del contenuto informativo e del flusso di informazione nei sistemi e nei processi correlati alla biologia [Micheal Liebman in Bioinformatics: An Editoria Perspective (

5 Bioinformatica: definizione Bioinformatics La bioinformatica è il campo della scienza in cui la biologia e l informatica si fondono in un unica disciplina per facilitare nuove scoperte biologiche e determinare nuovi paradigmi computazionali sul modello dei sistemi viventi [NCBI: National Center for Biotechnology Information ---

6 Bioinformatica: ambiti applicativi Sviluppo di regole e algoritmi per l analisi delle sequenze di acidi nucleici e proteine; Simulazione di processi biologici: dall interazione tra coppie di proteine ai pathways metabolici (biologia dei sistemi); fornire modelli statistici validi per l'interpretazione dei dati provenienti da esperimenti di biologia molecolare e biochimica al fine di identificare tendenze e leggi numeriche; generare nuovi modelli e strumenti matematici per l'analisi di sequenze di DNA, RNA e proteine la fine di creare un corpus di conoscenze relative alla frequenza di sequenze rilevanti; organizzare le conoscenze acquisite a livello globale su genoma e proteoma in basi di dati al fine di rendere tali dati accessibili a tutti, e ottimizzare gli algoritmi di ricerca dei dati stessi per migliorarne l'accessibilità;

7 Analisi di Sequenze Sequenze --> proteine, geni, regioni regolative, rna, dna 1977: prima sequenza nucleotidica; 1983: 2000 sequenze in banca dati; Strumenti e metodi per l analisi delle sequenze sono alla base di tutta la bioinformatica;

8 Annotazione Funzionale Ricerca in banche dati; Motivi funzionali; Identificazione di domini;

9 Analisi filogenetiche Ricostruzione della storia evolutiva di geni e organismi basandosi sulle caratteristiche osservate sulle sequenze geniche e proteiche;

10 Bioinformatica Strutturale John Kendrew: servendosi della cristallografia a raggi X, riesce a definire in modo completo la struttura atomica della Mioglobina di Capodoglio, dimostrando che la proteina presentava una disposizione degli atomi ben ordinata, necessaria a definirne la sua funzione; [Premio Nobel per la chimica (1962)]

11 Predizione Strutturale Ricostruzione della struttura 3D di una proteina a partire dalla sua sequenza primaria;

12 Simulazioni prot 2 sol.1 prot 1 Drug Design; prot 2 programma di docking prot 2 prot 1 sol.2 Protein Design; Docking; prot 1 prot 2 sol.3 prot 1.

13 Genomica Studio del genoma degli organismi viventi. In particolare si occupa della struttura, contenuto, funzione ed evoluzione del genoma.

14 Genomica Sequenziamento del DNA Assemblaggio: Ricostruzione del genoma da milioni di sequenze; Annotazione Genomica: Identificazione di geni, trascritti e regioni reogolative;

15 Genomica Comparata Confronto tra i genomi di diversi organismi, nella loro organizzazione e sequenza.

16 System Biology Studio dei processi biologici, a livello cellulare e molecolare, considerati come sistemi composti da molte parti interagenti; Processo: Raccolta dati; Modello matematico; Simulazione e previsione; Verifica sperimentale;

17 Analisi di testi Estrazione automatica di informazione scientifica dalla letteratura esistente.

18 Ontologie Classificazione e ordinamento della conoscenza biologica.

19 Cenni Biologici

20 Genoma e DNA Tutte le informazioni contenute nel DNA di un organismo vivente costituiscono il suo Genoma, contenuto in ciascuna cellula dell organismo stesso Il DNA è un polimero (catena) di 4 acidi nucleici semplici, detti nucleotidi; Ciascun nucleotide è costituito di tre parti: una molecola di base + uno zucchero + un gruppo fosforico; Le basi sono 4: A = Adenina G = Guanina C = Citosina T = Timina

21 Il DNA è costituito da due sequenze nucleotidiche che assumono la caratteristica forma a spirale, legate tra loro da legami ad idrogeno La lunghezza del DNA viene misurata in termini di coppie di basi [ Il DNA umano è lungo 3.3 miliardi di coppie di basi] DNA - Acido desossiribonucleico

22 Tra le basi vale la legge di complementarietà di Watson-Crick: Adenina si lega solo con Timina: A-T Guanina si lega solo con Citosina: C-G Quindi una sequenza determina completamente la sequenza complementare: questo consente di generare copie identiche dell informazione immagazzinata nel DNA; La direzione di ciascuna sequenza è convenzionalmente da 5 a 3 : quindi le due sequenze di DNA sono complementari e antiparallele; DNA - Acido desossiribonucleico

23 Proteine Le proteine sono le componenti primarie degli esseri viventi. Tutte le proteine, nonostante le loro enormi differenze, sono composte dagli stessi 20 componenti di base: gli amminoacidi. Gli amminoacidi sono legati tra loro attraverso il legame peptidico; La sequenza amminoacidica è codificata direttamente dal materiale genetico (DNA), attraverso un processo detto sintesi proteica;

24 Proteine La sequenza polipeptidica possiede diversi gruppi laterali che, interagendo tra loro o con l acqua circostante, provocano il ripiegamento (folding) della proteina stessa, generando così la struttura secondaria e terziaria. A volte, la proteina può ripiegarsi ulteriormente, generando la struttura quaternaria. La struttura tridimensionale di una proteina è una delle principali aree di ricerca, in quanto spesso la forma è correlata alla funzione;

25 Codice Genetico Il codice genetico è lo schema attraverso cui la cellula traduce una sequenza di codoni (o triplette di basi) di RNA in una sequenza di amminoacidi durante la sintesi proteica

26 RNA - Acido Ribo-nucleico L RNA è un polimero simile al DNA, da cui però differisce per alcuni aspetti: è costituito da un unica catena nucleotidica; i suoi nucleotidi sono composti da uno zucchero di tipo ribosio; la base azotata uracile sostituisce la timina, pur mantenendo valida la complementarietà con l adenina; Coinvolto nei processi di traduzione e trascrizione del DNA e nella successiva sintesi proteica.

27 Concetti biologici utili alla bioinformatica La sequenza di DNA può essere trattata come una stringa sull alfabeto {A,C,G,T}; La sequenza primaria di una proteina può essere trattata come una stringa sull alfabeto {A, R, D, N, C, E, Q, G, H, I, L, K, M, F, P, S, T, W, Y, V}; Il DNA è formato da: [Esoni] Regioni codificanti: ovvero contenenti geni, cioè istruzioni per creare proteine; [Introni] Regioni non codificanti: ovvero senza una funzione conosciuta; Due o più sequenze di DNA o proteine si dicono omologhe se provengono da un antenato comune. L omologia può anche indicare una funzione comune nelle sequenze in esame;

28 !"#$"%&"'% Banche dati biologiche

29 Nascita delle banche dati biologiche Inizio anni 70: nasce la tecnologia del DNA ricombinante, che permette di manipolare le sequenze nucleotidiche e di capire la struttura, la funzione e l organizzazione del DNA; Fine anni 70: pubblicazione dei primi dati genomici, con le prime sequenze nucleotidiche codificanti liberamente accessibili attraverso i rudimenti della rete disponibili a quel tempo tra le varie università; 1965: Margareth Dayhoff compila un atlante di proteine omologhe, studiando le relazioni tra le sequenze primarie; viene reso pubblico in versione elettronica nel 1970 nella banca dati NBRF (National Biomedical Research Foundation); 1981 [Kurt Stueber]: nasce nel Laboratorio Europeo di Biologia Molecolare (EMBL) ad Heidelberg l EMBL-datalibrary (519 entries con sequenze di DNA e RNA); 1982 [Walter Goad]: nasce una banca dati simile negli USA, che darà vita alla GenBank; 1986: nel National Institute of Genetics in Mishima (Giappone) nasce un mirror della GeneBank, la DDBJ; 2001: Il Consorzio Pubblico Internazionale e la Celera Genomics forniscono dati del genoma umano completo, aprendo la strada ai progetti di sequenziamento a tappeto;

30 Organizzazione di un database biologico - L oggetto principale è la ENTRY, un unità riconoscibile grazie ad un identificatore univoco, che possiede una descrizione organizzata in campi standardizzati riconoscibili grazie agli HEADERS univoci nella banca dati. - Ogni banca dati presenta 2 versioni delle entries: Flat File: un file di testo semplice, formattato, non interattivo; HTML (o XML): interattivo, di facile consultazione; - Ogni banca dati ha dei suoi codici univoci di identificazione e definisce le sue entries secondo un rigido standard, imponendo a priori un certo numero di possibili campi contrassegnati da tag specifici, che permettono l utilizzo di questi file da parte di programmi automatici per l information retrieval. - Sia i flat-file che le pagine XML sono ricchi di cross-references, ossia riferimenti che rimandano ad altre banche dati generiche o specializzate. Si ottiene così una serie di informazioni spesso ridondanti.

31 Esempio di ENTRY (EMBL-data library) (1/4) Ogni linea comincia con due caratteri che indicano il codice: questo codice è sempre seguito da 3 spazi bianchi. Le informazioni cominciano quindi dal carattere in posizione 6. ID: identificatore della entry; tipo di molecola; divisione tassonomica; lunghezza bp; AC: accession number (identifica univocamente il record); SV-DT: versione e data di creazione della entry; DE: descrizione della entry; OS-OC: nome della specie, classificazione tassonomica; ID AJ223854; SV 1; linear; mrna; STD; MUS; 949 BP. XX AC AJ223854; XX DT 02-MAY-1998 (Rel. 55, Created) DT 23-SEP-2008 (Rel. 97, Last updated, Version 3) XX DE Mus musculus telethonin complete cdna XX KW telethonin. XX OS Mus musculus (house mouse) OC Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; OC Eutheria; Euarchontoglires; Glires; Rodentia; Sciurognathi; Muroidea; OC Muridae; Murinae; Mus. XX

32 Esempio di ENTRY (2/4) RN, RA, RT, RL: informazioni bibliografiche; RN [1] RP RA Ievolella C.; RT ; RL Submitted (10-FEB-1998) to the EMBL/GenBank/DDBJ databases. RL Ievolella C., CRIBI Biotechnology Centre, Universita' di Padova, viale RL G.Colombo 3, 35121, ITALY. XX RN [2] RX DOI; /72822 RX PUBMED; RA Moreira E.S., Wiltshire T.J., Faulkner G., Nilforoushan A., Vainzof M., RA Suzuki O.T., Valle G., Reeves R., Zatz M., Passos-Bueno M.R., Jenne D.E.; RT "Limb-girdle muscular dystrophy type 2G is caused by mutations in the gene RT encoding the sarcomeric protein telethonin"; RL Nat. Genet. 24(2): (2000). XX RN [3] RX DOI; /S (97) RX PUBMED; RA Valle G., Faulkner G.P., Deantoni A., Pacchioni B., Pallavicini A., RA Pandolfo D., Tiso N., Toppo S., Trevisan S., Lanfranchi G.; RT "Telethonin, a novel sarcomeric protein of heart and skeletal muscle"; RL FEBS Lett. 415(2): (1997). XX DR Ensembl-Gn; ENSMUSG ; Mus_musculus. DR Ensembl-Tr; ENSMUST ; Mus_musculus.

33 Esempio di ENTRY (3/4) FT (Feature Table): Regioni o siti della sequenza considerati interessanti ed eventuale link (cross-referencing); FH Key Location/Qualifiers FH FT source FT /organism="mus musculus" FT /mol_type="mrna" FT /tissue_lib="stratagene cdna library Uni-ZAP tm XR Vector" FT /tissue_type="diaphram muscle" FT /db_xref="taxon:10090" FT 5'UTR FT /experiment="experimental evidence, no additional details FT recorded" FT polya_site 928 FT CDS FT /codon_start=1 FT /product="telethonin" FT /function="sarcomeric protein" FT /db_xref="goa:o70548" FT /db_xref="interpro:ipr015667" FT /db_xref="mgi: " FT /db_xref="uniprotkb/swiss-prot:o70548" FT /experiment="experimental evidence, no additional details FT recorded" FT /protein_id="caa " FT /translation="matselscqvseenqerreafwaewkdltlstrpeegcslheedt FT QRHETYHRQGQCQAVVQRSPWLVMRLGILGRGLQEYQLPYQRVLPLPIFTPTKVGASKE FT EREETPIQLRELLALETALGGQCVERQDVAEITKQLPPVVPVSKPGPLRRTLSRSMSQE FT AQRG" FT 3'UTR FT /experiment="experimental evidence, no additional details FT recorded" XX

34 Esempio di ENTRY (4/4) SQ: sequenza nucleotidica SQ // Sequence 949 BP; 215 A; 250 C; 331 G; 153 T; 0 other; aggagcagga catagcagag ggagcaatca gaaatcatgg ccacttcaga gctgagctgc 60 caagtgtctg aggagaacca ggaacgcagg gaagccttct gggctgagtg gaaagacctg 120 actctgtcta cccggccgga agagggatgc tccttgcacg aggaggatac acagaggcat 180 gagacctacc accggcaggg acagtgtcag gcggtggtac agcgctcacc atggctggtg 240 atgcgcctgg gtatcctcgg ccgtgggcta caggaatacc agctgccgta ccagcgggtg 300 ctgcccctac ccatcttcac gcccaccaag gtgggggcct ccaaggagga gcgcgaggag 360 acccccatcc agcttcggga gctgctggcc ctggagacgg ccctgggcgg ccagtgcgtg 420 gagcgccagg acgtggctga gatcacaaag cagcttcccc ctgtggtgcc agtcagcaaa 480 cccgggcccc tgcgccgtac cctgtctcga tccatgtctc aggaagctca gagaggctga 540 gatggactgt gtgactcaga ctccactgtg tctgtctcag gctaggcact tcctggctag 600 gacaatggag gagagctgct ggcagtggct gctttgtagt ttgcccagag gtgggagcta 660 tgggaggagg gagcccgagg ccaggatgcc taggtgtcct gagtccccac agggaaggga 720 gcgaggatgg cgggcactag gagtggagag ctgagcaccc tcagccccag aagaagagac 780 aagagatcct ggtgagagga gaggcccctg ggaatggcct gctcgggaac agatggacta 840 ggagaaggat gtgcaacgct ctggaaagga gggggatgtg aagagggtgg aagtgggcag 900 gcccccagca ccctctggta gcactgcaat aaatgctcag ccatgttca 949 [per la descizione completa delle etichette dei campi è possibile consultare:

35 Tipi di banche dati di interesse biologico Le banche dati possono essere suddivise per tipo: PRIMARIE; DERIVATE; per tipo di informazioni contenute; sequenze nucleotidiche; sequenze proteiche; strutture; letteratura;...

36 Banche dati primarie Memorizzano essenzialmente le sequenze e poche altre informazioni generiche correlate alla sequenza per identificarla dal punto di vista specie-funzione (es: laboratorio dove è avvenuto il sequenziamento, data, specie, descrizione...). Le banche dati primarie sono: (1980) [EBI] EMBL datalibrary: Europa (1982) [NCBI] GenBank: USA (1986) DDBJ: Giappone Le tre organizzazioni utilizzando DBMS e modalità di accesso diversi: NCBI: DBMS personalizzato, accesso tramite Entrez; EBI/DDBJ: DMBS SRS Oracle, accesso tramite SRS; In tutti i casi, la struttura della base dati è nascosta agli utenti;

37 Sistemi di interrogazione alle banche dati Esistono dei sistemi integrati che permettono di interrogare, attraverso il Web, in modo semplice ed intuitivo le banche dati biologiche. I tre sistemi principali sono: Le banche dati primarie sono: ENTREZ: Associato a GenBank; SRS: Associato a EMBL; DBGET: Associato a DDBJ;

38 EBI - European Bioinformatics Institute Hinxton - Cambridge (UK) - ricerca con parole-chiave ricerca con accession number

39 EBI - European Bioinformatics Institute Hinxton - Cambridge (UK) - European Molecular Biology Laboratory (EMBL) Nucleotide Sequence Database è una completa collezione di sequenze nucleotidiche primarie, mantenuta all European Bioinformatics Institute (EBI). I dati sono sottomessi da centri di ricerca genomica, ricercatori individuali o autori attestati, e sono immediatamente disponibili alla comunità. I database sono su base Oracle e l interazione con essi è fornita via web tramite il Sequence Retrieval System (SRS), motore di ricerca proprio dell EBI per i database biologici. EMBL sequenze

40 SRS è un sistema aperto, che può essere installato su calcolatori differenti (server) e può integrare banche dati strutturate su altri server SRS o altre banche dati, previa strutturazione o indicizzazione nel sistema SRS

41 NCBI - National Center for Biotechnology Information M14752!

42 NCBI - National Center for Biotechnology Information E' un database di sequenze genetiche dell'national Institute of Healt statunitense. E' quindi una collezione annotata di tutte le sequenze di DNA disponibili pubblicamente; Accesso ai dati attraverso ENTREZ: sistema di interrogazione delle diverse basi dati gestite dall NCBI che costituisce quindi un hub completo per la ricerca di informazioni. Offre anche la possibilità di effettuare ricerche di tipo bibliografico e, soprattutto, di avere un collegamento diretto tra i vari database (sequenza-struttura-mappa geneticaarticolo)

43 ENTREZ sistema disponibile via web per la ricerca e l estrazione dei dati da banche dati di sequenze nucleotidiche, proteiche, dalla banca dati bibliografica MEDLINE, dalla banca dati delle malattie mendeliane OMIN, e da ogni banca dati sviluppata dall NCBI; Sistema CHIUSO, e non è possibile ottenere il software che gestisce il sistema;

44 DDBJ - DNA Data Bank of Japan

45 DDBJ - DNA Data Bank of Japan DNA Data Bank of Japan (DDBJ) ha iniziato la sua attività nel E' utilizzata soprattutto dai ricercatori giapponesi, ma ovviamente è utilizzabile da tutti attraverso internet.

46 Banche dati proteiche Un secondo grande aggregato di banche dati è quello per le sequenze proteiche, le quali possono essere ottenute in seguito a: Determinazione diretta della sequenza proteica; Traduzione di sequenze nucleotidiche per le quali sia stata individuata o predetta la funzione di gene codificante la proteina; Studi di espressione genica; Cristallografia e determinazione delle strutture secondarie e terziarie;

47 Banche dati proteiche (1986) SWISS-PROT (Protein knoledgebase): banca dati di riferimento sviluppata a Ginevra. Contiene informazioni accuratamente annotate, spesso a mano. (1996) TrEMBL (Translated EMBL): risultato della traduzione automatica in amminoacidi di tutte le sequenze annotate nella banca dati EMBL come codificanti proteine; supplemento a SWISS-PROT; PIR (Protein Information Resource): soprattutto indirizzato a definire gli standard di annotazione, con ridondanza minima; Insieme hanno formato il consorzio UNIPROT, repository centralizzato di tutte le sequenze proteiche

48 Banche dati di strutture wwpdb (world wide Protein Data Bank): banca dati di riferimento per i dati strutturali 3D di proteine, comprendente le coordinate atomiche determinate attraverso analisi cristallografiche ai raggi X, analisi NMR ed altre tecniche. Comprende anche una sezione dedicata alle strutture delle proteine determinate tramite metodi computazionali. Creata dalla collaborazione di RCSB (USA), MSD-EBI (EBI), PDBj (Giappone) MMDB (Entrez s Molecular Modelling Database): NDB: banca dati di strutture di acidi nucleidi, soli o assieme a proteine; CSD: banca dati di strutture di piccole molecole organiche e organometalliche

49 Banche dati derivate Le banche dati primarie contengono tutte le sequenze conosciute di tutti gli organismi, genomiche di mrna, etc... Per rendere la ricerca di informazioni organizzata sono state costruite delle banche dati derivate che raggruppano solo dati relativi a specifici argomenti. Esempi: Database di sequenze genomiche: GDB (uomo), MGI (topo), SGD (lievito); Database di geni e trascritti: UniGene, LocusLink, dbest, etc... Esistono poi dei database integrati che raggruppano i dati provenienti da differenti database fornendo informazioni particolareggiate di argomenti specifici.

50 Database non ridondanti Nei database primari sono inserite tutte le sequenze conosciute ottenute sperimentalmente e/o ricostruite La stessa regione genomica o lo stesso trascritto possono essere stati sequenziati più volte RIDONDANZA Per evitare questo problema sono stati creati dei database semplificati senza ripetizione di informazioni. In particolare: RefSeq: sequenze genomiche, mrna, proteine; UniGene: sequenze ottenute dal sequenziamento dei trascritti (mrna) Gene: (sottoinsieme di RefSeq) sequenze geniche;

51 Domini Proteici Molte proteine, specialmente quelle di grandi dimensioni, sono formate da più parti funzionali organizzate in strutture tridimensionali distinte che vengono chiamate domini proteici. Esempio: alcuni fattori di trascrizione del DNA hanno due domini, uno in grado di legarsi con una particolare sequenza di DNA, l altro in grado di attivare la trascrizione. Proteine formate da più di un dominio si sono probabilmente evolute per fusione di geni che contenevano tali domini.

52 Banche dati di domini proteici Database contenenti domini funzionali delle proteine: PFAM: ( Banca dati di famiglie di proteine accomunate da elementi strutturali e funzionali; PROSITE: ( Annota patterns amminoacidici individuati in un set di sequenze proteiche attraverso analisi in silicio e studi sperimentali SMART: ( Risorsa che raccoglie dati relativi a domini proteici e consente la ricerca di domini in nuove sequenze proteiche InterPro: ( Raccoglie informazioni strutturali e funzionali relativi ad una proteina o ad una famiglia di proteine. Comprende PROSITE e PFAM

53 Sottomissione di sequenze Esistono più di 20 differenti tipi di formati per la sottomissione di sequenze ad una banca dati: Esiste la necessità di avere quindi un sistema che possa effettuare la conversione da un formato all altro...

54 ReadSeq: Software disponibile sul web che effettua la conversione di diversi formati di file sequenze

55 Il formato FASTA Spesso i programmi che effettuano analisi bioinformatiche sulle sequenze richiedono che esse vengano date come input in un formato particolare: FASTA Format; FASTA è un formato per la descrizione di una sequenza grezza. Consiste essenzialmente in una parte iniziale di intestazione, di solito limitata ad una linea di testo, e da una o più linee che riportano una sequenza di DNA o di amminoacidi, usando l alfabeto standard.

56 !"#$ *#01"2' %&'($ -.$/' 789:;77;<#7' 8=>%0"7'!"#$%#&' 789:;77;<#7' 8=>%0"7' *+$,' 789:;77;<#7' 8=>%0"7' *$/'./$' (($)' 565' 3"0"#014'!")$ Collaborazioni tra banche dati

57 The International Nucleotide Sequence Database Collaboration EMBL, GenBank e DDBJ collaborano dal Ogni database mantiene e processa nuovi dati e sequenze e informazioni biologiche ad esse correlate, sottomesse dagli scienziati e ricercatori delle loro regioni; Questi tre database si sincronizzano automaticamente tra loro ogni 24 ore. Il risultato di questa sincronizzazione è che ogni database contiene esattamente le stesse informazioni, ad eccezione delle sequenze sottomesse nell ultima giornata;

58 The International Nucleotide Sequence Database Collaboration La sincronizzazione è organizzata secondo regole pubblicate e standardizzate dall International Advisory Board. Le linee guida consistono nella definizione delle tabelle del database, che regolano quindi il contenuto e la sintassi di ogni nuova entry. Il formato delle linee guida è DDT. La sintassi è chiamata INSDSeq, e consiste principalmente nello stabilire le lettere accettate per la codifica delle sequenze nucleotidiche e amminoacidiche.

59 Il problema della nomenclatura Non esiste uno standard di assegnazione dei nomi ai geni; uno stesso gene può avere diversi nomi, o uno stesso nome può individuare diversi geni; I geni possono essere catalogati in base agli organismi a cui appartengono, alla loro attivazione nel corso dello sviluppo di un organismo, alla funzione e alla struttura delle proteine codificate; Il problema della nomenclatura è stato risolto assegnando ad ogni nuova entry nella basi di dati un numero di serie, in modo da poter identificare ogni sequenza in modo univodo: ACCESSION NUMBER

60 Ricerche in banche dati

61 L importanza della similarità Due sequenze simili potrebbero derivare dalla stessa sequenza ancestrale, avere quindi la stessa struttura, o una funzione biologica simile

62 L importanza della similarità

63 Allineamento di sequenze Il passo base per la ricerca di similarità è l allineamento di due o più sequenze; La similarità tra due o più sequenze si verifica effettuando prima un allineamento tra le sequenze in esame, e poi decidendo se le eventuali parti comuni sono più facilmente dovute al caso o ad una effettiva relazione tra loro; Esistono due tipi di allineamento: GLOBALE: si tenta di allineare il massimo numero di caratteri delle due sequenze, incluse le parti finali. Candidate ideali sono le sequenze di lunghezza simile; LOCALE: si tenta di allineare solo pezzi di sequenze molto simili. L allineamento termina quando termina l isola di forte match. Candidate ideali sono sequenze con lunghezze diverse, che presentano regioni fortemente conservate;

64 Misure di similarità Le mutazioni delle sequenze genetiche sono alla base dell evoluzione. Esse sono dovute principalmente a: mutazioni in siti differenti di una sequenza occorrono in maniera indipendente; la rilevazione di mutazioni conservative è più probabile quando le due sequenze sono correlate e meno probabile quando l allineamento è casuale; la lunghezza di un GAP (spazi inseriti per mantenere l allineamento) non è correlata agli elementi allineati con il GAP stesso; Il punteggio totale assegnato ad un allineamento è una somma di termini: un termine per ciascuna coppia di residui allineati, più un termine per ciascun GAP.

65 Matrici BLOSUM [1992 da S. Henikoff e J.G. Henikoff] Introdotte per attribuire un punteggio alle sostituzioni nei confronti tra sequenze aminoacidiche.

66 Algoritmi per l allineamento I principali metodi di allineamento a coppie sono: Algoritmi di Programmazione Dinamica: Needleman & Wunsh: (1970) allineamento globale SMith & Watermann: (1981) allineamento locale Tecniche euristiche: FASTA BLAST

67 Algoritmi di Programmazione dinamica - Algoritmo di Needlemann & Wunsch: è un algoritmo dinamico che permette di trovare l allineamento globale ottimo. Calcola ricorsivamente l allineamento ottimo per sottosequenze via via più lunghe. Complessità computazionale: Spazio: S(mn) Tempo: O(mn) -Algoritmo di Smith & Watermann: è una variante dell algoritmo N-W che permette di trovare l allineamento locale ottimo. Non ci sono punteggi negativi. L opzione zero corrisponde all iniziare un nuovo allineamento. Complessità computazionale: Spazio: S(mn) Tempo: O(mn)

68 Algoritmi euristici per l allineamento Gli algoritmi di programmazione dinamica trovano allineamenti ottimi, ma sono troppo lenti nei casi pratici, come ad esempio una ricerca su una banca dati. Si utilizzano allora degli algoritmi euristici che migliorano le prestazioni a scapito della qualità della soluzione. Due applicativi simili che usano queste tecniche sono FASTA e BLAST. Per entrambi è difficile valutare in modo preciso sia l efficienza che l affidabilità.

69 FAST-All (Lipman, Pearson 1985) Consente di cercare una sequenza (detta query) in un database di sequenze (dette subject). Prevede tre fasi: 1-indicizzazione: la query viene divisa in parole di lunghezza prefissata e si memorizzano tutte le posizioni di inizio parola. Viene costruita una lookup-table. 2-ricerca: ogni volta che il programma trova una parola coincidente su entrambe le sequenze, viene memorizzata nella lookup-table (indice). Una volta terminata la lettura, vengono estratte le più lunghe e su di esse viene effettuato l allineamento locale. Alla fine della fase viene compilata una graduatoria di similarità su questi allineamenti. 3-raffinamento: il programma tenta di migliorare l allineamento congiungendo le best initial region con gap. Sulle sequenze che hanno ottenuto i migliori punteggi viene applicata una variante dell algoritmo SW, che restringe l analisi delle best initial region congiunte.

70 FAST-All (Lipman, Pearson 1985)

71 BLAST (Altshul 1990) Basic local alligment search tool: ottimizzato per trovare allineamenti locali privi di gap. L algoritmo prevede tre fasi: 1- leggendo la sequenza query viene formato un elenco di parole di lunghezza W. Per ognuna viene creata una lista di parole affini (W-mers): vengono considerati tutti i W- mers che superano una soglia T quando viene allineato con la parola della query; 2-vengono esaminate tutte le sequenze subject, per cercare la presenza di tutti i W- mers dell elenco. Ogni corrispondenza trovata viene considerata come parte di un allineamento più esteso. 3- viene considerata la possibilità di estendere ogni hit in entrambe le direzioni, senza l aggiunta di gap. Si ottiene quindi un allineamento locale detto HSP (High Scoring Segment Pair)

72 BLAST (Altshul 1990)

73 BLAST (Altshul 1990)

74 Basi di dati biologiche Seminario per il corso di Basi di Dati II Luana Rinaldi

Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA

Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Laboratorio di Metodologie e Tecnologie Genetiche ESERCITAZIONE DI BIOINFORMATICA Bioinformatica - Scienza interdisciplinare coinvolgente la biologia, l informatica, la matematica e la statistica per l

Подробнее

Una proteina nella rete: Introduzione alla bioinformatica

Una proteina nella rete: Introduzione alla bioinformatica Una proteina nella rete: Introduzione alla bioinformatica L era genomica ha assistito ad una crescita esponenziale delle informazioni biologiche rese disponibili dai progressi nel campo della biologia

Подробнее

Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY.

Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY. Carpire il segreto della vita con l informatica Giosuè Lo Bosco Dipartimento di Matematica e Informatica, Università di Palermo, ITALY. Lezioni Lincee Palermo, 26 Febbraio 2015 Alla base della vita degli

Подробнее

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi.

DNA - RNA. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. DNA - RNA Le unità fondamentali costituenti il DNA e l RNA sono i Nucleotidi. Nucleotide = Gruppo Fosforico + Zucchero Pentoso + Base Azotata. Esistono 4 basi azotate per il DNA e 4 per RNA Differenze

Подробнее

strutture di Proteine

strutture di Proteine Laboratorio di Bioinformatica I Database di strutture di Proteine Dott. Sergio Marin Vargas (2014 / 2015) Dal gene alla proteina La funzione della proteina è nella sua struttura 3D. Struttura delle proteine

Подробнее

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri

LA GENETICA: DNA e RNA LA GENETICA. DNA e RNA. Prof. Daniele Verri LA GENETICA DNA e RNA Prof. Daniele Verri L'acido desossiribonucleico o deossiribonucleico (DNA) è un acido nucleico che contiene le informazioni necessarie per la formazione di RNA e proteine. LA GENETICA:

Подробнее

LE MOLECOLE INFORMAZIONALI. Lezioni d'autore Treccani

LE MOLECOLE INFORMAZIONALI. Lezioni d'autore Treccani LE MOLECOLE INFORMAZIONALI Lezioni d'autore Treccani Introduzione (I) I pionieri della biologia molecolare, scoperta la struttura degli acidi nucleici, pensarono di associare al DNA una sequenza di simboli,

Подробнее

GENETICA seconda parte

GENETICA seconda parte GENETICA seconda parte I cromosomi sono lunghe molecole di una sostanza l acido desossiribonucleico. DNA Il DNA è una lunga catena fatta da due lunghi fili avvolti su se stessi a doppia elica. Sembra una

Подробнее

Bioinformatica (1) Introduzione. Dott. Alessandro Laganà

Bioinformatica (1) Introduzione. Dott. Alessandro Laganà Bioinformatica (1) Introduzione Dott. Alessandro Laganà Dott. Alessandro Laganà Martedi 15.30 16.30 Studio Assegnisti - 1 Piano (Davanti biblioteca) Dipartimento di Matematica e Informatica (Città Universitaria)

Подробнее

SRS (Sequence Retrieval System) della EBI che mette a disposizione anche dello spazio sul server per memorizzare le richerche.

SRS (Sequence Retrieval System) della EBI che mette a disposizione anche dello spazio sul server per memorizzare le richerche. I due centri maggiori, EBI e NCBI hanno sviluppato sistemi dedicati di RETRIEVAL allo scopo di ottenere il massimo delle informazioni con il minimo sforzo da parte dell utente SRS (Sequence Retrieval System)

Подробнее

Database. Si ringrazia Marco Bertini per le slides

Database. Si ringrazia Marco Bertini per le slides Database Si ringrazia Marco Bertini per le slides Obiettivo Concetti base dati e informazioni cos è un database terminologia Modelli organizzativi flat file database relazionali Principi e linee guida

Подробнее

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine

Prof.ssa Gamba Sabrina. Lezione 7: IL DNA. Duplicazione e sintesi delle proteine Prof.ssa Gamba Sabrina Lezione 7: IL DNA Duplicazione e sintesi delle proteine concetti chiave della lezione Costituzione fisico-chimica del DNA Basi azotate Duplicazione Concetto di geni Rna Trascrizione

Подробнее

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014 Archivi e database Prof. Michele Batocchi A.S. 2013/2014 Introduzione L esigenza di archiviare (conservare documenti, immagini, ricordi, ecc.) è un attività senza tempo che è insita nell animo umano Primi

Подробнее

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?) Ambiente Access La Guida di Access Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?) Guida in linea Guida rapida Assistente di Office indicazioni

Подробнее

Il DNA: la molecola della vita

Il DNA: la molecola della vita Il DNA: la molecola della vita Gli acidi nucleici comprendono il DNA (acido desossiribonucleico) e l RNA (acido ribonucleico). Sono costituiti da molecole molto grandi, formate da unità dette nucleotidi,

Подробнее

3. Confronto tra due sequenze

3. Confronto tra due sequenze 3. Confronto tra due sequenze Esercizio 1: uso di DotLet Il programma DotLet è accessibile dal sito http://myhits.isb-sib.ch/cgi-bin/dotlet, dove può essere utilizzato attraverso un interfaccia utente

Подробнее

Informatica e biotecnologie I parte

Informatica e biotecnologie I parte Informatica e biotecnologie I parte Banche dati biologiche Bioinformatica La Bioinformatica è una disciplina che affronta con metodiche proprie delle Scienze dell'informazione problemi propri della Biologia.

Подробнее

MODULO 5 Appunti ACCESS - Basi di dati

MODULO 5 Appunti ACCESS - Basi di dati MODULO 5 Appunti ACCESS - Basi di dati Lezione 1 www.mondopcnet.com Modulo 5 basi di dati Richiede che il candidato dimostri di possedere la conoscenza relativa ad alcuni concetti fondamentali sui database.

Подробнее

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni

Introduzione Ai Data Bases. Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni Introduzione Ai Data Bases Prof. Francesco Accarino IIS Altiero Spinelli Via Leopardi 132 Sesto San giovanni I Limiti Degli Archivi E Il Loro Superamento Le tecniche di gestione delle basi di dati nascono

Подробнее

Strutturazione logica dei dati: i file

Strutturazione logica dei dati: i file Strutturazione logica dei dati: i file Informazioni più complesse possono essere composte a partire da informazioni elementari Esempio di una banca: supponiamo di voler mantenere all'interno di un computer

Подробнее

Introduzione all Information Retrieval

Introduzione all Information Retrieval Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information

Подробнее

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Подробнее

Figura 1. Rappresentazione della doppia elica di DNA e struttura delle differenti basi.

Figura 1. Rappresentazione della doppia elica di DNA e struttura delle differenti basi. Sommario La molecola di DNA è deputata a conservare le informazioni genetiche necessarie per lo sviluppo ed il funzionamento degli organismi viventi. Poiché contiene le istruzioni per la costruzione delle

Подробнее

Access. P a r t e p r i m a

Access. P a r t e p r i m a Access P a r t e p r i m a 1 Esempio di gestione di database con MS Access 2 Cosa è Access? Access e un DBMS che permette di progettare e utilizzare DB relazionali Un DB Access e basato sui concetti di

Подробнее

Dispensa di database Access

Dispensa di database Access Dispensa di database Access Indice: Database come tabelle; fogli di lavoro e tabelle...2 Database con più tabelle; relazioni tra tabelle...2 Motore di database, complessità di un database; concetto di

Подробнее

RNA non codificanti ed RNA regolatori

RNA non codificanti ed RNA regolatori RNA non codificanti ed RNA regolatori RNA non codificanti ed RNA regolatori Piccoli RNA non codificanti RNA regolatore microrna RNAi e sirna Piccoli RNA non codificanti Gli RNA non codificanti (ncrna)

Подробнее

Gestione Iter Manuale Sistemista. Gestione Iter Manuale Sistemista

Gestione Iter Manuale Sistemista. Gestione Iter Manuale Sistemista Gestione Iter Manuale Sistemista Paragrafo-Pagina di Pagine 1-1 di 8 Versione 3 del 24/02/2010 SOMMARIO 1 A Chi è destinato... 1-3 2 Pre requisiti... 2-3 3 Obiettivi... 3-3 4 Durata della formazione...

Подробнее

Il database management system Access

Il database management system Access Il database management system Access Corso di autoistruzione http://www.manualipc.it/manuali/ corso/manuali.php? idcap=00&idman=17&size=12&sid= INTRODUZIONE Il concetto di base di dati, database o archivio

Подробнее

Progettazione di Basi di Dati

Progettazione di Basi di Dati Progettazione di Basi di Dati Prof. Nicoletta D Alpaos & Prof. Andrea Borghesan Entità-Relazione Progettazione Logica 2 E il modo attraverso il quale i dati sono rappresentati : fa riferimento al modello

Подробнее

Excel. A cura di Luigi Labonia. e-mail: [email protected]

Excel. A cura di Luigi Labonia. e-mail: luigi.lab@libero.it Excel A cura di Luigi Labonia e-mail: [email protected] Introduzione Un foglio elettronico è un applicazione comunemente usata per bilanci, previsioni ed altri compiti tipici del campo amministrativo

Подробнее

Basi di dati. Concetti introduttivi ESEMPIO. INSEGNAMENTI Fisica, Analisi, Aule. Docenti. Entità Relazioni Interrogazioni. Ultima modifica: 26/02/2007

Basi di dati. Concetti introduttivi ESEMPIO. INSEGNAMENTI Fisica, Analisi, Aule. Docenti. Entità Relazioni Interrogazioni. Ultima modifica: 26/02/2007 Basi di dati Concetti introduttivi Ultima modifica: 26/02/2007 ESEMPIO INSEGNAMENTI Fisica, Analisi, Informatica Aule Docenti Entità Relazioni Interrogazioni St udent i Database 2 Tabella (I) STUDENTE

Подробнее

Le Basi di Dati. Le Basi di Dati

Le Basi di Dati. Le Basi di Dati Le Basi di Dati 20/05/02 Prof. Carlo Blundo 1 Le Basi di Dati Le Base di Dati (database) sono un insieme di tabelle di dati strutturate in maniera da favorire la ricerca di informazioni specializzate per

Подробнее

Facoltà di Farmacia - Corso di Informatica

Facoltà di Farmacia - Corso di Informatica Basi di dati Riferimenti: Curtin cap. 8 Versione: 13/03/2007 1 Basi di dati (Database, DB) Una delle applicazioni informatiche più utilizzate, ma meno conosciute dai non informatici Avete già interagito

Подробнее

Riconoscibilità dei siti pubblici: i domini della Pa e le regole di.gov.it

Riconoscibilità dei siti pubblici: i domini della Pa e le regole di.gov.it Riconoscibilità dei siti pubblici: i domini della Pa e le regole di.gov.it Gabriella Calderisi - DigitPA 2 dicembre 2010 Dicembre 2010 Dominio.gov.it Cos è un dominio? Se Internet è una grande città, i

Подробнее

Banca dati Professioniste in rete per le P.A. Guida all uso per le Professioniste

Banca dati Professioniste in rete per le P.A. Guida all uso per le Professioniste Banca dati Professioniste in rete per le P.A. Guida all uso per le Professioniste versione 2.1 24/09/2015 aggiornamenti: 23-set-2015; 24-set-2015 Autore: Francesco Brunetta (http://www.francescobrunetta.it/)

Подробнее

Lezione V. Aula Multimediale - sabato 29/03/2008

Lezione V. Aula Multimediale - sabato 29/03/2008 Lezione V Aula Multimediale - sabato 29/03/2008 LAB utilizzo di MS Access Definire gli archivi utilizzando le regole di derivazione e descrivere le caratteristiche di ciascun archivio ASSOCIAZIONE (1:1)

Подробнее

Dal DNA alle proteine: La trascrizione e la traduzione

Dal DNA alle proteine: La trascrizione e la traduzione Dal DNA alle proteine: La trascrizione e la traduzione DNA RNA Trascrizione RNA PROTEINE Traduzione Dove avvengono? GLI EUCARIOTI I PROCARIOTI Cambell, Reece Biologia ZANICHELLI Trascrizione Sintesi di

Подробнее

Algoritmi e strutture dati. Codici di Huffman

Algoritmi e strutture dati. Codici di Huffman Algoritmi e strutture dati Codici di Huffman Memorizzazione dei dati Quando un file viene memorizzato, esso va memorizzato in qualche formato binario Modo più semplice: memorizzare il codice ASCII per

Подробнее

Progettaz. e sviluppo Data Base

Progettaz. e sviluppo Data Base Progettaz. e sviluppo Data Base! Progettazione Basi Dati: Metodologie e modelli!modello Entita -Relazione Progettazione Base Dati Introduzione alla Progettazione: Il ciclo di vita di un Sist. Informativo

Подробнее

4. Ricerca di sequenze in banche dati e allineamento multiplo

4. Ricerca di sequenze in banche dati e allineamento multiplo 4. Ricerca di sequenze in banche dati e allineamento multiplo Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni di BLAST disponibili sono organizzate in base al

Подробнее

Gestione Risorse Umane Web

Gestione Risorse Umane Web La gestione delle risorse umane Gestione Risorse Umane Web Generazione attestati di partecipazione ai corsi di formazione (Versione V03) Premessa... 2 Configurazione del sistema... 3 Estrattore dati...

Подробнее

Uso delle basi di dati DBMS. Cos è un database. DataBase. Esempi di database

Uso delle basi di dati DBMS. Cos è un database. DataBase. Esempi di database Uso delle basi di dati Uso delle Basi di Dati Il modulo richiede che il candidato comprenda il concetto di base dati (database) e dimostri di possedere competenza nel suo utilizzo. Cosa è un database,

Подробнее

Le Biomolecole I parte. Lezioni d'autore di Giorgio Benedetti

Le Biomolecole I parte. Lezioni d'autore di Giorgio Benedetti Le Biomolecole I parte Lezioni d'autore di Giorgio Benedetti LE BIOMOLECOLE Le biomolecole, presenti in tutti gli esseri viventi, sono molecole composte principalmente da carbonio, idrogeno, azoto e ossigeno.

Подробнее

Cercare documenti Web

Cercare documenti Web Pagine web (struttura html) Cercare documenti Web Motori di Ricerca I MOTORI DI RICERCA Sulla rete Web vi sono strumenti specifici chiamati motori di ricerca (research engines) per la ricerca di siti e

Подробнее

Lezione 1. Introduzione e Modellazione Concettuale

Lezione 1. Introduzione e Modellazione Concettuale Lezione 1 Introduzione e Modellazione Concettuale 1 Tipi di Database ed Applicazioni Database Numerici e Testuali Database Multimediali Geographic Information Systems (GIS) Data Warehouses Real-time and

Подробнее

REPLICAZIONE DEL DNA

REPLICAZIONE DEL DNA REPLICAZIONE DEL DNA La replicazione (o anche duplicazione) è il meccanismo molecolare attraverso cui il DNA produce una copia di sé stesso. Ogni volta che una cellula si divide, infatti, l'intero genoma

Подробнее

Alfa Layer S.r.l. Via Caboto, 53 10129 Torino ALFA PORTAL

Alfa Layer S.r.l. Via Caboto, 53 10129 Torino ALFA PORTAL ALFA PORTAL La struttura e le potenzialità della piattaforma Alfa Portal permette di creare, gestire e personalizzare un Portale di informazione in modo completamente automatizzato e user friendly. Tramite

Подробнее

FIRESHOP.NET. Gestione del taglia e colore. www.firesoft.it

FIRESHOP.NET. Gestione del taglia e colore. www.firesoft.it FIRESHOP.NET Gestione del taglia e colore www.firesoft.it Sommario SOMMARIO Introduzione... 3 Configurazione iniziale... 5 Gestione delle varianti... 6 Raggruppamento delle varianti... 8 Gestire le varianti

Подробнее

I database relazionali (Access)

I database relazionali (Access) I database relazionali (Access) Filippo TROTTA 04/02/2013 1 Prof.Filippo TROTTA Definizioni Database Sistema di gestione di database (DBMS, Database Management System) Sistema di gestione di database relazionale

Подробнее

DATABASE. A cura di Massimiliano Buschi

DATABASE. A cura di Massimiliano Buschi DATABASE A cura di Massimiliano Buschi Introduzione Con Microsoft Access: Immissione dati e interrogazione Interfaccia per applicazioni e report Ma prima bisogna definire alcune conoscenze di base sui

Подробнее

UNIVERSITA DEGLI STUDI DI BRESCIA Facoltà di Ingegneria

UNIVERSITA DEGLI STUDI DI BRESCIA Facoltà di Ingegneria ESAME DI STATO DI ABILITAZIONE ALL'ESERCIZIO DELLA PROFESSIONE DI INGEGNERE PRIMA PROVA SCRITTA DEL 22 giugno 2011 SETTORE DELL INFORMAZIONE Tema n. 1 Il candidato sviluppi un analisi critica e discuta

Подробнее

Cosa è un foglio elettronico

Cosa è un foglio elettronico Cosa è un foglio elettronico Versione informatica del foglio contabile Strumento per l elaborazione di numeri (ma non solo...) I valori inseriti possono essere modificati, analizzati, elaborati, ripetuti

Подробнее

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI)

COMUNE DI RAVENNA GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI) COMUNE DI RAVENNA Il sistema di valutazione delle posizioni del personale dirigente GUIDA ALLA VALUTAZIONE DELLE POSIZIONI (FAMIGLIE, FATTORI, LIVELLI) Ravenna, Settembre 2004 SCHEMA DI SINTESI PER LA

Подробнее

Corso di Biologia Molecolare

Corso di Biologia Molecolare Corso di Biologia Molecolare Dott.ssa Renata Tisi Dip. Biotecnologie e Bioscienze Ed. U4 Tel. 02 6448 3522 [email protected] Acidi nucleici Il ruolo degli acidi nucleici è quello di custodire e trasmettere

Подробнее

Brochure Internet. Versione 2010.1 The Keyrules Company s.r.l. Pagina 2 di 8

Brochure Internet. Versione 2010.1 The Keyrules Company s.r.l. Pagina 2 di 8 Ogni organizzazione possiede un sistema di regole che la caratterizzano e che ne assicurano il funzionamento. Le regole sono l insieme coordinato delle norme che stabiliscono come deve o dovrebbe funzionare

Подробнее

uadro Soluzioni software per L archiviazione elettronica dei documenti Gestione Aziendale Fa quadrato attorno alla tua azienda

uadro Soluzioni software per L archiviazione elettronica dei documenti Gestione Aziendale Fa quadrato attorno alla tua azienda Fa quadrato attorno alla tua azienda Soluzioni software per L archiviazione elettronica dei documenti Perché scegliere Q Archiviazione Elettronica dei Documenti? Tale applicativo si pone come obbiettivo

Подробнее

Corso di Informatica

Corso di Informatica Corso di Informatica Modulo T2 3-Compilatori e interpreti 1 Prerequisiti Principi di programmazione Utilizzo di un compilatore 2 1 Introduzione Una volta progettato un algoritmo codificato in un linguaggio

Подробнее

Gestione ed analisi di base dati nell epidemiologia. delle malattie infettive

Gestione ed analisi di base dati nell epidemiologia. delle malattie infettive Università degli Studi di Torino - Facoltà di Medicina Veterinaria Laboratorio di epidemiologia delle malattie infettive Scuola Specializzazione in Sanità Animale, Allevamento e Produzioni Zootecniche

Подробнее

sommario 1. introduzione al sistema 2. moduli base 3. tracciabilità e rintracciabilità 4. diagramma di flusso operativo 5.

sommario 1. introduzione al sistema 2. moduli base 3. tracciabilità e rintracciabilità 4. diagramma di flusso operativo 5. tracciabilità rintracciabilità e macellazione avicola sommario 1. introduzione al sistema 2. moduli base 2.1. anagrafica base 2.2. entrata partite avicole 2.3. macellazione partite 2.4. stoccaggio ed immagazzinamento

Подробнее

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse

Stefania Marrara - Esercitazioni di Tecnologie dei Sistemi Informativi. Integrazione di dati di sorgenti diverse Politecnico di Milano View integration 1 Integrazione di dati di sorgenti diverse Al giorno d oggi d la mole di informazioni che viene gestita in molti contesti applicativi è enorme. In alcuni casi le

Подробнее

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione

Programma del Corso. Dati e DBMS SQL. Progettazione di una. Normalizzazione Programma del Corso Dati e DBMS DBMS relazionali SQL Progettazione di una base di dati Normalizzazione (I prova scritta) (II prova scritta) Interazione fra linguaggi di programmazione e basi di dati Cenni

Подробнее

Corso di PHP. Prerequisiti. 1 - Introduzione

Corso di PHP. Prerequisiti. 1 - Introduzione Corso di PHP 1 - Introduzione 1 Prerequisiti Conoscenza HTML Principi di programmazione web Saper progettare un algoritmo Saper usare un sistema operativo Compilazione, link, esecuzione di programmi Conoscere

Подробнее

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi

Indice generale. OOA Analisi Orientata agli Oggetti. Introduzione. Analisi Indice generale OOA Analisi Orientata agli Oggetti Introduzione Analisi Metodi d' analisi Analisi funzionale Analisi del flusso dei dati Analisi delle informazioni Analisi Orientata agli Oggetti (OOA)

Подробнее

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci

Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Corso di Laurea Magistrale in Ingegneria per l Ambiente e il Territorio A.A. 2014-2015 Telerilevamento e GIS Prof. Ing. Giuseppe Mussumeci Strutture di dati: DB e DBMS DATO E INFORMAZIONE Dato: insieme

Подробнее

Il software impiegato su un computer si distingue in: Sistema Operativo Compilatori per produrre programmi

Il software impiegato su un computer si distingue in: Sistema Operativo Compilatori per produrre programmi Il Software Il software impiegato su un computer si distingue in: Software di sistema Sistema Operativo Compilatori per produrre programmi Software applicativo Elaborazione testi Fogli elettronici Basi

Подробнее

Regolamento di attribuzione del codice ISBN e di erogazione dei servizi dell Agenzia ISBN

Regolamento di attribuzione del codice ISBN e di erogazione dei servizi dell Agenzia ISBN Regolamento di attribuzione del codice ISBN e di erogazione dei servizi dell Agenzia ISBN Compilando l apposito form web di adesione il richiedente formula all Agenzia ISBN una proposta per l attribuzione

Подробнее

EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro,

EXCEL PER WINDOWS95. sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area di lavoro, detta foglio di lavoro, EXCEL PER WINDOWS95 1.Introduzione ai fogli elettronici I fogli elettronici sono delle applicazioni che permettono di sfruttare le potenzialità di calcolo dei personal computer. Essi si basano su un area

Подробнее

Indice. pagina 2 di 10

Indice. pagina 2 di 10 LEZIONE PROGETTAZIONE ORGANIZZATIVA DOTT.SSA ROSAMARIA D AMORE Indice PROGETTAZIONE ORGANIZZATIVA---------------------------------------------------------------------------------------- 3 LA STRUTTURA

Подробнее

Applicazioni biotecnologiche in systems biology

Applicazioni biotecnologiche in systems biology Applicazioni biotecnologiche in systems biology Lezione #6 Dr. Marco Galardini AA 2012/2013 Gene regulation analysis Lezione #6 Dr. Marco Galardini AA 2012/2013 Regolazione genica Elementi molecolari e

Подробнее

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo

Page 1. Evoluzione. Intelligenza Artificiale. Algoritmi Genetici. Evoluzione. Evoluzione: nomenclatura. Corrispondenze natura-calcolo Evoluzione In ogni popolazione si verificano delle mutazioni. Intelligenza Artificiale In un ambiente che varia, le mutazioni possono generare individui che meglio si adattano alle nuove condizioni. Questi

Подробнее

Soluzione dell esercizio del 2 Febbraio 2004

Soluzione dell esercizio del 2 Febbraio 2004 Soluzione dell esercizio del 2 Febbraio 2004 1. Casi d uso I casi d uso sono riportati in Figura 1. Figura 1: Diagramma dei casi d uso. E evidenziato un sotto caso di uso. 2. Modello concettuale Osserviamo

Подробнее

DATA BASE ON LINE (BANCA DATI MODULI SPERIMENTALI)

DATA BASE ON LINE (BANCA DATI MODULI SPERIMENTALI) Progetto regionale antidispersione per favorire l adempimento dell obbligo d istruzione 2 a annualità DATA BASE ON LINE (BANCA DATI MODULI SPERIMENTALI) MANUALE DI UTILIZZO Indice Premessa 3 Ingresso nel

Подробнее

Linee guida per il Comitato Tecnico Operativo 1

Linee guida per il Comitato Tecnico Operativo 1 Linee guida per il Comitato Tecnico Operativo 1 Introduzione Questo documento intende costituire una guida per i membri del Comitato Tecnico Operativo (CTO) del CIBER nello svolgimento delle loro attività.

Подробнее

AtoZ IL CATALOGO DI BIBLIOTECA VIRTUALE

AtoZ IL CATALOGO DI BIBLIOTECA VIRTUALE EBSCO ITALIA S.r.l. Corso Brescia 75 10152 TORINO (Italia) Tel. 011-28.76.811 Fax 011-24.82.916 www.ebsco.it Agente della: EBSCO INTERNATIONAL, INC. P.O. BOX 1943 BIRMINGHAM /ALABAMA - USA AtoZ IL CATALOGO

Подробнее

Compilatore risorse display grafico LCD serie IEC-line

Compilatore risorse display grafico LCD serie IEC-line Compilatore risorse display grafico LCD serie IEC-line aggiornamento: 22-11-2012 IEC-line by OVERDIGIT overdigit.com 1. Il display grafico LCD I PLC della serie IPC-line possono disporre opzionalmente

Подробнее

Nuova funzione di ricerca del sito WIKA.

Nuova funzione di ricerca del sito WIKA. Nuova funzione di ricerca del sito WIKA. Il sito WIKA dispone ora di una funzione di ricerca completamente riprogettata. Essa è uno strumento particolarmente importante in quanto deve fornire al navigatore

Подробнее

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L.

Per capire meglio l ambito di applicazione di un DWhouse consideriamo la piramide di Anthony, L. Direzionale. L. Manageriale. L. DATA WAREHOUSE Un Dataware House può essere definito come una base di dati di database. In molte aziende ad esempio ci potrebbero essere molti DB, per effettuare ricerche di diverso tipo, in funzione del

Подробнее

Introduzione alle basi di dati (prima parte)

Introduzione alle basi di dati (prima parte) Introduzione alle basi di dati (prima parte) Università degli Studi di Salerno Corso di Laurea in Scienze della Comunicazione Informatica generale (matr. Dispari) Docente: Angela Peduto A.A. 2007/2008

Подробнее

corso di Access MICROSOFT ACCESS Docente: Andrea Mereu Università degli studi di Cagliari 16 aprile 9 maggio 2012

corso di Access MICROSOFT ACCESS Docente: Andrea Mereu Università degli studi di Cagliari 16 aprile 9 maggio 2012 1 MICROSOFT ACCESS 1 Docente: Andrea Mereu Università degli studi di Cagliari 16 aprile 9 maggio 2012 Che cos'è Access? 2 Access è un'applicazione database (DBMS), cioè un programma che serve a gestire

Подробнее

ECDL AM5 Access Advanced

ECDL AM5 Access Advanced SANDRO GALLEA ECDL AM5 Access Advanced Guida alla prova d esame per la patente europea di informatica Indice Premessa...pag. 9 AM5.1 Progettazione delle tabelle AM5.1.1 Campi, colonne...» 11 AM5.1.1.1

Подробнее

Guida all uso del web service SDMX

Guida all uso del web service SDMX Guida all uso del web service SDMX Introduzione L obiettivo di questo documento è l illustrazione sintetica degli step che tecnicamente bisogna compiere affinché un generico client sia in grado di interagire

Подробнее

Database 1 biblioteca universitaria. Testo del quesito

Database 1 biblioteca universitaria. Testo del quesito Database 1 biblioteca universitaria Testo del quesito Una biblioteca universitaria acquista testi didattici su indicazione dei professori e cura il prestito dei testi agli studenti. La biblioteca vuole

Подробнее

Progetto Cluster. Sottoprogetto Bioinformatica

Progetto Cluster. Sottoprogetto Bioinformatica Progetto Cluster Sottoprogetto Bioinformatica CRS4 (Centro di Ricerca, Sviluppo e Studi Superiori in Sardegna) Società costituita nel 1990 svolge attività di ricerca e sviluppo basate sulle tecnologie

Подробнее

Rappresentazione dei Dati Biologici

Rappresentazione dei Dati Biologici Rappresentazione dei Dati Biologici CORSO DI BIOINFORMATICA C.d.L. Ingegneria Informatica e Biomedica Outline Proteine ed Amminoacidi Rappresentazione di Amminoacidi Rappresentazione delle strutture Proteiche

Подробнее

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico

Introduzione alle basi di dati. Gestione delle informazioni. Gestione delle informazioni. Sistema informatico Introduzione alle basi di dati Introduzione alle basi di dati Gestione delle informazioni Base di dati Modello dei dati Indipendenza dei dati Accesso ai dati Vantaggi e svantaggi dei DBMS Gestione delle

Подробнее

UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI

UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI UTILIZZATORI A VALLE: COME RENDERE NOTI GLI USI AI FORNITORI Un utilizzatore a valle di sostanze chimiche dovrebbe informare i propri fornitori riguardo al suo utilizzo delle sostanze (come tali o all

Подробнее

Istituto Centrale per il Catalogo Unico delle Biblioteche Italiane. e per le Informazioni bibliografiche. Manuali utente per SBN WEB. Versione 1.

Istituto Centrale per il Catalogo Unico delle Biblioteche Italiane. e per le Informazioni bibliografiche. Manuali utente per SBN WEB. Versione 1. Istituto Centrale per il Catalogo Unico delle Biblioteche Italiane e per le Informazioni bibliografiche Manuali utente per SBN WEB Versione 1.0 Produzione editoriale Vers. 1.0 27/09/2013 Pagina 1 Sommario

Подробнее

Caratteristiche principali. Contesti di utilizzo

Caratteristiche principali. Contesti di utilizzo Dalle basi di dati distribuite alle BASI DI DATI FEDERATE Antonella Poggi Dipartimento di Informatica e Sistemistica Antonio Ruberti Università di Roma La Sapienza Anno Accademico 2006/2007 http://www.dis.uniroma1.it/

Подробнее

IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE

IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE 51 Dichiarazione d intenti (mission statement) La dichiarazione d intenti ha il compito di stabilire degli obiettivi dal punto di vista del mercato, e in parte dal

Подробнее

COME VIENE REALIZZATA UNA RICERCA SPERIMENTALE IN BIOLOGIA MOLECOLARE?

COME VIENE REALIZZATA UNA RICERCA SPERIMENTALE IN BIOLOGIA MOLECOLARE? COME VIENE REALIZZATA UNA RICERCA SPERIMENTALE IN BIOLOGIA MOLECOLARE? A Flusso di attività B - INPUT C Descrizione dell attività D RISULTATO E - SISTEMA PROFESSIONALE 0. RICHIESTA DI STUDIARE E/O INDIVIDUARE

Подробнее

Funzioni in C. Violetta Lonati

Funzioni in C. Violetta Lonati Università degli studi di Milano Dipartimento di Scienze dell Informazione Laboratorio di algoritmi e strutture dati Corso di laurea in Informatica Funzioni - in breve: Funzioni Definizione di funzioni

Подробнее

Manuale Knowledge Base

Manuale Knowledge Base (Riservato a rivenditori e agenzie) Versione Luglio 2010 SOMMARIO Introduzione... 2 Accesso... 2 Menu Conoscenze... 3 Bacheca... 4 Voci di menu... 5 Ricerca... 5 Ricerca Semplice... 6 Ricerca avanzata...

Подробнее

1. BASI DI DATI: GENERALITÀ

1. BASI DI DATI: GENERALITÀ 1. BASI DI DATI: GENERALITÀ BASE DI DATI (DATABASE, DB) Raccolta di informazioni o dati strutturati, correlati tra loro in modo da risultare fruibili in maniera ottimale. Una base di dati è usualmente

Подробнее