Uso di BLAST. Premessa

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Uso di BLAST. Premessa"

Transcript

1 Uso di BLAST Premessa Una delle applicazioni più semplici ed utilizzate della bioinformatica è quello di comparare 2 o più sequenze tra di loro, per ricavare delle informazioni sulla possibile funzione, o per trovare delle regioni di similarità con una sequenza sonda. Più semplicemente se abbiamo clonato e sequenziato una sequenza ignota, di solito ci interessa capire di che cosa si tratti, oppure se siamo convinti di avere clonato una determinata sequenza è utile averne conferma E possibile fare ciò attraverso una ricerca di similarità tra la nostra sequenza sonda e quelle contenute in un database pubblico liberamente accessibile, ma anche privato (ad esempio constituito da dati collezionati da un singolo gruppo di ricerca e non ancora rilasciati alla comunità scientifica). I risultati vengono poi analizzati. Se cerchiamo solo una conferma basta vedere se il risultato è coerente con le nostre ipotesi. Se invece abbiamo a che fare con una sequenza ignota, è possibile farsi un idea della sua funzione vedendo quali parti sono simili ad altre sequenze depositate nei database. Il programma più usato è decisamente BLAST, anche se per ragioni storiche va ricordato anche FASTA. Entrambi ricercano sequenze simili alla sonda, ma in modo diverso. Oggi sarà provato solo BLAST, molto più usato perché più veloce, mentre se volete potrete provare FASTA per conto vostro, in quanto un algoritmo orami superato ed importante solo per la storia della bioinformatica (è accessibile da ). BLAST (acronimo per Basic Local Alignment Search Tool) (all EBI o all NCBI) usa l algoritmo di Altschul, e si basa sul fatto che entro sequenze omologhe si possono trovare regioni con una similarità statisticamente significativa. Nei confronti nucleotidici sono attribuiti punteggi positivi alle identità e negativi alle non identità. Nei confronti proteici invece si usano matrici di punteggi PAM o BLOSUM (sulle quali non scendiamo in dettagli perché ne avrete già parlato a lezione) Si definiscono maximal score segment pair (msp) le regioni di massima similarità e high score segment pair (hsp) le regioni con punteggio di similarità statisticamente significativo. NOTA: nella maggior parte dei casi i tools messi a disposizione funzionano solo se la sequenza data è in formato FASTA. Questo formato ha soltanto la particolarità di avere una riga iniziale di commento che inizia col simbolo >. Ad esempio quella che segue è una semplice sequenza in formato FASTA: >sequenza ATGCATGCATGCATGCATGCATGCATGCATGCATGC BLAST è hostato sui server NCBI ed accessibile a questo link: BLAST: NCBI NOTA BENE: BLAST è un programma che può essere anche utilizzato in locale, ovvero scaricandolo sul proprio sistema operativo e ricercando similarità in database privati.

2 Le sonde che si possono usare sono diverse, naturalmente tutto dipende da cosa si ha a disposizione e da cosa si ha intenzione di fare: cloni di cdna, sequenze genomiche ridotte, sequenze proteiche note o dedotte. Naturalmente, la natura della sequenza sonda, ovvero il fatto se si tratti di una sequenza nucleotidica o proteica, determina il tipo di blast che vogliamo utilizzare: come vedremo tra poco, esitono vari programmi, chiati BLASTn, BLASTp, BLASTx, tblastn, tblastx. Infatti, andando alla pagina BLAST dell NCBI, si vede come per ogni categoria di ricerca si abbiano più tools a disposizione. C è infatti BLASTP, che esegue una ricerca tra una sequenza aminoacidica e un db di sequenze proteiche. BLASTN, che esegue una ricerca tra sequenza nucleotidica e un database nucleotidico. BLASTX traduce una sequenza nucleotidica nei 6 frame di lettura e li compara con un database proteico, TBLASTN confronta una sequenza aminoacidica con i 6 frame di lettura di un db nucleotidico, e TBLASTX traduce nei 6 frame una sequenza nucleotidica e la compara con i 6 frame di lettura delle sequenze presenti in un determinato database nucleotidico. Parte 1 Recupero di una sequenza in formato FASTA Come prima cosa è importante sapere che le sequenze sonda vanno sempre inserite nella finestra del BLAST in formato FASTA. E piuttosto semplice ottenere una sequenza in questo formato dalle schede corrispondenti, sia dal sito dell NCBI che da quello dell EBI. Vediamo brevemente come farlo, utilizzando la sequenza nucleotidica con entry ID FR Possiamo ricercarla in entrambi i due grandi database, e vedrete che in entrambi i casi, immediatamente sotto l intestazione della sequenza, è disponibile un link clickabile FASTA, che vi restituirà per appunto la sequenza oggetto in formato FASTA. La riga di intestazione, preceduta da un simbolo >, è leggermente diversa, ma la sequenza è identica: >gi emb FR Mytilus galloprovincialis MgC1q97 gene for putative C1q domain containing protein MgC1q97 >ENA FR FR Mytilus galloprovincialis MgC1q97 gene for putative C1q domain containing protein MgC1q97 FASE 2 Ricerca di similarità di una sequenza nucleotidica utilizzando il programma BLASTN A questo punto colleghiamoci all indirizzo: Dalla pagina che si presenta scegliere il link: "nucleotide-blast. Si arriva così alla pagina del sottoprogramma di BLAST BLASTN (nucleotide BLAST) che effettua una ricerca di similarità utilizzando come "query" una sequenza nucleotidica in formato FASTA e come database un database anch esso nucleotidico. Dopo aver cliccato sul link corrispondente al programma, è possibile incollare la sequenza nucleotidica nella casella di input denominata "Enter query sequence". Il messaggio Enter accession number(s), gi(s), or FASTA sequence(s) ci fa capire che sarebbe anche possibile utilizzare direttamente l accession ID della sequenza, se noto (nel nostro caso sì). Ovviamente, qualora la sequenza non fosse già depositata in un database pubblico, sarebbe necessario incollarla per intero.

3 Allo stesso modo, è possibile fare un upload di un file contenente le sequenze query per effettuare BLAST multipli. Passiamo ora alla sezione sottostante, Choose Search Set. Da qui va selezionato un database all interno del quale effettuare la ricerca. Ci sono tre grandi categorie, ovvero human, mouse ed others, che a loro volta sono suddivise in database più specifici selezionabili tramite un comodo menù a tendina. Noi selezioniamo nucleotide collection (nr/nt) sotto others, la collezione di sequenza nucleotidiche non ridondanti. Notiamo poi la presenza di un campo Organism che ci permette di poter limitare la nostra ricerca a determinate specie. Per ora lasciamolo perdere, lo useremo più tardi. Segue una sezione program selection, dalla quale è possibile selezionare Highly similar sequences (megablast), More dissimilar sequences (discontiguous megablast) e Somewhat similar sequences (blastn). Questi tre programmi corrrispondono a tre gradi di sensitività diversi: Megablast è ottimizzato per sequenze molto lunghe e similarità elevate (ad esempio larghe porzioni di genoma), ottimizza il fattore velocità a scapito della sensibilità. Viceversa blastn è molto sensibile anche per similarità più remote, ma notevolmente più lento. Selezioniamo la terza opzione, Somehwat similar sequences. Sotto al tasto per lanciare il BLAST è disponibile una sezione Algorithm parameters, che ora non modificheremo ma è talvolta molto importante per ottimizzare la ricerca. Diamo comunque un breve sguardo ad alcuni importanti parametri modificabili: -Max target sequences: il numero massimo di sequenze che verrà restituito nei risultati (sempre ordinati per e-value. Le sequenze in eccesso non verranno mostrate nella pagina di output. -Expect threshold: rappresenta la soglia di e-value per mostrare un risultato: di default settata a 10, possiamo abbassarla per mostrare solamente risultati più significativi. -Word size: questo è un parametro fondamentale nel BLAST. Definisce la dimensione in caratteri di una parola, ovvero l unità basilare che è utlizzata per la ricerca di similarità in BLAST. Per la teoria su questo argomento si rimanda alle slide delle lezioni teoriche. Qui noteremo semplicemente che questo parametro varia moltissimo a seconda del tipo di BLAST (vedremo ad esempio che valore assumerà in BLASTp). -Scoring parameteres: altri parametri importanti che influenzano sensibilmente i risultati della ricerca ed il loro e-value. Definiscono, per le sequenze nucleotidiche, uno score di match/mismatch (il primo positivo, il secondo negativo) ed uno score per l apertura e l estensione di gaps, ovvero buchi nell allineamento. Per sequenze ammino acidiche la situazione sarà un po diversa, coem vedremo. E possibile inoltre introdurre dei filtri più avanzati per sequenze ripetute/ridondanti, particolarmente utili in casi ben specifici (sotto Filters and Masking). Pensiamo ad esempio alle proteine contenenti triple eliche di collagene (GGPGGPGGPGGPGGP...) oppure regioni genomiche con minisatelliti.

4 Clicchiamo sul tasto "BLAST", posto poco sotto la casella di input, per inoltrare la richiesta al server dell NCBI. Si ottiene così una pagina di attesa in cui è indicato il tempo stimato per la ricerca. Una volta terminata la ricerca, si verrà direttamente reindirizzati sulla nuova pagina contenente i risultati. Finché il server non ha terminato, compare un messaggio di attesa che si aggiorna automaticamente. NOTA: il tempo di attesa varia a seconda del carico di lavoro del server. FASE 3 Interpretazione dei risultati di BLASTN La pagina dei risultati si può dividere in quattro parti (dall alto in basso): PRIMA PARTE La prima parte dà informazioni sul programma (in questo caso BLASTN), sulla sequenza "query" (quella con cui si effettua la ricerca), tra le quali la sua lunghezza (indicata come "query length ), e sul database utilizzati. Presenta inoltre un link denominato "Taxonomy reports", da cui si arriva ad una pagina che presenta tre diverse organizzazioni dei risultati di una data ricerca effettuata con BLAST, in base all'informazione presente nel database tassonomico dell'ncbi, ed un link denominato Distance tree of results, che organizza le sequenze risultanti in semplici alberi filogenetici. Di recente è stato introdotto un altro link MSA viewer, che riporta l allineamento multiplo tra le sequenze ottenute (che esploreremo nelle prossime lezioni). SECONDA PARTE La seconda parte consiste in una immagine che illustra graficamente i risultati: la linea rossa spessa e graduata rappresenta la sequenza "query"; i numeri sotto di essa si riferiscono alla sua lunghezza in basi; ciascuna linea sottile sottostante, di vari colori, indica un allineamento della suddetta sequenza con una sequenza del database nucleotidico; il colore di tali linee indica la bontà dell allineamento, in base alla scala colorimetrica posta all inizio dell immagine (rosso migliore, nero peggiore); passando su ciascuna linea sottile con la freccia del mouse, sul riquadro subito sopra l immagine compare la descrizione della sequenza nucleotidica con cui la sequenza query si allinea in quel caso; cliccando su tali linee si va invece direttamente all allineamento (situato nella quarta parte della pagina) tra la "query" e una data sequenza del database. TERZA PARTE La terza parte consiste nell'elenco delle sequenze nucleotidiche del database scelto che producono allineamenti significativi con la sequenza "query" e comincia con la frase: "Sequences producing significant alignments:". Le sequenze sono ordinate in base all'e-value (colonna a destra), parametro che misura la significatività degli allineamenti: minore è, più significativo è l'allineamento. Ciascuna sequenza contiene un link, da cui si arriva al record di Entrez relativo a quella sequenza. E indicato inoltre il query cover cioè la percentuale di sequenza che trova allineamento significativo, oltre ad un livello di identità espresso in percentuale (identity). QUARTA PARTE La quarta parte visualizza gli allineamenti significativi della sequenza "query" con sequenze del database scelto.

5 Data una sequenza del database scelto che produce uno o più allineamenti significativi con la sequenza "query", come prima cosa viene visualizzata la descrizione della sequenza del database, che contiene un link, da cui si arriva al record di Entrez relativo a quella sequenza. Sotto la descrizione è indicata la lunghezza in basi della sequenza completa (confrontabile poi con la lunghezza dell allineamento. Successivamente vengono visualizzati il o gli allineamenti di questa sequenza con la sequenza "query". Per ciascun allineamento è indicato: "Score": è il punteggio dell'allineamento; "Expect": è l'e value dell'allineamento; "Identities": è il numero di basi identiche / la lunghezza dell'allineamento in questione; tra parentesi è indicata la risultante percentuale di identità su quella lunghezza di allineamento; "Gaps": indica il numero di gap presenti nell'allineamento / la lunghezza dell'allineamento in questione; tra parentesi è indicata la risultante percentuale di gap su quella lunghezza di allineamento; "Strand": indica l'orientamento della sequenza "query" rispetto alla sequenza del database con cui si allinea. Successivamente si ha l'allineamento vero e proprio tra la sequenza "query" e la sequenza del database in questione, denominata "Sbjct". I numeri indicano la posizione delle basi all'interno delle rispettive sequenze. Se in una data posizione dell'allineamento la base nella sequenza "query" e la corrispondente della sequenza del database coincidono, nella riga tra le due sequenze compare il carattere " ". Quando tale carattere non è presente significa che, in quella posizione dell'allineamento, la base nella sequenza "query" e la corrispondente della sequenza del database sono diverse oppure che una delle due sequenze presenta un gap. Osserviamo i risultati nel nostro caso Dall osservazione della rappresentazione grafica degli allineamenti possiamo vedere che c è un unica sequenza che dimostra altissima similarità con la nostra sequenza query, che è, naturalmente, la sequenza query stessa! Ciò è ovvio, in quanto la sequenza query stessa è depositata nel database nr/nt. Osserverò quindi un identità del 100% senza gap. Glia altri risultati dimostrano e-value molto molto minore e lunghezza dell allineamento molto breve. Notiamo brevemente i risultati e vedrete che la maggior parte dei risultati non hanno nulla a che fare con mitilo e sembrano quasi essere il risultato di similarità casuali. Scorrendo la tabella ritroviamo però qualche match che forse potrebbe corrispondere ad un hit significativo: difatti ci sono alcuni risultati che riguardano Crassostrea gigas (un ostrica, quindi un organismo non poi così lontano da mitilo) che oltretutto contengono anche la sigla C1q nel titolo. Ispezionando il risultato nello specifico però possiamo accorgerci che si tratta di una stringa relativamente breve di nucleotidi (comparata all intera sequenza query) con identità relativamente bassa. Teniamo a mente questi risultati e proviamo a passare al BLASTp.

6 FASE 4 Ricerca di similarità di una sequenza proteica utilizzando il programma BLASTP Recuperiamo la sequenza della proteina codificata dall RNA messaggero che abbiamo utilizzato fino ad ora. Ormai dovreste essere in grado di farlo con semplicità, cliccando sul link protein dalla scheda della sequenza. L accession ID della proteina è CBX Dalla pagina che si presenta scegliete il link (verso il centro della pagina): "protein blast". Si arriva così alla pagina del sottoprogramma di BLAST BLASTP che effettua una ricerca di similarità utilizzando come "query" una sequenza aminoacidica e come database un database anch esso aminoacidico. Incollate la sequenza aminoacidica nella casella di input ; come database su cui eseguire la ricerca ("Database") lasciamo "nr" (non-redundant protein sequences) (uno dei database di proteine a disposizione, sempre non ridondante). Prima di cliccare sul tasto "BLAST", posto poco sotto la casella di input per inoltrare la richiesta al server dell NCBI, osserviamo alcune altre caratteristiche della pagina, che la differenziano da quella del BLASTn. Program selection ci offre una serie di algoritmi alternativi: -BLASTp: la versione standard, che useremo ora. -PSI-BLAST (Position-Specific Iterated BLAST), di cui parleremo nella prossima lezione. Permette di creare una PSSM (position-specific scoring matrix) sulla base dei risultati di un primo BLAST per poi reiterare l analisi e renderla più specifica. -PHI-BLAST (Pattern Hit Initiated BLAST): è un BLAST che limita gli allineamenti del blast a quelli che matchano un determinato pattern nella sequenza query. -DELTA-BLAST (Domain Enhanced Lookup Time Accelerated BLAST), simile a PSI-BLAST, ma che si appoggia su un database di domini conservati per la reiterazione della ricerca. Altra differenza che si può notare nella sezione Algorithm parameters è la dimensione di word size sulla base di quello che avete imparato a lezione dovreste capire il motivo di questa differenza rispetto a BLASTn. Ancora più importante, nel campo Scoring parameters è la possibilità di selezionare una matrice nel campo matrix. Da qui potete selezionare le matrici PAM e BLOSUM di cui avete parlato a lezione. A questo punto, senza modificare alcun parametro, clicchiamo su BLAST ed osserviamo i risultati. FASE 6 Interpretazione dei risultati di BLASTp La pagina dei risultati si può dividere in cinque parti (dall alto in basso), del tutto equivalenti a quelle dei risultati di BLASTN visti precedentemente. Esistono tuttavia alcune differenze osserviamole. Per ciascun allineamento è indicato, oltre ad "Identities", anche Positives": è il numero di aminoacidi identici più il numero di aminoacidi simili / la lunghezza dell'allineamento in questione; tra parentesi è indicata la risultante percentuale su quella lunghezza di allineamento; due

7 aminoacidi vengono definiti simili in base alla matrice utilizzata per l'allineamento (nel nostro caso BLOSUM62) Nel graphic summary poi è presente un show conserved domains. Vedremo tra poco di che cosa si tratta. Ma guardiamo i risultati: si trovano ora moltissime sequenze con similarità, e lungo quasi l intera sequenza. Sapete dare una spiegazione del motivo per cui questo avviene con un BLASTp ma non con un BLASTn? Proviamo a fare un ulteriore passo: torniamo alla homepage di BLASTp e limitiamo la nostra ricerca introducendo dei filtri: 1)nel menù a tendina database selezioniamo un database più piccolo, UniprotKB (che come ricorderete comprende solo un subset di proteine la cui sequenza è stata validata). 2) ESCLUDIAMO dalla ricerca mitilo e non solo, escludiamo tutti i molluschi bivalvi. Nel campo organism scriviamo Bivalvia e selezioniamo exclude dall apposita opzione sulla destra. Comparato ai risultati del BLASTn, come è spiegabile il fatto che otteniamo tutti questi risultati significativi nonostante la ricerca effettuata sia stata decisamente più stringente? FASE 7 Casi particolari (BLASTx, tblastn) Abbiamo finora visto solmente dei casi molto semplici (BLASTp e BLASTn). Ma esistono numerosi altre funzionalità che il BLAST può offrire. Ad esempio evidenziare il numero di esoni presenti in un gene che codifica per una proteina. -Ad esempio selezioniamo la proteina teletonina, che abbiamo già visto nella scorsa lezione (NP_ ). Dobbiamo scegliere attentamente il tipo di BLAST, che in questo caso sarà un tblastn (pensate ai passaggi necessari per la traduzione in proteina di sequenze nucleotidiche). Il database da selezionare è Refseq (reference genomic sequences), e specifichiamo anche Homo sapiens nel campo organism. Quanti introni interrompono la sequenza condificante la proteina? Sapete individuarne la lunghezza approssimativamente? Altro caso è quello in cui ho a disposizione una sequenza nucleotidica di cui non so nulla a parte il fatto che sia un mrna messaggero altamente espresso in un protozoo:

8 ATGAGCGGTCCATTAGTGGGGGTGGCCATTAACGACAAGTCTGCCAGGTTGGCGCGGCGTTACGCCCTTG AGTCCAACTATGACGTTGCGGTGGCCTTCTACACGGGGCTCGACAAGGATTTTGAGGTGTACATGGAGTG CTGCGAAGACGCTTCTGAGCGGGCCCGCTGGGCTCTCCTGCGTGAGAAGATCGCCGAGGAGTGCTCTCTC GTACGCTCCATCCAGGAGGAGCTCAAGGCGCTAGTGAACCCGGTGGAGGCGGCGCGGCTGGAACGTGCGC AGCAGGGTGACAGCGGCGTGGCGCAAGTGTCGCCGCCCAGGCCTCGCGTGGCACGTGACTCGTATCCAGG ACGTGCAGCAACGACACGGCCCGCGCGCCCCACCGGTTTCCGAGCAACCAACACGGCTACCTCGGCCTCG CCCCCGCCGGCCCTTCACCGCGCCGCAGAGAGTGCCGGGGCGCTCAACCAGGTGCTATATGGAGATAAAG ATCGATTTGGCCCTCCAGAGGGGCCAGCTATCAAGCCGCAGCCGCGGCCAGGTGGAGTGTCCAAGCCATC ACAACGCCACAGCTCCCCTGCTTTTCGCAGGGGTGCACCTGCAGGGGGTGCATTGACAAAGCCGTCCTCT CCTCTTAGTAACGCCAAGGCTAAGGTGGTCACGCGGCGTGCAGAGAAACCCGCGGACGGTGGCGGACGTC GTCAGGGAACGCGGACCACTGTCCCGCGTTTTGCTCCACGCAGTGGAGAAGAAGAGTTAGTCTCACTCAT CGAGGCGGACATGCACGTTGGCCCAACGTCCTTGTCGTGGGCTGATATTGCTGGGCTAGAAGAGGCCAAA GGGCTACTTGAGGAGGCTGTTGTCTACCCGGTGCTGATGCCGGATTACTATCAGGGAATCCGGCGACCAT GGAAGGGGGTTCTCCTGTACGGGCCACCTGGGACGGGAAAAACAATGCTCGCTAAGGCGGTCGCGTCGGA GTGCAACACAACTTTCTTCAATATCTCACCCGCTACCTTAACCAGTAAGTGGCGCGGTGATAGCGAGAAA CTTATCCGGATTCTTTTTGAGATGGCACGACATTACGCACCGAGTACCATATTTATTGACGAAATTGATT CCCTGTGTGGGCAGCGGGGAGATGGGGGCGAGCATGAGGCCTCGCGCCGTGCGAAAGGGACGTTACTAGC CCAGATGGATGGTGTTGGTGTTGATCCTGGAAAGATAGTCATGGTTTTGGGCGCCACAAATCATCCGTGG TCTATCGACGAGGCGATGCGTCGCCGATTGGAGAAACGTATATACATTCCTCTTCCAGATTTCAACGATC GTGTGGAGCTCTTCCGCATCAACACCCAATCGCTGAAGTTGTCTTCCGACGTGGACTTTAAACGCCTGTC GACGATGCTGGAGGGTAGACACTACAGTTGTGCCGACATTACAAATCTAGTGCGTGACGCGGCGATGATG ACGATGCGGCGCTTCAGGGAGGAAATGGACAAGTCAGAGCTCAAACGACGCGCGGCAGAAATTGGCAAGC TGGTGGCAGACCAGCCAACGACTATGAATGACTTCCTGAGTGCTGTGAAGAATGTGCCGAGCAGCGTCAA CGTGGAGCAGATCGTGAAGTTCGAGAAGTGGAAGAAAGAGTTCGAGACAAACGTGTAG Posso confrontare questa sequenza con un database proteico di riferimento, magari UniprotKB che racchiude proteine la cui funzione è stata già più o meno definita. Naturalmente in questo caso dovrò selezionare BLASTx. A quale funzione può essere ricondotta la proteina codificata dal messaggero ignoto? FASE 8 Allineamento tra due sequenzetramite Blast2seq Dalla pagina dei risultati di BLASTP vista precendentemente per la proteina di mitilo individuare l'allineamento di MgC1q97 con la proteina adiponectin [Macaca fuscata], che ha accession ID BAG Cliccate sul link che porta al record di Entrez relativo e recuperarne la sequenza aminoacidica in formato FASTA. Siamo interessati a capire qualcosa di più sulla similarità tra questa sequenza e la sequenza query. Ad esempio, dove è concentrata la similarità? Una sequenza è decisamente più lunga dell altra, quindi è intuitivo che quella di mitilo (la più lunga) contiene una porzione di sequenza aggiuntiva e noi vogliamo capire quale è. Dalla pagina principale del BLASTp, sotto la finestra in cui incollare la sequenza, possiamo selezionare il box Align two or more sequences. Comparirà una seconda finestra in cui sarà possibile incollare una seconda sequenza da confrontare con la prima, tramite uno strumento noto con il nome Blast2seq. Incolliamo la sequenza di mitilo CBX nella prima finestra e quella di macaco (BAG ) nella seconda. NOTA BENE: è possibile incollare anche solamente l accession ID delle 2 sequenze.

9 Cerchiamo di interpretare l output dal campo alignments l output grafico apparentemente non ci permette di capire esattamente quale sia la situazione! Provate ora a cliccare su Dot matrix view. Il grafico traccia una retta nelle regioni in cui c è un allineamento significativo tra le due sequenze. Sugli assi X e Y sono riportate le posizioni (in questo caso in residui ammino acidici) delle due sequenze in esame. Pertanto, le corrispondenze corrispondono a rette con coefficienti angolari positivi. Laddove la retta è spezzata e si sposta con uno scarto c è un gap nell allineamento. Inversioni (solo in sequenze nucleotidiche) saranno indicate da segmenti di retta con coefficiente angolare negativo. Cosa vi potete aspettare invece nel caso di ripetizioni? Le tre rette parallele che riuscite ad identificare a che cosa corrispondono nel campo alignments? Avete qualche ipotesi per spiegarvi il motivo di questa particolare rappresentazione nel caso dell allineamento tra la sequenza di mitilo e quella di macaco? FASE 9 Individuazione di domini proteici NOTA BENE: Anticiperemo una breve parte pratica che farà riferimento ad una parte teorica che tratteremo nella prossima lezione. La determinazione della presenza e della posizione dei domini proteici può essere estremamente utile per darci un aiuto fondamentale a comprendere meglio i nostri risultati. Per dominio proteico si intende una porzione conservata di una proteina (e quindi anche un unità strutturale) che può evolvere ed esistere separatamente dal resto della catena proteica. DI solito un dominio proteico ha anche una determinata struttura che è evolutivamente conservata ed una funzione ben determinata. Ad esempio un dominio EF-hand lega ioni calcio. SI tratta di un dominio estremamente comune (presente in migliaia di proteine diverse), che mantiene questa funzione indipendentemente dalla localizzazione subcellulare e da eventuali attività catalitiche e di altro tipo di legame del resto della proteina a cui è associato. NOTA BENE: un concetto simile può essere trasportato anche sulle sequenze nucleotidiche, che spesso sono caratterizzate da determinati motivi e sequenze consensus che svolgono una determinata funzione. Ad esempio immaginiamo promotori, enhancer, repressori, la stessa TATA box, ma anche siti di splicing. Ognuna di queste sequenze deve poter essere riconosciuta da determinate proteine (ad esempio fattori di trascrizione, enzimi deputati al taglio, ecc.) e pertanto devono avere un consensus relativamente conservato e, talvolta, corrispondono a dei ripiegamenti strutturali ben determinati. Oggi, per semplicità, ci occuperemo di tools dedicati all identificazione di domini proteici, ma tenete a mente che esistono anche tools per identificare motivi conserrvati anche in sequenze nucleotidiche e sono fondamentali, ad esempio per la predizione di geni, trascritti, introni ed esoni nei genomi. Interpro Interpro è una risorsa bioinformatica, sviluppata all'ebi, che consente di ricercare informazioni funzionali e strutturali relative a una proteina o a una famiglia di proteine interrogando contemporaneamente più banche dati, distribuite su calcolatori diversi e strutturate in modo differenti.

10 I Database integrati in InterPro sono: PROSITE, PRINTS, Pfam, ProDom, SMART, TIGRFAMs, PIR, SUPERFAMILY, Gene3D, PANTHER e HAMAP. Tutti questi database sono anche consultabili separatamente e presentano delle schede proprie, Interpro ha proprio il merito di collegare ed uniformare I risultati delle ricerche in questi database. Colleghiamoci a e incolliamo nella finestra la sequenza di mitilo. Apriamo un altra finestra ed incolliamo anche quella di macaco. Aspettiamo qualche decina di secondi fino al completamento dell analisi e commentiamo i risultati. I risultati sono organizzati in Entry type, divisi in tre categorie: 1) Family 2) Domains 3) Repeats. Family identifica una famiglia di proteine accomunate da una funzione comune o da un origine evolutiva comune. In sostanza, le entry di questo tipo dovrebbere essere di aiuto per identificare grossi gruppi di sequenze ortologhe e paraloghe con un buon grado di confidenza e di solito le annotazioni ricoprono l intera sequenza. Molto spesso la similarità di una sequenza non è sufficientemente elevata per raggiungere una classificazione così affidabile e pertanto questo campo talvolta è vuoto. Domains ci riporta i domini proteici identificati (se presenti) e quindi si dovrebbe trattare di annotazioni che comprono soltanto una parte della sequenza (corrispondente proprio al dominio identificato). E molto comunque ed assolutamente possibile ritrovare più domini in una stessa proteina, talvolta anche sovrapposti gli uni agli altri. Repeats presenta eventuali sequenze ripetute trovate nella sequenza. Un esempio classico è il collagene, non un vero e proprio dominio strutturale, ma una sequenza a bassa complessità ripetitiva con elevata percentuale di residue di glicina e prolina. C è poi una sezione Sites che riporta altre annotazioni di siti e domini non integrati nelle precedenti tre categorie, ma non scenderemo molto nel dettaglio di questa categoria. Sappiate però che in questa sezione sono integrati i risultati di SignalP (per la predizione del peptide segnale per la secrezione) e TMHMM (per la predizione di domini transmembrana). In questa lezione tralasciamo quindi tutte queste informazioni accessorie raccolte nel campo Unintegrated, che possiamo quindi deselezionare dal box presente a sinistra. Passiamo ora all interpretazione dei risultati: quali e quanti domini sono identificabili nelle due sequenze: vi potete spiegare ora meglio il dot box plot visto prima per il Blast2seq? Notiamo alcune cose importanti: 1) Domini e famiglie sono identificati da sigle identificative precedute dal prefisso IPR. E possibile cliccare sui link corrispondenti per trovare più informazioni a riguardo di questi domini e anche le relazioni con altri domini ed il numero di proteine annotate contenenti i domini in questione nei database pubblici. 2) Ad ogni dominio IPR corrispondono svariate entry di altri database: ad esempio, al dominio C1q corrispondono entry con prefissi PF, PR, PS e SM. Cliccando su questi link verrete riportati a schede esterne dei database SMART, PFAM, Prosite, ecc.

11 3) Esistono in alcuni casi domini sovrapposti, come il C1q ed il TNF-like in questo caso. Questo perché alcuni sono domini più generalizzati, altri ben più specifici. Ina ltre parole un dominio C1q sarà sempre riconosciuto come TNF-like, ma non viceversa. Ma ispezioniamo più nel detaglio le informazioni contenute in Interpro: prendiamo come esempio appunto, il dominio C1q. Cliccando sul nome del dominio ( possiamo raccogliere molte informazioni sulle sue funzioni, sulla sua distribuzione tassonomica, sull associazione con altri domini, ecc. Ad esempio sulla sinistra Proteins matched ci dice che sono registrate oltre 5000 proteine contenenti questo dominio nei database pubblici. Ci possiamo quindi chiedere se il nostro caso, con tre domini C1q in serie, sia l organizzazione proteica più frequentemente osservata oppure no: cliccando su domain architechtures posso verificarlo. Infine da species posso osservare se vi sia un disribuzione tassonomica uniforme o meno negli organismi viventi. Con un pò di conoscenza di tassonomia è possibile trovare quante siano le proteine con domini C1q presenti nell uomo (per nostra fortuna già riassunte in tabella) o in mitilo.

BLAST. W = word size T = threshold X = elongation S = HSP threshold

BLAST. W = word size T = threshold X = elongation S = HSP threshold BLAST Blast (Basic Local Aligment Search Tool) è un programma che cerca similarità locali utilizzando l algoritmo di Altschul et al. Anche Blast, come FASTA, funziona: 1. scomponendo la sequenza query

Dettagli

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini)

Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Esercizio: Ricerca di sequenze in banche dati e allineamento multiplo (adattato da una lezione del Prof. Paiardini) Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni

Dettagli

Ricerche con BLAST (Laboratorio)

Ricerche con BLAST (Laboratorio) Laboratorio di Bioinformatica I Ricerche con BLAST (Laboratorio) Dott. Sergio Marin Vargas (2014 / 2015) NCBI BLAST BLAST: Basic Local Alignment Search Tool http://blast.ncbi.nlm.nih.gov/blast.cgi NCBI

Dettagli

ESERCITAZIONE 3. OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST

ESERCITAZIONE 3. OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST ESERCITAZIONE 3 OBIETTIVO: Ricerca di omologhe mediante i programmi FASTA e BLAST L'esercitazione prevede l'utilizzo di risorse web per effettuare ricerche di similarità con la proteina GRB2 (growth factor

Dettagli

Bioinformatica ed applicazioni di bioinformatica strutturale!

Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica ed applicazioni di bioinformatica strutturale! Bioinformatica! Le banche dati! Programmi per estrarre ed analizzare i dati! I numeri! Cellule nell uomo! Geni nell uomo! Genoma umano Il dogma

Dettagli

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento

FASTA: Lipman & Pearson (1985) BLAST: Altshul (1990) Algoritmi EURISTICI di allineamento Algoritmi EURISTICI di allineamento Sono nati insieme alle banche dati, con lo scopo di permettere una ricerca per similarità rapida anche se meno accurata contro le migliaia di sequenze depositate. Attualmente

Dettagli

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST

Quarta lezione. 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Quarta lezione 1. Ricerca di omologhe in banche dati. 2. Programmi per la ricerca: FASTA BLAST Ricerca di omologhe in banche dati Proteina vs. proteine Gene (traduzione in aa) vs. proteine Gene vs. geni

Dettagli

Algoritmi di Allineamento

Algoritmi di Allineamento Algoritmi di Allineamento CORSO DI BIOINFORMATICA Corso di Laurea in Biotecnologie Università Magna Graecia Catanzaro Outline Similarità Allineamento Omologia Allineamento di Coppie di Sequenze Allineamento

Dettagli

Le sequenze consenso

Le sequenze consenso Le sequenze consenso Si definisce sequenza consenso una sequenza derivata da un multiallineamento che presenta solo i residui più conservati per ogni posizione riassume un multiallineamento. non è identica

Dettagli

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche

InfoBioLab I ENTREZ. ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche InfoBioLab I ES 1: Ricerca di sequenze di aminoacidi in banche dati biologiche Esercizio 1 - obiettivi: Ricerca di 2 proteine in ENTREZ Salva i flat file che descrivono le 2 proteine in formato testo Importa

Dettagli

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random

Z-score. lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random Z-score lo Z-score è definito come: Z-score = (opt query - M random)/ deviazione standard random è una misura di quanto il valore di opt si discosta dalla deviazione standard media. indica di quante dev.

Dettagli

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche)

UNIVERSITÀ DEGLI STUDI DI MILANO. Bioinformatica. A.A semestre I. Allineamento veloce (euristiche) Docente: Matteo Re UNIVERSITÀ DEGLI STUDI DI MILANO C.d.l. Informatica Bioinformatica A.A. 2013-2014 semestre I 3 Allineamento veloce (euristiche) Banche dati primarie e secondarie Esistono due categorie

Dettagli

Allineamenti a coppie

Allineamenti a coppie Laboratorio di Bioinformatica I Allineamenti a coppie Dott. Sergio Marin Vargas (2014 / 2015) ExPASy Bioinformatics Resource Portal (SIB) http://www.expasy.org/ Il sito http://myhits.isb-sib.ch/cgi-bin/dotlet

Dettagli

Telerilevamento. Esercitazione 5. Classificazione non supervisionata. Apriamo l immagine multi spettrale relativa alla zona di Feltre che si trova in:

Telerilevamento. Esercitazione 5. Classificazione non supervisionata. Apriamo l immagine multi spettrale relativa alla zona di Feltre che si trova in: Telerilevamento Esercitazione 5 Classificazione non supervisionata Lo scopo di questa esercitazione è quella di effettuare una classificazione non supervisionata di un immagine SPOT5 acquisita sull area

Dettagli

Laboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015)

Laboratorio di Bioinformatica I. Parte 2. Dott. Sergio Marin Vargas (2014 / 2015) Laboratorio di Bioinformatica I Banche dati Parte 2 Dott. Sergio Marin Vargas (2014 / 2015) Google Scholar https://scholar.google.it/ E un motore di ricerca di Google, specializzato nella ricerca di articoli

Dettagli

Vai al sito: Incolla nel box vuoto la sequenza nucleotidica

Vai al sito:  Incolla nel box vuoto la sequenza nucleotidica Identificare il gene a cui appartiene la sequenza (sonda) e la sua posizione sul cromosoma. Per raggiungere l obiettivo della prima parte dell attività devi usare il software BLAT (BLAST- Like Alignment

Dettagli

Ricerca di omologia di sequenza

Ricerca di omologia di sequenza Ricerca di omologia di sequenza RICERCA DI OMOLOGIA DI SEQUENZA := Data una sequenza (query), una banca dati, un sistema per il confronto e una soglia statistica trovare le sequenze della banca più somiglianti

Dettagli

Portale Lavoro Per Te

Portale Lavoro Per Te Portale Lavoro Per Te Linee Guida Funzione Dichiarazione Neet INDICE Introduzione... 3 1. Funzione Dichiarazione Neet... 4 1.1 ACCESSO AL PORTALE LAVORO PER TE... 4 1.2 SCHERMATA INIZIALE FUNZIONE DICHIARAZIONE

Dettagli

Corso sul PACCHETTO OFFICE. Modulo Access

Corso sul PACCHETTO OFFICE. Modulo Access Corso sul PACCHETTO OFFICE Modulo Access Docente: dott. Marco Cardani Lezione 2 Come creare un database 1 2 Come creare un database Impareremo ora come creare un nuovo database in modo da raggiungere un

Dettagli

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA.

Il progetto Genoma Umano è iniziato nel E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Il progetto Genoma Umano è iniziato nel 1990. E stato possibile perchè nel 1986 era stato sviluppato il sequenziamento automatizzato del DNA. Progetto internazionale finanziato da vari paesi, affidato

Dettagli

FASTA. Lezione del

FASTA. Lezione del FASTA Lezione del 10.03.2016 Omologia vs Similarità Quando si confrontano due sequenze o strutture si usano spesso indifferentemente i termini somiglianza o omologia per indicare che esiste un rapporto

Dettagli

Guida al primo utilizzo di EasyArchiviazione INTERFACCIA INIZIALE

Guida al primo utilizzo di EasyArchiviazione INTERFACCIA INIZIALE Guida al primo utilizzo di EasyArchiviazione EasyArchiviazione è un servizio basato su Cloud che permette l archiviazione, la ricerca e la conservazione di documenti informatici, quali documento Office,

Dettagli

Dipartimento Politiche Sociali e della Salute OSSERVATORIO SOCIALE SULLA CONCERTAZIONE TERRITORIALE. Manuale del software Utente Lettore Vers. 5.

Dipartimento Politiche Sociali e della Salute OSSERVATORIO SOCIALE SULLA CONCERTAZIONE TERRITORIALE. Manuale del software Utente Lettore Vers. 5. Dipartimento Politiche Sociali e della Salute OSSERVATORIO SOCIALE SULLA CONCERTAZIONE TERRITORIALE Manuale del software Utente Lettore Vers. 5.0 Novembre 2016 Indice Tre passaggi per entrare nel programma...

Dettagli

Modello computazionale per la predizione di siti di legame per fattori di trascrizione

Modello computazionale per la predizione di siti di legame per fattori di trascrizione Modello computazionale per la predizione di siti di legame per fattori di trascrizione Attività di tirocinio svolto presso il Telethon Institute of Genetics and Medicine Relatori Prof. Giuseppe Trautteur

Dettagli

GB informazioni e freeware

GB informazioni e freeware GB informazioni e freeware Informazioni per PC, internet, software, freeware e tutorial Home Programmi Informazioni Passatempo Siti utili Aggiornamenti sito News Posizione nel sito : Home >> Informazioni

Dettagli

MANUALE PER IL REDATTORE DELL UFFICIO STAMPA

MANUALE PER IL REDATTORE DELL UFFICIO STAMPA MANUALE PER IL REDATTORE DELL UFFICIO STAMPA INDICE: 1 CREA AGENZIA DI STAMPA 2 CREA NOTIZIE DEL GIORNO 3 CREA EVENTO NELL AGENDA In appendice: COME UTILIZZARE GLI STRUMENTI DI INSERIMENTO TESTO Entra

Dettagli

Allineamento locale: BLAST

Allineamento locale: BLAST Allineamento locale: BLAST BLAST (Basic Local Alignment Search Tool) è il più diffuso programma di allineamento locale delle sequenze. Per vari anni il metodo FASTA (da non confondere con l omonimo formato)

Dettagli

Bioinformatica. Analisi del genoma

Bioinformatica. Analisi del genoma Bioinformatica Analisi del genoma GABRIELLA TRUCCO CREMA, 5 APRILE 2017 Cosa è il genoma? Insieme delle informazioni biologiche, depositate nella sequenza di DNA, necessarie alla costruzione e mantenimento

Dettagli

CREARE UNO SPAZIO DEI NOMI DFS (WINDOWS SERVER 2003 R2)

CREARE UNO SPAZIO DEI NOMI DFS (WINDOWS SERVER 2003 R2) Date: 19/09/2012 Procedure: Creare uno spazio dei nomi DFS (Windows Server 2003 R2) Source: LINK Permalink: LINK Created by: HeelpBook Staff Document Version: 1.0 CREARE UNO SPAZIO DEI NOMI DFS (WINDOWS

Dettagli

Catalogo Elettronico Mercedes Benz & Smart Manuale sulla Navigazione

Catalogo Elettronico Mercedes Benz & Smart Manuale sulla Navigazione Catalogo Elettronico Mercedes Benz & Smart Manuale sulla Navigazione Indice Manuale Introduzione Navigazione per VIN (n di telaio) Caratteristiche prodotto Utilizzo carrello ( Lista Spesa ) Funzionalità

Dettagli

Access 2007 Colonna di ricerca

Access 2007 Colonna di ricerca Pagina 1 di 7 Lezioni on line -> Gestire i dati Access 2007 Colonna di ricerca Quando si riempiono i campi dei record che formano una tabella, può essere utile e comodo poter scegliere, in un elenco dei

Dettagli

4. Ricerca di sequenze in banche dati e allineamento multiplo

4. Ricerca di sequenze in banche dati e allineamento multiplo 4. Ricerca di sequenze in banche dati e allineamento multiplo Collegatevi al sito www.ncbi.nlm.nih.gov/blast. Apparirà una pagina nella quale le versioni di BLAST disponibili sono organizzate in base al

Dettagli

Allineamento e similarità di sequenze

Allineamento e similarità di sequenze Allineamento e similarità di sequenze Allineamento di Sequenze L allineamento tra due o più sequenza può aiutare a trovare regioni simili per le quali si può supporre svolgano la stessa funzione; La similarità

Dettagli

RELAZIONE di BIOLOGIA MOLECOLARE

RELAZIONE di BIOLOGIA MOLECOLARE NOME: Marini Selena MATRICOLA: 592330 RELAZIONE di BIOLOGIA MOLECOLARE CHE ORGANISMO MODELLO È DICTYOSTELIUM? CHE RISORSE BIOINFORMATICHE AGEVOLANO I RICERCATORI CHE LO STUDIANO? Dictyostelium è un genere

Dettagli

Tesina di Biologia Molecolare II

Tesina di Biologia Molecolare II MELATO GIULIA 595033 Tesina di Biologia Molecolare II Mostra un albero filogenetico con la relazione tra Uomo, Topo e Ratto. Che banca dati è disponibile per quest'ultimo organismo? Descrivi alcune caratteristiche

Dettagli

BLAST: Basic Local Alignment Search Tool

BLAST: Basic Local Alignment Search Tool BLAST: Basic Local Alignment Search Tool 1 Outline della lezione di oggi BLAST Uso pratico Algoritmo Strategie Trovare proteine lontanamente legate: PSI-BLAST 2 Problema con gli algoritmi dinamici Gli

Dettagli

Nella finestra successiva dovremo cercare l immagine che vogliamo appiccicare nel file.

Nella finestra successiva dovremo cercare l immagine che vogliamo appiccicare nel file. Come realizzare i disegni in Autocad partendo da un immagine L obbiettivo di questo articolo, è quello di poter avere a disposizione le linee di costruzione in qualsiasi scala, senza dover fare decine

Dettagli

Cloud GDrive, Dropbox

Cloud GDrive, Dropbox Cloud GDrive, Dropbox Lezione 3 Lavorare con Dropbox Video Dropbox permette, oltre all'archiviazione di file in rete, di lavorare direttamente all'interno del servizio sul web, attraverso l'uso dell'applicazione

Dettagli

Catalogo Elettronico Mercedes Benz & Smart

Catalogo Elettronico Mercedes Benz & Smart Catalogo Elettronico Mercedes Benz & Smart Manuale sulla Navigazione Release 1.0 Indice Manuale Introduzione Navigazione per VIN (n di telaio) Caratteristiche prodotto Utilizzo carrello ( Lista Spesa )

Dettagli

Studio delle successioni con il software

Studio delle successioni con il software Studio delle successioni con il software Abbiamo visto due possibili definizioni per alcune successioni: diretta e per ricorrenza (o ricorsiva). Ricordiamo che la successione delle somme dei primi n numeri

Dettagli

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione La mappatura dei geni umani SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione Un grande impulso alla costruzione di mappe genetiche è stato dato da le tecniche della

Dettagli

8. Sovrapposizione e confronto di strutture proteiche

8. Sovrapposizione e confronto di strutture proteiche 8. Sovrapposizione e confronto di strutture proteiche In questa esercitazione utilizzeremo il programma SwissPdbViewer (versione 4.0.1) per effettuare la sovrapposizione e il confronto di strutture proteiche.

Dettagli

La ricerca di similarità: i metodi

La ricerca di similarità: i metodi La ricerca di similarità: i metodi Pairwise alignment allineamenti a coppie 1. Analisi della matrice a punti (dot matrix) 2. Programmazione dinamica (dynamic programming) allineamenti locale e globale.

Dettagli

LE MASCHERE. Maschera standard. Maschera semplice. Questa maschera però non consente di nascondere alcuni campi e visualizza i record uno ad uno.

LE MASCHERE. Maschera standard. Maschera semplice. Questa maschera però non consente di nascondere alcuni campi e visualizza i record uno ad uno. LE MASCHERE Inserire i dati direttamente in tabella non è agevole. Questa operazione normalmente viene svolta utilizzando le maschere. I vantaggi offerti dalle maschere sono: Aspetto grafico più accattivante

Dettagli

Laboratorio di Elementi di Bioinformatica

Laboratorio di Elementi di Bioinformatica Laboratorio di Elementi di Bioinformatica Laurea Triennale in Informatica (codice: E3101Q116) AA 2016/2017 Formato GTF per annotare un gene Docente del laboratorio: Raffaella Rizzi 1 GTF (Gene Transfer

Dettagli

Modifica Pagina Web. Pulsante LogOut: cliccare per uscire dall'ambiente di amministrazione

Modifica Pagina Web. Pulsante LogOut: cliccare per uscire dall'ambiente di amministrazione Modifica Pagina Web Dopo aver effettuato la Login con la Username e la Password fornitavi (alla url http:// [nomedominio]/account oppure attraverso la pagina login se presente sul sito) vi troverete all'interno

Dettagli

EXCEL. Marco Lucifora

EXCEL. Marco Lucifora EXCEL Marco Lucifora Microsoft Excel è un elaboratore di fogli di calcolo. Il programma consente di creare tabelle, inserire formule matematiche e creare grafici. Gli usi a cui si presta sono molteplici

Dettagli

Sommario. Presentazione dell opera Ringraziamenti

Sommario. Presentazione dell opera Ringraziamenti Sommario Presentazione dell opera Ringraziamenti XI XII Capitolo 1 Introduzione alla bioinformatica 1 1.1 Cenni introduttivi 1 1.2 Pietre miliari della bioinformatica 2 1.3 Infrastrutture bioinformatiche

Dettagli

PROCEDURA DI ESTRAZIONE STAMPA REPORT E LETTERE DI SOLLECITO (serial 44)

PROCEDURA DI ESTRAZIONE STAMPA REPORT E LETTERE DI SOLLECITO (serial 44) 1 Sistema bibliotecario di Ateneo PROCEDURA DI ESTRAZIONE STAMPA REPORT E LETTERE DI SOLLECITO (serial 44) a cura del SAB Servizio Automazione Biblioteche e del Gruppo di lavoro per la gestione amministrativa

Dettagli

Creare una gif animata con GIMP!

Creare una gif animata con GIMP! Creare una gif animata con GIMP! 1) Aprire l immagine utilizzando GIMP! (dopo aver avviato il programma, cliccare su FILE apri selezionare il file desiderato) L immagine viene aperta come sfondo. Tra parentesi

Dettagli

Folium. Quick guide: gestione documentale e fascicolazione elettronica. Dicembre FOLIUM: Gestione documentale e fascicolazione elettronica

Folium. Quick guide: gestione documentale e fascicolazione elettronica. Dicembre FOLIUM: Gestione documentale e fascicolazione elettronica Folium Quick guide: gestione documentale e fascicolazione elettronica Dicembre 05 Premessa La guida veloce viene fornita a corredo delle attività formative d aula ed è concepita con l obiettivo di favorire

Dettagli

Allineamenti Multipli di Sequenze

Allineamenti Multipli di Sequenze Allineamenti Multipli di Sequenze 1 Allineamento multiplo di sequenze: obiettivi di oggi Definire un allineamento multiplo di sequenze; com è generato; comprendere i principali metodi. Introdurre i database

Dettagli

Nota: per aprire un file in elenco è anche possibile fare doppio click con il tasto sinistro del mouse sul file desiderato.

Nota: per aprire un file in elenco è anche possibile fare doppio click con il tasto sinistro del mouse sul file desiderato. La finestra Database Introduzione In questa lezione completiamo l esplorazione della finestra Database. Aprire un database esistente Apriamo il database creato nella lezione precedente: dal menu Start

Dettagli

Esempi di ricerca-dati con Total Materia

Esempi di ricerca-dati con Total Materia www.totalmateria.com/it Esempi di ricerca-dati con Total Materia 1 Forniamo di seguito esempi applicativi riguardanti Total Materia in Edizione WEB, che rappresenta la più complete e avanzata Banca-Dati

Dettagli

La lista dei risultati

La lista dei risultati La lista dei risultati La risposta dell'opac ad una stringa di ricerca inserita dall'utente genera una Lista dei risultati che contiene tanti record quanti ve ne sono nel Catalogo che corrispondono alla

Dettagli

Grafici. 1 Generazione di grafici a partire da un foglio elettronico

Grafici. 1 Generazione di grafici a partire da un foglio elettronico Grafici In questa parte analizzeremo le funzionalità relative ai grafici. In particolare: 1. Generazione di grafici a partire da un foglio elettronico 2. Modifica di un grafico 1 Generazione di grafici

Dettagli

Lezione 6 Richiami di Geometria Analitica

Lezione 6 Richiami di Geometria Analitica 1 Piano cartesiano Lezione 6 Richiami di Geometria Analitica Consideriamo nel piano due rette perpendicolari che si intersecano in un punto O Consideriamo ciascuna di queste rette come retta orientata

Dettagli

MICROSOFT ACCESS IL MODELLO E/R

MICROSOFT ACCESS IL MODELLO E/R MICROSOFT ACCESS IL MODELLO E/R LE ENTITA Le entità di un database sono le singole tabelle che comporranno la struttura del nostro database. Le tabelle sono formate da attributi (o campi) che ne definiscono

Dettagli

Lena Cota Guido Corso di Informatica - II livello. Excel 2003 Formule. Imparare a usare le formule con la pratica

Lena Cota Guido Corso di Informatica - II livello. Excel 2003 Formule. Imparare a usare le formule con la pratica Excel 2003 Formule Imparare a usare le formule con la pratica 1 Cosa sono Uno degli obiettivi principali dei fogli di calcolo è fornire il risultato di operazioni matematiche, dalla semplice somma alle

Dettagli

FlexCMP La piattaforma accessibile per il web 2.0

FlexCMP La piattaforma accessibile per il web 2.0 Manuale Utente FlexCMP La piattaforma accessibile per il web 2.0 FlexCMP è un prodotto di: Idea Futura S.R.L. Via Toscanini 7/2 40055 Castenaso (BO) - Italy Tel.: +39 051 780630 http://www.ideafutura.com

Dettagli

Appunti di Excel per risolvere alcuni problemi di matematica (I parte) a.a

Appunti di Excel per risolvere alcuni problemi di matematica (I parte) a.a Appunti di Excel per risolvere alcuni problemi di matematica (I parte) a.a. 2001-2002 Daniela Favaretto* favaret@unive.it Stefania Funari* funari@unive.it *Dipartimento di Matematica Applicata Università

Dettagli

MODULO 5 ACCESS Basi di dati

MODULO 5 ACCESS Basi di dati MODULO 5 ACCESS Basi di dati MODULO 5 ACCESS Basi di dati Lezione 3 www.mondopcnet.com ARGOMENTI Lezione 3 Relazioni tra tabelle Perché creare le relazioni Tipi di relazioni Come creare le relazioni Integrità

Dettagli

Formattare il testo con gli stili

Formattare il testo con gli stili Formattare il testo con gli stili Capita spesso di dover applicare ripetutamente la stessa formattazione, o anche modificare il colore, le dimensioni e il tipo di carattere, per dare risalto a un testo.

Dettagli

guida dell'utente modulo: [ idocmail ] LA GESTIONE DEI FILTRI e delle REGOLE in idocmail

guida dell'utente modulo: [ idocmail ] LA GESTIONE DEI FILTRI e delle REGOLE in idocmail LA GESTIONE DEI FILTRI e delle REGOLE in idocmail è possibile creare e memorizzare o meno filtri e regole automatiche semplici ed avanzati, oppure ricercare una qualsiasi parola anche parziale presente

Dettagli

Lavorare col programma di scrittura Blocco Note

Lavorare col programma di scrittura Blocco Note Lavorare col programma di scrittura Blocco Note Questa risorsa didattica è stata realizzata dallo staff di Pane e Internet per lo svolgimento di un corso di formazione rivolto ai migranti, organizzato

Dettagli

Perché considerare la struttura 3D di una proteina

Perché considerare la struttura 3D di una proteina Modelling Perché considerare la struttura 3D di una proteina Implicazioni in vari campi : biologia, evoluzione, biotecnologie, medicina, chimica farmaceutica... Metodi di studio della struttura di una

Dettagli

usare le funzioni aritmetiche e logiche di base come. Volgiamo costruire un foglio elettronico in cui registriamo i voti presi

usare le funzioni aritmetiche e logiche di base come. Volgiamo costruire un foglio elettronico in cui registriamo i voti presi 4.3 Funzioni e formule 4.3.1 Funzioni aritmetiche e logiche 4.3.1.1. usare le funzioni aritmetiche e logiche di base come addizione, sottrazione, moltiplicazione, divisione Volgiamo costruire un foglio

Dettagli

ISTRUZIONI PER IL REGISTRO DI CLASSE

ISTRUZIONI PER IL REGISTRO DI CLASSE ISTRUZIONI PER IL REGISTRO DI CLASSE Accedere al modulo docenti del portale Argo (dal sito della scuolaregistro elettronicoregistro Docenti) con username e password. I loghi dei due registri, quello di

Dettagli

DURATA DEL CORSO: 15 LEZIONI (2ore) Tutti i martedì e venerdì dal 14 aprile al 12 giugno

DURATA DEL CORSO: 15 LEZIONI (2ore) Tutti i martedì e venerdì dal 14 aprile al 12 giugno DURATA DEL CORSO: 15 LEZIONI (2ore) Tutti i martedì e venerdì dal 14 aprile al 12 giugno Questo materiale è reperibile a questo indirizzo: http://diego72.altervista.org/corso-informatica-di-base/ PASSWORD:

Dettagli

Uso di base dell ordinamento di dati in Microsoft Excel

Uso di base dell ordinamento di dati in Microsoft Excel Uso di base dell ordinamento di dati in Microsoft Excel L ordinamento dei dati Un foglio elettronico fornisce una funzionalità di ordinamento dei dati che si trovano nelle colonne o nelle righe. Ordinare

Dettagli

nome di un menu per visualizzarlo e poi selezionate facendo clic sul comando che vi interessa.

nome di un menu per visualizzarlo e poi selezionate facendo clic sul comando che vi interessa. 1 (conoscere le basi di Excel) < I controlli della. Finestra > La finestra di apertura di Excel presenta una cartella di lavoro vuota; la finestra del programma occupa tutto lo spazio dello schermo, mentre

Dettagli

Un foglio di una cartella Excel si compone di righe (ciascuna delle. quali è rappresentata da un numero) e di colonne (ciascuna delle

Un foglio di una cartella Excel si compone di righe (ciascuna delle. quali è rappresentata da un numero) e di colonne (ciascuna delle 4.2 Operazioni di base 4.2.1 Inserire i dati 4.2.1.1 Inserire numeri in una cella Un foglio di una cartella Excel si compone di righe (ciascuna delle quali è rappresentata da un numero) e di colonne (ciascuna

Dettagli

Questo materiale è reperibile a questo indirizzo: PAS

Questo materiale è reperibile a questo indirizzo:  PAS Questo materiale è reperibile a questo indirizzo: http://diego72.altervista.org/ PAS Comunicazione elettronica - Libero Posta elettronica Libero Mail Accedere a Libero Mail Accedi da qui Link pagina Pagina

Dettagli

7 - Calibrazione di una mappa in formato raster per n punti

7 - Calibrazione di una mappa in formato raster per n punti 7 - Calibrazione di una mappa in formato raster per n punti 7.1 - Calibrazione con rototraslazione in coordinate assolute Passiamo ora ad un elaborazione diversa della nostra mappa RASTER; procediamo infatti

Dettagli

Si avrà quindi Logical Address e Physical Address

Si avrà quindi Logical Address e Physical Address C1 APPENDICE. SIMULATORE DEGLI INDIRIZZI Permette di svolgere esercizi di traduzione da indirizzi logici a indirizzi fisici. Esempio con tabella delle pagine a 1 livello Tabella delle pagine a 1 livello

Dettagli

Corso sul PACCHETTO OFFICE. Modulo Access

Corso sul PACCHETTO OFFICE. Modulo Access Corso sul PACCHETTO OFFICE Modulo Access Docente: dott. Marco Cardani Lezione 6 I campi di ricerca lookup 1 6 I campi di ricerca lookup Vedremo in questa lezione come agevolare l inserimento dei dati mediante

Dettagli

TESINA INFORMATICA CARTELLA CLINICA IN ACCESS

TESINA INFORMATICA CARTELLA CLINICA IN ACCESS TESINA INFORMATICA CARTELLA CLINICA IN ACCESS Psicologia Clinica e di Comunità Gianmaria Lunetta Enza Cascone Luana Ingrasciotta Chiara Tumino CARTELLA CLINICA IN ACCESS Lo scopo operativo del nostro lavoro

Dettagli

SEE Electrical Expert V4: FAQ

SEE Electrical Expert V4: FAQ SEE Electrical Expert V4: FAQ Inserimento attributi in morsetti logici e fisici INTRODUZIONE Ad un morsetto (che sia esso logico oppure fisico) è possibile aggiungere un attributo passando per il comando

Dettagli

Laboratorio di Bioinformatica I. Parte 1. Dott. Sergio Marin Vargas (2014 / 2015)

Laboratorio di Bioinformatica I. Parte 1. Dott. Sergio Marin Vargas (2014 / 2015) Laboratorio di Bioinformatica I Banche dati Parte 1 Dott. Sergio Marin Vargas (2014 / 2015) Introduzione a NCBI National Center for Biotechnology Information (NCBI) http://www.ncbi.nlm.nih.gov/ NCBI Databases

Dettagli

Stampa Guidata Serie in 19 passi. Creazione di una serie di documenti testualicon la tecnica Stampa Guidata Serie OpenOffice 2.3.0

Stampa Guidata Serie in 19 passi. Creazione di una serie di documenti testualicon la tecnica Stampa Guidata Serie OpenOffice 2.3.0 Stampa Guidata Serie in 19 passi Creazione di una serie di documenti testualicon la tecnica Stampa Guidata Serie OpenOffice 2.3.0 Passo 1 Creazione del foglio di calcolo che servirà come "Sorgente dati".

Dettagli

Come inserire il GEOCODING e la GEOREFERENZIAZIONE di un contenitore fisico

Come inserire il GEOCODING e la GEOREFERENZIAZIONE di un contenitore fisico Come inserire il GEOCODING e la GEOREFERENZIAZIONE di un contenitore fisico 1 INSERIMENTO DEI DATI DI LOCALIZZAZIONE E GEOCODING Immaginiamo di compilare la scheda relativa al CONTENITORE FISICO Chiesa

Dettagli

GBW = gm / (2 pi CL) Figura 1 : Schematico dell ampificatore a trasconduttanza (OTA)

GBW = gm / (2 pi CL) Figura 1 : Schematico dell ampificatore a trasconduttanza (OTA) Analisi Monte-Carlo in ambiente Cadence Le analisi Monte-Carlo sono delle analisi di tipo statistico che consentono di valutare la robustezza di un progetto alle variazioni dei parametri di processo che

Dettagli

GUIDA NUOVA FUNZIONE CARICO FLUSSI. Sommario. Carico Flussi pag. 2 Opzioni pag. 4 Sostituzioni pag. 5 Esiti pag. 7

GUIDA NUOVA FUNZIONE CARICO FLUSSI. Sommario. Carico Flussi pag. 2 Opzioni pag. 4 Sostituzioni pag. 5 Esiti pag. 7 GUIDA NUOVA FUNZIONE CARICO FLUSSI Sommario Carico Flussi pag. 2 Opzioni pag. 4 Sostituzioni pag. 5 Esiti pag. 7 Aggiornamento al 13.10.2016 1 CARICO FLUSSI Questa funzione consente di effettuare l upload

Dettagli

Versione 1.7. Manuale per Creatori Corsi. Parte I: Accesso e Creare Risorse

Versione 1.7. Manuale per Creatori Corsi. Parte I: Accesso e Creare Risorse Versione 1.7 Manuale per Creatori Corsi Parte I: Accesso e Creare Risorse Autore Prof.ssa Antonella Greco Pagina di accesso Per accedere cliccate su Login. Appare 2 Se dovete iscrivervi Siete alla schermata

Dettagli

Come cercare nel computer con le nuove funzionalità di Windows Vista

Come cercare nel computer con le nuove funzionalità di Windows Vista Come cercare nel computer con le nuove funzionalità di Windows Vista Usa gli strumenti per la vita digitale Una delle novità introdotte in Windows Vista è il consistente potenziamento delle funzionalità

Dettagli

TESINA INFORMATICA CARTELLA CLINICA IN ACCESS. Tesina: CARTELLA CLINICA IN ACCESS

TESINA INFORMATICA CARTELLA CLINICA IN ACCESS. Tesina: CARTELLA CLINICA IN ACCESS TESINA INFORMATICA CARTELLA CLINICA IN ACCESS 1 / 10 2 / 10 Psicologia Clinica e di Comunità Gianmaria Lunetta Enza Cascone Luana Ingrasciotta Chiara Tumino 3 / 10 CARTELLA CLINICA IN ACCESS Lo scopo operativo

Dettagli

Copiare le caratteristiche di formattazione da un testo ad un altro.

Copiare le caratteristiche di formattazione da un testo ad un altro. 112 ECDL Guida facile 3.3.1.6 Copiare le caratteristiche di formattazione da un testo ad un altro. Fra le possibilità offerte da questo programma, esiste anche quella di copiare solo il formato (colore

Dettagli

Gasparini Alessandra BIM

Gasparini Alessandra BIM Gasparini Alessandra 592026-BIM Pfam è una banca dati di famiglie proteiche creata dal Wellcome Trust Sanger Institute a partire dal database Pfamseq basato su Uniprot. Le famiglie proteiche di Pfam sono

Dettagli

Phpmyadmin. Creazione Database

Phpmyadmin. Creazione Database Phpmyadmin Phpmyadmin è un applicazione Web fornita direttamente con il pacchetto XAMPP. E utilizzata per la gestione delle tabelle SQL. Essa, infatti, permette di creare database, tabelle, importare ed

Dettagli

APVE in Rete Modulo 8 Excel nozioni di base e esercitazioni su economia domestica

APVE in Rete Modulo 8 Excel nozioni di base e esercitazioni su economia domestica APVE in Rete Modulo 8 Excel nozioni di base e esercitazioni su economia domestica Programma di formazione informatica per i soci Apve di Roma maggio 2017 Argomenti Cosa è excel Come avviare il sistema

Dettagli

Foglio Elettronico Lezione 1

Foglio Elettronico Lezione 1 - Introduzione - Celle e riferimenti - Formule - Approfondimenti - Funzioni logiche Sommario Introduzione - Foglio elettronico o foglio di calcolo - Cos'è? Strumento per raccogliere dati organizzati in

Dettagli

Le proprietà dei poligoni regolari. La similitudine tra figure piane. Il contenuto delle schede della sezione C e della scheda D1.

Le proprietà dei poligoni regolari. La similitudine tra figure piane. Il contenuto delle schede della sezione C e della scheda D1. D3 Le piramidi Che cosa imparerai Che cosa devi sapere Imparerai a costruire vari tipi di piramidi e ne scoprirai un importante proprietà. Le proprietà dei poligoni regolari. La similitudine tra figure

Dettagli

9In questa sezione. Ordinare e filtrare i dati. Dopo aver aggiunto dati ai fogli di lavoro, potresti voler

9In questa sezione. Ordinare e filtrare i dati. Dopo aver aggiunto dati ai fogli di lavoro, potresti voler 9In questa sezione Ordinare e filtrare i dati Ordinare i dati del foglio di lavoro Creare un elenco personalizzato Filtrare rapidamente i dati con Filtro automatico Creare un filtro avanzato Convalidare

Dettagli

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 L A B C di R 0 20 40 60 80 100 2 3 4 5 6 7 8 Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010 La scelta del test statistico giusto La scelta della analisi

Dettagli

Come creare il BAS Test tramite l applicazione Training Center

Come creare il BAS Test tramite l applicazione Training Center Come creare il BAS Test tramite l applicazione Training Center Il BAS test è un test per misurare la Velocità di soglia anaerobica. Il BAS test consiste nel correre nel tempo migliore in due giorni distinti,

Dettagli

Avviate Specifi dall icona presente sul vostro Desktop.

Avviate Specifi dall icona presente sul vostro Desktop. Avviate Specifi dall icona presente sul vostro Desktop. Nota: Se state utilizzando una versione dimostrativa, una volta caricato il programma, un messaggio vi comunicherà i giorni rimanenti del periodo

Dettagli

MANUALE UTENTE PROCEDURA PLANET WEB INTERPRISE (II edizione)

MANUALE UTENTE PROCEDURA PLANET WEB INTERPRISE (II edizione) UNIVERSITA DEGLI STUDI DI MACERATA AREA PERSONALE SETTORE P.T.A. Ufficio presenze e affari generali P.T.A. MANUALE UTENTE PROCEDURA PLANET WEB INTERPRISE (II edizione) Ufficio presenze affari generali

Dettagli

Inoltrare un messaggio.

Inoltrare un messaggio. Reti informatiche 359 7.5.3.9 Inoltrare un messaggio. È possibile spedire ad altri un messaggio inviato o ricevuto in precedenza. Al destinatario verrà recapitato il messaggio originale nel quale compariranno

Dettagli

Centro Ausili Tecnologici TUTORIAL CREAZIONE TABELLE DI COMUNICAZIONE CON PROGRAMMI NON SPECIFICI

Centro Ausili Tecnologici TUTORIAL CREAZIONE TABELLE DI COMUNICAZIONE CON PROGRAMMI NON SPECIFICI Centro Ausili Tecnologici Viale Cittadini 33, 52100 Arezzo - Tel 0575/254357 Email: cat@usl8.toscana.it Sito web: www.cat-arezzo.org TUTORIAL CREAZIONE TABELLE DI COMUNICAZIONE CON PROGRAMMI NON SPECIFICI

Dettagli

Lezione 6. Lo string matching

Lezione 6. Lo string matching Lezione 6 Lo string matching String matching Date due stringhe (sequenze di caratteri) vogliamo stabilire se sono uguali Nel caso dello string matching, due stringhe sono uguali se... sono uguali ( DNA

Dettagli