Bioinformatica II. Esercitazione 2 GUIDA
|
|
|
- Veronica Alfano
- 9 anni fa
- Просмотров:
Транскрипт
1 Bioinformatica II LM Biologia Evoluzionistica, Università di Padova Docenti: Dr. Giorgio Valle, Dr. Stefania Bortoluzzi Esercitazione 2 Padova, 14 novembre 2014 GUIDA Uso avanzato della shell Unix Obbiettivo dell'esercitazione L'obbiettivo dell'esercitazione è di familiarizzare con alcuni comandi "avanzati" della shell Unix e di applicarli per analizzare file di sequenze biologiche o dati di varianti (SNP) nei formati più usati (FASTA, VCF). I file per l'esercitazione possono essere scaricati dal seguente indirizzo web: Anatomia di un comando Unix Creare un unico file FASTA a partire da 10 sequenze singole Aprire un terminale dei comandi (cercare terminale tra i programmi disponibili) e decomprimere il pacchetto nella vostra home directory (~/nomeutente); verrà creata una directory esercitazione_bioinfo_2 tarxzvfbioinfo2be2.tgz Spostarsi nella directory esercitazione_bioinfo_ii
2 cd~/esercitazione_bioinfo_2 La ~ (tilde) è carattere che indica la home directory dell'utente (/home/username) Dare un'occhiata ai file contenuti nella directory. ls-l Verranno visualizzati i nomi dei file presenti nella directory, tra cui 10 sequenze in formato FASTA di trascritti riconducibili a geni coinvolti nel cancro al seno. Ogni sequenza è in un file separato. Concateniamo tutte le sequenze FASTA in un unico file. NB: ogni sequenza ha una propria intestazione, quindi concatenandole in un unico file saranno comunque riconoscibili. catseq*.fasta>all.fasta * è un carattere speciale (wild card) che corrisponde ad uno o più caratteri. Il simbolo > redireziona l'output di un comando (cat in questo caso) in un file. Ispezionare il file appena creato con: lessall.fasta Verificare che il numero di sequenze nel file creato sia corretto: grep">"all.fasta e contare quante righe vengono date in output, oppure per farlo in maniera automatica usare l'opzione c del comando grep: grep-c">"all.fasta Se vogliamo ottenere informazioni sul comando grep: mangrep grep-h Le Pipe
3 Spesso può essere utile inviare l'output di un comando non a video ma ad un altro comando prima di essere visualizzato. Usando l'operatore pipe ' ' comunichiamo alla shell di collegare l'output del primo comando all'input del secondo comando. Ad esempio per ottenere il numero approssimativo di nucleotidi totali presenti nelle nostre 10 sequenze: grep-v">"all.fasta wc-c L opzione v indica a grep di invertire il match, cioè di non mostrarci le righe che hanno il match; è importante mettere le virgolette intorno al maggiore è un carattere che ha un significato preciso nella shell (redirezionamento dell output di un comando). Da notare che il numero ottenuto di caratteri che otteniamo non è preciso dato che vengono conteggiati anche i new line, cioè un carattere invisibile che indica al computer di andare a capo. Analisi di un file VCF (Variant Call Format) Per una descrizione dettagliata del formato vcf consultare il seguente documento in formato pdf: specs/vcfv4.2.pdf Noi ci concentreremo dulle data lines e non sulle righe dell intestazione (header file). Dare un occhiata al file con il comando less:
4 lesssample.vcf Contiamo il numero di righe nel file: wc-lsample.vcf Questo comando ci mostra il numero totale di righe nel file compresa l intestazione. A noi interessa sapere quante varianti sono presenti nel file. Quindi procederemo con il creare un file vcf senza l intestazione: grep-v ^# sample.vcf >sample_no_header.vcf Il primo argomento di grep in questo caso è una regular expression, ossia un modo per indicare famiglie di stringe (parole). In questo caso la nostra regular expression specifica tutte le parole che sono all inizio della riga (^) e che iniziano con #. Questa è una caratteristica unica delle righe presenti nell intestazione del file vcf. Ricordatevi che l opzione v indica a grep di invertire il match, quindi di non mostrarci le righe che matchano la regular expression. Contiamo ora quante varianti ci sono all interno del nostro file: wc-lsample_no_header.vcf Il comando cut Vogliamo ora vedere quante varianti sono state identificate nel cromosoma 1. Ci serve il comando cut che come citato nella sua man page: cut out selected portions of each line of a file. Quindi ci permette di selezionare soltanto alcune porzioni da ogni riga del file. In particolare le porzioni devono essere delimitate da un qualche carattere detto delimiter che nel nostro caso è il TAB. Facciamo in modo di farci stampare la il primo campo (il numero del cromosoma): cut-f1sample_no_header.vcf Ora selezioniamo solo le righe che contengano il cromosoma 1: cut-f1sample_no_header.vcf grep1 E infine contiamo quante sono:
5 cut-f1sample_no_header.vcf grep1 wc-l E per finire proviamo a fare la stessa cosa partendo dal file vcf contentente anche l intestazione, senza creare un file intermedio. grep-v"#" sample.vcf cut-f1 grep1 wc-l
Esercitazione 2 GUIDA
Corso di Laurea in Biologia Molecolare, Università di Padova Insegnamento di Informatica e Bioinformatica Esercitazione 2 Padova, 13 aprile 2016 GUIDA Uso della shell Unix Obbiettivo dell'esercitazione
- comando sort: con chiavi di ordinamento -
- comando sort: con chiavi di ordinamento - 1 - sort: chiavi di ordinamento - Tramite l'opzione -k è possibile definire una chiave di ordinamento su una porzione della linea contenuta nel file Specificando
L interfaccia command line di Ubuntu è il Terminale che usa un sistema command line detto bash.
BASH La maggior parte del lavoro di un bioinformatico si svolge attraverso un interfaccia command line che al contrario dell interfaccia grafica che usiamo ogni giorno, ha bisogno di comandi di testo esatti.
Esercitazione GNU/Linux n. 2
2.1 Copiare i file cp (copy) Esercitazione GNU/Linux n. 2 cp file1 file2 è il comando che crea una copia del file1 presente nella directory corrente e la chiama file2 Ciò che faremo adesso, è prendere
Lab. di Sistemi Operativi - Esercitazione - Comandi Shell
Lab. di Sistemi Operativi - Esercitazione - Comandi Shell 1 - Esercizi Comandi Unix - 2 Esercizio n 0 0a) creare una cartella EsercitazioneLSO-1 nella directory di lavoro 0b) creare un file testo chiamato
Linux e la shell Bash
DEI DEI-- Politecnico di dibari Linux e la shell Bash Esercitazione conclusiva G. Piscitelli - M. Ruta - A. Cinquepalmi Testi di riferimento: Linux e la shell Bash http://sisinflab.poliba.it/ruta/linux/linux
Esercitazione 1 la shell
Esercitazione 1 la shell Obiettivi Prendere confidenza con i comandi per la gestione del file system Utilizzare gli strumenti visti a lezione per creare tre semplici script bash File system 1/2 1. Verificare
Shell BASH. Variabili Redirezione
Shell BASH Variabili Redirezione Variabili Scrittura/definizione: a=3 (senza spazi) Lettura: ${a} o semplicemente $a Esempi: > a=3 > echo $a 3 > echo $aa > echo ${a}a 3a > a=ciao pippo bash: pippo: command
Uso del terminale in ambiente UNIX
Uso del terminale in ambiente UNIX Non sempre è disponibile un interfaccia grafica sui computer su cui si lavora In questo caso l interazione con il calcolatore avviene attraverso l interfaccia a riga
Esempio di domande sul file system
Esempio di domande sul file system Si supponga che un file system usi blocchi di 4 Kbyte, e che un puntatore ad un blocco occupi 4 byte. Se l INODE di un file utilizza 12 blocchi, un blocco indiretto ed
Lezione 3: Programmazione della Shell di Unix
Lezione 3: Programmazione della Shell di Unix Laboratorio di Elementi di Architettura e Sistemi Operativi 2 Marzo 202 Parte : Soluzione degli esercizi Statistiche Ho ricevuto 2 soluzioni Tutte le soluzioni
Lab. di Sistemi Operativi - Esercitazione n 2 - a.a. 2012/2013
Lab. di Sistemi Operativi - Esercitazione n 2 - a.a. 2012/2013 Comandi di ricerca 1 Sommario Comandi shell di ricerca: grep find 2 - comando di ricerca: grep - 3 file passwd, ricordiamo che Le righe di
Comandi principali di Linux (1)
Laboratorio I Comandi principali di Linux (1) Sintassi: [comando] [opzioni] [argomenti] ls mostra il contenuto di una director l versione lunga a mostra anche i files nascosti che iniziano con. t presenta
Lesson #4. Espressioni Regolari. Roberto De Virgilio
Lesson #4 Espressioni Regolari Roberto De Virgilio Sistemi operativi - 9 Novembre 2015 Espressioni regolari in Unix Patterns (modelli) che individuano insiemi di stringhe (linguaggi) e rappresentano uno
Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp)
Linguistica dei Corpora (2) Lezione 3: Manipolare testi (non solo con cqp) Malvina Nissim [email protected] 1 Aprile 2009 1 ssh gollum.sitlec.unibo.it login passwd cqp 1 Cercare e contare 1.1 Contare
Laboratorio di Alfabetizzazione Informatica - Simulazione d esame 29 aprile 2013
Laboratorio di Alfabetizzazione Informatica - Simulazione d esame 29 aprile 2013 Questo documento contiene le istruzioni per lo svolgimento dell esame. La durata della prova è 60 minuti e richiede lo svolgimento
Nozioni Base di Linux
Nozioni Base di Linux Shahram Rahatlou http://www.roma1.infn.it/people/rahatlou/labcalc/ Laboratorio di Calcolo Lezione 2 Hardware Sistema Operativo Software Routine e programmi di base per interagire
Esame Laboratorio di Sistemi Operativi Cognome Nome Mat.
Esame Laboratorio di Sistemi Operativi 2-01-2008 Il compito è costituito da domande chiuse e domande aperte. Non è consentito l uso di libri, manuali, appunti., etc. Tempo massimo 1 ora. Domande chiuse:
Infor LN [GUIDA INFOR LN] [GUIDA INFOR LN] Baltur S.p.A. Rev /2013. Guida all utilizzo del Gestionale Infor LN per le Agenzie Baltur
Infor LN [GUIDA INFOR LN] Baltur S.p.A. Rev. 1.0-10/2013 [GUIDA INFOR LN] Guida all utilizzo del Gestionale Infor LN per le Agenzie Baltur Baltur S.p.A. Informazioni di base 1 Indice Informazioni di base...
Introduzione all'uso del sistema operativo Ubuntu
Introduzione all'uso del sistema operativo Ubuntu Aprire un Terminal. Osservare il prompt dei comandi Una shell è pronta ad interpretare ed eseguire i vostri comandi consentendovi di accedere ai servizi
Elenchi numerati. Il procedimento per gli elenchi numerati è simile: o l icona o la finestra del menu formato
Word Lezione 3 Elenchi puntati È possibile inserire elenchi puntati tramite un icona sulla barra di formattazione o tramite il menu formato Elenchi puntati e numerati Elenchi numerati Il procedimento per
Input/Output. Console e File.
Input/Output Console e File http://www.dia.uniroma3.it/~roselli/ [email protected] Credits Materiale a cura del Prof. Franco Milicchio Introduzione Le istruzioni di stampa servono a rendere visibili
PRIMA DI PROCEDERE CON L ASCOLTO DELLE LEZIONI E DEGLI ESERCIZI COPIARE LA CARTELLA ESERCIZI SUL DESKTOP
PRIMA DI PROCEDERE CON L ASCOLTO DELLE LEZIONI E DEGLI ESERCIZI COPIARE LA CARTELLA ESERCIZI SUL DESKTOP SEQUENZA FILMATI ED ESERCIZI: 1. INIZIO 1) IL FOGLIO ELETTRONICO 2) NOZINI DI BASE DI EXCEL 2010
PROCEDURA D INSTALLAZIONE DEL SOFTWARE DELLA CARTA TS-CNS. ACTALIS su Windows 32 bit e 65 bit
PROCEDURA D INSTALLAZIONE DEL SOFTWARE DELLA CARTA TS-CNS ACTALIS su Windows 32 bit e 65 bit INDICE Introduzione alla procedura d installazione del software della carta TS-CNS... 3 Installazione Software
Excel di Microsoft o Calc di OpenOffice sono programmi per la gestione dei fogli di calcolo
FOGLI DI CALCOLO Excel di Microsoft o Calc di OpenOffice sono programmi per la gestione dei fogli di calcolo COMANDI BASE Comandi di APRI, SALVA, SALVA CON NOME, CHIUDI, STAMPA nel menù FILE. Comandi di
Come si accede a BASH Tasti utili: Ctrl-Alt-F1, Ctrl-Alt-F7. Il Primo comando : exit (CASE SENSITIVE!!) Si può uscire con CTRL-D
Come si accede a BASH Tasti utili: Ctrl-Alt-F1, Ctrl-Alt-F7 Il Primo comando : exit (CASE SENSITIVE!!) Si può uscire con CTRL-D Il secondo comando: ls Opzioni: ls l, ls a, ls R ls --full-time Parametri:
Esercizi 5 CICLI. Es.5(cicli)
Esercizi 5 CICLI 1 Es.5(cicli) Esercizio 1 Realizzare una funzione che, chiesto all utente un numero intero pari a N, ricavi e stampi a video tutte le terne pitagoriche con i cateti minori o uguali ad
EUROPEAN COMPUTER DRIVING LICENCE SYLLABUS VERSIONE 5.0
Pagina I EUROPEAN COMPUTER DRIVING LICENCE SYLLABUS VERSIONE 5.0 Modulo 4 Foglio elettronico Il seguente Syllabus è relativo al Modulo 4, Foglio elettronico, e fornisce i fondamenti per il test di tipo
Modulo 4 Esercitazione Nr 2 Office 2007
MODULO 4 : EXCEL ESERCITAZIONE N 2 Dopo aver lanciato in esecuzione il Programma EXCEL eseguire le seguenti istruzioni : 1. Dopo avere rinominato il Foglio 1 col nome GENNAIO, impostare le larghezze delle
La Shell di Unix. l utente impartisce i comandi al sistema digitandoli ad un apposito prompt;
La Shell di Unix La parte del sistema operativo Unix dedita alla gestione dell interazione con l utente è la shell, ovvero, un interfaccia a carattere: l utente impartisce i comandi al sistema digitandoli
Configurazione di Eclipse con Liferay 5.2.2/6.0.6/6.1.0 Mac/Linux
Configurazione di Eclipse con Liferay 5.2.2/6.0.6/6.1.0 Mac/Linux Indice:! - Pre-requisiti!!!!!!!! pag. 1! - Configurazione dei file in source e sdk!!! pag. 2,3! - Creazione dei database mysql!!!! pag.
CORSO LINUX PER LA CERTIFICAZIONE LPI ESSENTIALS
CORSO LINUX PER LA CERTIFICAZIONE LPI ESSENTIALS Comandi da terminale Il comando sleep fa attendere un comando prima dell'esecuzione. Prova il comando: $ sleep 3s && echo Ciao Mondo! $ Comandi da terminale
SHELL: File e Filesystem
SHELL: File e Filesystem Obiettivi : - Usare i comandi per muoversi all'interno del filesystem - Copiare, spostare, rinominare file e directory - Usare i link - Visualizzare il contenuto di un file - Conoscere
