SummeR School-DATA Mining and Data Analysis with R

Documenti analoghi
CORSO TRASVERSALE. SummeR School-DATA MINING AND DATA ANALYSIS WITH R

LABORATORI DI CULTURA DIGITALE: INFORMATICA, INTERNET E ROBOTICA

Corso Programmazione Java Standard

MANAGEMENT DELLA QUALITA CONTROLLO STATISTICO DELLA QUALITA ORDINAMENTO 509. Prof. Maria Francesca Renzi Prof. Paola Vicard

Corso di Laurea Ingegneria Informatica

CORSO DI LAUREA IN PSICOLOGIA. Pedagogia sperimentale Corso Avanzato (CA) Corso di Laurea Magistrale in Psicologia LM-51

Ore settimanali di lezione: 3 h di cui 2 in compresenza con l insegnante di Lab. di Informatica prof.ssa E.De Gasperi

PROGRAMMAZIONE ANNUALE ANNO SCOLASTICO 2007/2008

Analisi Univariata e Multivariata dei Dati Economici Bruno Ricca (Dipartimento di studi su risorse, impresa, ambiente e metodologie quantitative)

Programma del corso di STATISTICA ECONOMICA

PROGRAMMAZIONE DIDATTICO-EDUCATIVA ANNO SCOLASTICO

I.I.S. N. PELLATI Nizza Monferrato - Canelli

ISTITUTO D ISTRUZIONE SUPERIORE E. GUALA CORSO IPSIA PROGRAMMAZIONE ANNUALE DI MATEMATICA ANNO SCOLASTICO CLASSE 2 G

L adozione di MATLAB e Simulink nei Corsi di Ingegneria al Politecnico di Milano. Maurizio Magarini MATLAB EXPO Milano, 4 novembre 2014

UNIVERSITA DEGLI STUDI DI MILANO-BICOCCA FACOLTA DI SCIENZE MATEMATICHE, FISICHE E NATURALI

Pro/INTRALINK Guida al curriculum

CORSO DI LAUREA MAGISTRALE IN PSICOLOGIA DELLA COMUNICAZIONE E DEL MARKETING

Programma del corso di ECONOMIA AZIENDALE

Programma del corso di ECONOMIA E GESTIONE DELLE IMPRESE

SCUOLA POLITECNICA. DISEGNO INDUSTRIALE DISEGNO E RAPPRESENTAZIONE INFORMATICA A Formazione di base nella rappresentazione

Statistica per le ricerche di mercato

Istituto di Istruzione Superiore Statale Carlo Emilio Gadda PIANO DI LAVORO ANNO SCOLASTICO 2016/2017. I.I.S.S '' C. E. GADDA Sede di FONOVO

U4Learn.

METODOLOGIA DELLA RICERCA INFERMIERISTICA edizione 2013

PIANO DI LAVORO ANNO SCOLASTICO 2016/2017. I.I.S.S. C. E. GADDA Sede di Langhirano MATERIA DI INSEGNAMENTO TECNOLOGIE E PROGETTAZIONE DI

Windchill ProjectLink Guida al curriculum

Principi di Progettazione del Software a.a Introduzione al corso Prof. Luca Mainetti Università del Salento

Presidenza del Consiglio dei Ministri

Fondamenti di Informatica

MODULO 1 : LINGUAGGIO C/C++

Università degli studi di Roma Tor Vergata Ingegneria Medica Informatica I Programma del Corso

Fondamenti di Informatica

CORSO DI LAUREA IN SCIENZE DELL'EDUCAZIONE E DELLA FORMAZIONE CORSO DI LAUREA IN SCIENZE E TECNICHE PSICOLOGICHE. Pedagogia generale

Registro elettronico scuola ospedaliera rel. 5.0

Elementi di Bioinformatica per l analisi di dati NGS

Programmazione didattica di Matematica a. s. 2015/2016 V H

AREA SCIENTIFICA MATEMATICA - TECNOLOGICA CLASSE: PRIMA IFP OPERATORE DELL ABBIGLIAMENTO INDIRIZZO: SARTO MODELLISTA UNITÀ FORMATIVE

Programma del corso di PROGRAMMAZIONE E CONTROLLO DELLE IMPRESE TURISTICHE PROGRAMMAZIONE E CONTROLLO DELLE IMPRESE TURISTICHE

RenderCAD S.r.l. Formazione

REGISTRI D'ESAME CODICE ESAME CORSO DI LAUREA NOME DEL CORSO LAUREA CFU

CORSO DI LAUREA IN INGEGNERIA ELETTRICA, ELETTRONICA E INFORMATICA

Corso di Informatica Medica Esercitazione 1I

PIANO di LAVORO CLASSE 3 D

Principi di Progettazione del Software a.a " Introduzione al corso! Prof. Luca Mainetti! Università del Salento!

PROGRAMMAZIONE DIDATTICO-EDUCATIVA ANNO SCOLASTICO Prof. ssa Giardino Manuela

ISTITUTO TECNICO INDUSTRIALE STATALE "G. MARCONI" Via Milano n PONTEDERA (PI) DIPARTIMENTO: Informatica

LICEO DELLE SCIENZE APPLICATE

Attività di Tirocinio

Translation Obbligo di frequenza Lingua di erogazione. Docente responsabile Cognome Paolo Dilonardo Elisa Fortunato.

Informazione Formazione e Addestramento del Personale

LA PERFORMANCE DEI DIPENDENTI PUBBLICI

Capacità: Analizzare un problema semplice. Valutare la congruenza dei risultati con i dati e le informazioni iniziali.

CORSO DI ALTA FORMAZIONE in

PROGETTO FORMATIVO AZIENDALE TITOLO DEL CORSO

Università degli Studi di Cagliari DIPARTIMENTO DI SCIENZE ECONOMICHE ED AZIENDALI

L arte della persuasione

ANNO ACCADEMICO 2017/2018 LAUREA TRIENNALE 3 ANNI. Informatica

Corso Geodatabase (PostGIS)

CORSI DI APPROFONDIMENTO IN COLLABORAZIONE CON LE AZIENDE

Corso di Laurea Ingegneria Informatica

Università degli Studi di Messina Dipartimento di Matematica e Informatica

LA PROGETTAZIONE SOCIALE E LA GESTIONE DEI PROGETTI

FORMAZIONE TUTOR APPRENDIMENTO AL CENTRO. Formazione per Tutor di studenti con Disturbi Specifici dell Apprendimento e Bisogni Educativi Speciali

Corso di Laurea in Informatica

II CORSO ONLINE PER ANALISTI DI GEOPOLITICA E RELAZIONI INTERNAZIONALI

Praticamente Statistica Laboratorio di software open source

PROCEDURA VALUTAZIONE COLLEGIALE SOMMARIO

LIM. Lavagna Interattiva Multimediale. Interactive Whiteboard

Transcript:

SummeR School-DATA Mining and Data Analysis with R PROPONENTE Prof.ssa Luisa Bernardinelli, Prof. Mario Grassi e Dott. Davide Gentilini OBIETTIVI FORMATIVI La gestione e l analisi dei dati rappresenta uno dei fattori più importanti e simultaneamente più critici in molti ambiti lavorativi; spesso ci si avvale di strumenti e software proprietari che sono soventemente costosi o risultano essere in definitiva limitati nella loro applicazione. Il corso ha l obiettivo di fornire ai partecipanti le conoscenze necessarie e sufficienti per introdurre ed utilizzare il linguaggio e le potenzialità di R nel proprio lavoro. R può essere definito come un sistema di analisi statistica e contemporaneamente un linguaggio ed un software. E uno strumento open source potentissimo e largamente utilizzato, per l analisi statistica dei dati, inoltre, essendo un vero e proprio linguaggio di programmazione, racchiude in se la potenzialità per creare e sviluppare in autonomia svariate applicazioni utili alla manipolazione, gestione ed analisi di ogni tipo di dato. Le sue caratteristiche principali comprendono infatti la semplicità nella gestione e manipolazione dei dati, la disponibilità di una suite di strumenti per calcoli su vettori, matrici ed altre operazioni complesse, l accesso ad un vasto insieme di strumenti integrati e funzioni sviluppate da altri e resi disponibili per l'analisi statistica, la produzione di numerose potenzialità grafiche particolarmente flessibili, possibilità di adoperare un vero e proprio linguaggio di programmazione orientato ad oggetti che consente l'uso di strutture condizionali e cicliche, nonché di funzioni create dall'utente. Offrendo un elaborata introduzione alla programmazione con R questo corso ha lo scopo di intercettare le esigenze dei partecipanti focalizzandosi in particolar modo su alcuni aspetti fondamentali come la manipolazione e gestione dei dati, la loro analisi attraverso l identificazione del test statistico più appropriato e la visualizzazione di dati e risultati utilizzando le potenzialità grafiche messe a disposizione da R. Il corso prevede l impiego di numerosi dataset ed esempi che possano essere familiari alle varie aree di interesse in modo da agevolare i partecipanti nella comprensione ed applicazione delle nozioni acquisite.

NUMERO DI ORE(CFU)/LEZIONI Il corso avrà una durata di almeno 30 ore (7 CFU), e sarà suddiviso in 5 incontri. Possono essere frequentati anche singoli incontri (1,5 CFU per incintro). PERIODO DI SVOLGIMENTO Il periodo di svolgimento del corso sarà dal 19 al 23 giugno 2017. DOCENTI Prof.ssa Luisa Bernardinelli, Dott. Davide Gentilini, Dott.ssa Teresa Fazia COMITATO SCIENTIFICO Prof Luisa Bernardinelli, Prof. Mario Grassi, Dr Davide Gentilini, Prof.ssa Elisa Fazzi COMITATO ORGANIZZATORE Dipartimento di Scienze del Sistema Nervoso e del Comportamento e Residenza Universitaria Biomedica Fondazione Collegio Universitario S. Caterina da Siena, Pavia. SEDE DEL CORSO Residenza Universitaria Biomedica Fondazione Collegio Universitario S. Caterina da Siena, via L. Giulotto, 12 Pavia. È disponibile una connessione Wi-Fi per accedere ad Internet con il proprio computer portatile, necessario per le esercitazioni pratiche. POTENZIALI DOTTORATI INTERESSATI Il corso ha l intento di essere trasversale e di fornire competenze utili in ogni ambito che abbia a che fare con dati e con la necessità di elaborarli e gestirli. Per tale ragione, il corso ha l obiettivo di essere utile ad ogni tipologia di dottorato. Nell attività pratica verranno utilizzati esempi e dati nei vari ambiti applicativi di interesse per i diversi Dottorati. POTENZIALI PARTECIPANTI Il corso sarà a numero chiuso (max 20 persone) e sarà aperto gratuitamente ai dottorandi, agli studenti dell Università di Pavia e agli alunni della Residenza Universitaria Biomedica. Sarà aperto al pubblico con pagamento di una quota di iscrizione. ISCRIZIONI Per le iscrizioni al corso rivolgersi a: Segreteria Residenza Universitaria Biomedica: e-mail biomedica.segreteria@collegiosantacaterina.it tel. 0382 516762 MODALITA DI VERIFICA DELL APPRENDIMENTO ll grado di apprendimento verrà testato al termine di ogni lezione sottoponendo i partecipanti ad un test. Il test sarà composto da una serie di 10 domande a scelta multipla riguardanti la parte teorica a cui verrà aggiunto un esercizio inerente le argomentazioni trattate.

PROGRAMMA 19 Giugno 2017, 9.30-12.30; 14.00-17.00 Titolo: L ambiente di programmazione R generalità e i principali oggetti Obiettivo della lezione è introdurre i partecipanti all ambiente R, illustrandone le principali funzionalità, l architettura e presentando i principali oggetti. Introduzione del Corso e Generalità Installazione di R e configurazione Nozioni preliminari sulla sua architettura sui pacchetti e sulle funzioni Utilizzo dei I pacchetti Utilizzo dell Help Gli oggetti principali I vettori o Assegnazione Vettori (Vettori aritmetici, Logici, di Caratteri) o Operazioni e funzioni per lavorare con i vettori Matrici ed Array o Operatori e funzioni per il calcolo Matriciale Liste e Data Frames o Operatori e funzioni per lavorare con Data Frames e Liste

20 Giugno 2017, 9.30-12.30; 14.00-17.00 Titolo: Data import e data mining con R Obiettivo della lezione è insegnare ai partecipanti ad importare dati di varia tipologia e formato nell ambiente R. La lezione ha inoltre lo scopo di insegnare data mining ovvero ad utilizzare R per visualizzare gestire, estrarre e manipolare i dati. La lezione tratterà le funzioni grafiche di R in modo che i partecipanti al corso acquisiscano le conoscenze base per poter visualizzare i propri dati e i propri risultati in modo autonomo. Esempi ed esercizi guidati avranno lo scopo di verificare e consolidare le nozioni. Importazione e pulizia di data-set Funzioni di importazione dei dati in base alla loro natura e formato Funzioni di visualizzazione e manipolazione dei dati Quality Control dei dati Trattamento dei dati mancanti Imputazione Metodi di riclassificazione delle variabili Funzioni per la manipolazione dei dati L ambiente grafico Pacchetto Base Pacchetto Grid Pacchetto ggplot2 I parametri grafici o Funzioni di alto e basso livello o Funzioni interattive Tipi di grafici e funzioni o Grafici standard o Grafici speciali o Grafici dinamici Classificazione del tipo di dati e discussione sulla modalità di visualizzazione

21 Giugno 2017, 9.30-12.30; 14.00-17.00 Titolo: Statistica di base con R Obiettivo della lezione è entrare nel merito della statistica descrittiva/inferenziale e fornire gli strumenti essenziali per poter scegliere e applicare il metodo statistico più appropriato Misure descrittive univariate/bivariate Test di significatività parametrici sulla media, frequenze, correlazione Test di significatività non parametrici sulla mediana, frequenze, correlazione Tabelle di contingenza 2 x 2 e J x K Regressione lineare semplice/anova

22 Giugno 2017, 9.30-12.30; 14.00-17.00 Titolo: Statistica di base con R Obiettivo della lezione è entrare nel merito della statistica descrittiva/inferenziale e fornire gli strumenti essenziali per poter scegliere e applicare il metodo statistico più appropriato Regressione lineare multipla Regressione logistica Analisi delle Componenti Principali (PCA) Analisi dei Gruppi (Cluster analysis)

23 Giugno 2017, 9.30-12.30; 14.00-17.00 Titolo: Principi Base di programmazione con R Obiettivo della lezione: esplorare i rudimenti di programmazione Object Oriented con R e fornire le basi affinché il partecipante sia in grado di sviluppare semplici programmi che possano automatizzare alcuni processi di lavoro o di analisi. La lezione offre anche una visione sulla possibilità di sviluppare applicazioni web e on site. Scrittura ed esecuzione di programmi in R. Blocchi di istruzioni. Istruzioni condizionali. Istruzioni iterative. Funzioni Applicazioni in R e Shiny