Pre-elaborazione dei dati (Data pre-processing)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Pre-elaborazione dei dati (Data pre-processing)"

Transcript

1 Pre-elaborazione dei dati (Data pre-processing) I dati nel mondo reale sono sporchi incompleti: mancano valori per gli attributi, mancano attributi importanti, solo valori aggregati rumorosi: contengono errori e/o outliers inconsistenti: contengono codici o nomi diversi per gli stessi dati Senza dati di qualita` non c e` analisi di qualita` decisioni di qualita` debbono essere basate su dati di qualita` il data warehouse richiede una integrazione consistente di dati di qualita`

2 Una misura multi-dimensionale della qualita` dei dati accuratezza completezza consistenza tempestivita` credibilita` a valore aggiunto interpretabilita` accessibilita`

3 Attivita` principali nel data pre-processing pulizia dei dati (data cleaning) aggiunta di valori mancanti, aggiustamento dei dati rumorosi, identificazione e eliminazione degli outliers, soluzione delle inconsistenze Integrazione dei dati integrazione di database, cubi e files Trasformazione dei dati normalizzazione e aggregazione Riduzione dei dati riduzione del volume dei dati mantenendo la qualita` dell analisi Discretizzazione dei dati

4 Pulizia dei dati (data cleaning) attivita` di data cleaning: aggiunta dei dati mancanti identificazione degli outliers e riduzione dei dati rumorosi correzione dei dati inconsistenti

5 Dati mancanti I dati non sono sempre disponibili molte tuple non hanno valori registrati per alcuni attributi, p.e. il reddito dei clienti nei dati delle vendite La mancanza dei dati puo` essere dovuta a: malfunzionamento dei sistemi di acquisizione cancellazione dovuta a inconsistenza con dati gia` registrati dati non inseriti per incomprensione certi dati possono non essere considerati importanti al momento dell inserimento mancanza di registrazione dei cambiamenti nei dati Ci puo` essere necessita` di inferire i dati mancanti

6 Trattamento dei dati mancanti ingnorare la tupla; aggiungere il valore mancante manualmente usare globalmente una costante per i valori mancanti: p.e. non disponibile usare il valor medio dell attributo usare il valore piu` probabile dopo aver applicato una tecnica di inferenza (Bayesiana o albero di decisione) Uisare la correlazione con altri attributi se possibile

7 Esercitazione Usando i dati del file Catalogs.XLS sostituire il dato NA in history con un valore accettabile. Suggerimento: studiare separatamente le distribuzioni dei bassospendenti, medio-spendenti, alto-spendenti; eliminare gli outliers; calcolare le medie; classificare le history in base alle medie ottenute e ai dati di spesa dell anno in corso.

8 Dati rumorosi Rumore: errore o varianza random sui valori di una variabile Valori scorretti di un attributo possono essere dovuti a: strumenti difettosi di raccolta dati problemi di immissione dei dati problemi di trasmissione dei dati limitazioni tecnologiche inconsistenze nelle convenzioni di rappresentazione Ulteriori problemi che richiedono pulizia dei dati record duplicati dati incompleti dati inconsistenti

9 Trattamento dei dati rumorosi Binning (partizionamento): si ordinano i dati e si partizionano in bins (gruppi) di uguale dimensione) si riducono le differenze (smoothing) all interno dei bins o per valori medi, o per valori mediani, o per i valori min e max, ecc. Clustering con algoritmi di clustering si individuano e rimuovono gli outliers Combinazione di ispezione automatica e manuale determinare automaticamente i valori sospetti e farli controllare da un esperto Analisi di regressione determina gli outliers e consente di avvicinarli alla curva (fitting sulla curva)

10 Esempi di binning supponiamo di avere la seguente lista di prezzi: 4,8,9,15,21,21,24,25,26,28,29,34 Partizionamento in bins di uguale dimensione: Bin 1: 4,8,9,15 Bin 2: 21,21,24,25 Bin 3: 26,28,29,34 Smoothing usando la media: Bin 1: 9,9,9,9 Bin 2: 23,23,23,23 Bin 3: 29,29,29,29 Smoothing usando gli estremi dell intervallo Bin 1: 4,4,4,15 Bin 2: 21,21,25,25 Bin 3: 26,26,26,34

11 Esempio di scoperta di outliers Usando il file EXPENSES: Trovare gli outliers di Salary rispetto ad una distribuzione normale Trovare gli outliers di Dining rispetto a Salary mediante analisi di regressione.

12 Esempio di data cleaning in Excel Il file CLEANSING.XLS contiene i dati di 1500 clienti di una compagnia verificare che i Social Security Numbers siano tutti diversi verificare se le date di nascita contengono valori improbabili (possibili valori sconosciuti!!) verificare se i valori del campo eta` (age) contengono valori improbabili (problema anno 2000 ) verificare il campo region (possibili errori di digitazione!!) verificare il campo CredCardUser (possibile errore di formattazione) Verificare i campi Income e Purchases per missing values e outliers

13 Esercitazione Il file P04_03 contiene i dati di 500 abitazioni in un quartiere medio: Dimensione della famiglia Posizione dell abitazione nel quartiere Abitazione in affitto o di proprieta` Reddito lordo del residente col reddito piu` alto Reddito lordo del secondo residente col reddito piu` alto (se esiste) Affitto o mutuo mensile Spesa media mensile in acqua, gas ecc. Indebitamento totale (incluso il mutuo) Effettuare la pulizia dei dati

14 Filtraggio (interrogazione) di tabelle Excel: uso di AutoFilter Esempio: il file CATALOGS.XLS contiene i dati per i clienti di una compagnia di vendita per corrispondenza mediante l uso di AutoFilter ottenere le seguenti informazioni: selezionare i clienti con esattamente 2 figli selezionare i clienti maschi con esattamente 2 figli selezionare clienti con salario compreso tra e (custom query) copiare i risultati di una query per effettuare statistiche Nota bene (per quelli che sanno di database): autofilter consente di effettuare operazioni di selection e projection su una singola tabella relazionale.

15 Esercitazione Il file P04_01 contiene dati che rappresentano 30 risposte a un questionario sulle politiche ambientali del governo. Usando Autofilter: 1. Identificare tutte le risposte di donne, di mezza eta`, con 2 figli. Qual e` il loro salario medio? 2. Identificare tutte le risposte di anziani in forte disaccordo con le politiche governative. Qual e` il loro salario medio? 3. Identificare tutte le risposte in forte accordo con le politiche governative. Qual e` la percentuale di giovani tra questi ultimi?

Analisi dei Dati. Lezione 9 - Preprocessing dei dati

Analisi dei Dati. Lezione 9 - Preprocessing dei dati Analisi dei Dati Lezione 9 - Preprocessing dei dati Motivazioni I dati nel mondo reale sono sporchi incompleti: mancano valori per gli attributi, mancano attributi importanti, solo valori aggregati rumorosi:

Dettagli

Statistica descrittiva: analisi di regressione

Statistica descrittiva: analisi di regressione Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto

Dettagli

Maschere e Query. C. Marrocco. Università degli Studi di Cassino

Maschere e Query. C. Marrocco. Università degli Studi di Cassino Maschere e Query Le Maschere Per visualizzare e immettere i dati in una tabella è possibile utilizzare le maschere. Le maschere sono simili a moduli cartacei: ad ogni campo corrisponde un etichetta ed

Dettagli

I Componenti del processo decisionale 7

I Componenti del processo decisionale 7 Indice Introduzione 1 I Componenti del processo decisionale 7 1 Business intelligence 9 1.1 Decisioni efficaci e tempestive........ 9 1.2 Dati, informazioni e conoscenza....... 12 1.3 Ruolo dei modelli

Dettagli

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi

Esplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Esplorazione dei dati Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Analisi mono e bivariata Si utilizzano indicatori sintetici che individuano, con un singolo valore, proprieta`

Dettagli

MS Access Un DBMS relazionale per Windows?

MS Access Un DBMS relazionale per Windows? MS Access Un DBMS relazionale per Windows? Quali DBMS in ambiente PC: dbase (ver. 5 per windows) FoxPro (per windows) Access (per windows) SQL Server (client/server) Oracle (client/server) Informix (client/server)...

Dettagli

ACCESS. Database: archivio elettronico, dotato di un programma di interfaccia che facilita la registrazione e la ricerca dei dati.

ACCESS. Database: archivio elettronico, dotato di un programma di interfaccia che facilita la registrazione e la ricerca dei dati. ACCESS Database: archivio elettronico, dotato di un programma di interfaccia che facilita la registrazione e la ricerca dei dati. Database Relazionale: tipo di database attualmente più diffuso grazie alla

Dettagli

Statistica descrittiva: misure di associazione

Statistica descrittiva: misure di associazione Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.

Dettagli

Corso di Access Modulo L2 A (Access) I tipi di query

Corso di Access Modulo L2 A (Access) I tipi di query Corso di Access Modulo L2 A (Access) 2.3.2 I tipi di query 1 Prerequisiti Concetto di database relazionale Utilizzo elementare del computer Concetti fondamentali di basi di dati Interrogazione di un DB

Dettagli

ANALISI DEI DATI PER IL MARKETING 2017

ANALISI DEI DATI PER IL MARKETING 2017 ANALISI DEI DATI PER IL MARKETING 2017 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia

Dettagli

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza

Le basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza Definizione 1 Lezione 2 Le basi di dati Gli archivi di dati Organizzato in modo integrato attraverso tecniche di modellazione di dati Gestiti su memorie di massa Con l obiettivo Efficienza trattamento

Dettagli

Ordinamento dati La funzione Ordina disponibile nel menù consente di ordinare la matrice dati in base alla variabile scelta

Ordinamento dati La funzione Ordina disponibile nel menù consente di ordinare la matrice dati in base alla variabile scelta Excel è un applicazione di foglio elettronico che permette di raccogliere ed elaborare i dati inseriti dall utente. Inserimento dati I dati vengono raccolti in tabelle. Tabella: insieme di celle disposte

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

Microsoft Access. Nozioni di base. Contatti: Dott.ssa Silvia Bonfanti

Microsoft Access. Nozioni di base. Contatti: Dott.ssa Silvia Bonfanti Microsoft Access Nozioni di base Contatti: Dott.ssa Silvia Bonfanti silvia.bonfanti@unibg.it Introduzione In questa lezione vedremo lo strumento Microsoft Access ed impareremo come realizzare con esso

Dettagli

PIL Percorsi di Inserimento Lavorativo

PIL Percorsi di Inserimento Lavorativo PIL - 2008 Percorsi di Inserimento Lavorativo Basi di Dati - Lezione 2 Il Modello Relazionale Il modello relazionale rappresenta il database come un insieme di relazioni. Ogni RELAZIONE è una tabella con:

Dettagli

Relazioni e tabelle. Introduzione alle Basi di Dati Relazionali. Relazioni uno a uno. Esempio

Relazioni e tabelle. Introduzione alle Basi di Dati Relazionali. Relazioni uno a uno. Esempio Relazioni e tabelle Introduzione alle Basi di Dati Relazionali Nelle Basi di Dati relazionali le informazioni sono organizzate in tabelle Le tabelle sono rappresentate mediante griglie suddivise in colonne

Dettagli

I DATI E LA LORO INTEGRAZIONE 63 4/001.0

I DATI E LA LORO INTEGRAZIONE 63 4/001.0 I DATI E LA LORO INTEGRAZIONE 63 4/001.0 L INTEGRAZIONE DEI DATI INTEGRAZIONE DEI DATI SIGNIFICA LA CONDIVISIONE DEGLI ARCHIVI DA PARTE DI PIÙ AREE FUNZIONALI, PROCESSI E PROCEDURE AUTOMATIZZATE NELL AMBITO

Dettagli

Databases. Architettura di un DBMS: Struttura ad indice per i files, B + -Trees

Databases. Architettura di un DBMS: Struttura ad indice per i files, B + -Trees Databases Architettura di un DBMS: Struttura ad indice per i files, B + -Trees Indici Un indice consiste di coppie e supporta l efficiente recupero di tutte le etichette con chiave

Dettagli

( ) ( ) ( e la probabilità che si verifichi un evento compreso tra c e b a < c < b sarà data da:

( ) ( ) ( e la probabilità che si verifichi un evento compreso tra c e b a < c < b sarà data da: e la probabilità che si verifichi un evento compreso tra c e b a < c < b sarà data da: p ( ) ( c < X < b) f ( x) LA VC NORMALE O GAUSSIANA Una vc si dice normale o gaussiana (da Gauss che la propose come

Dettagli

INTRODUZIONE AL 2 TEST IN ITINERE. a.a

INTRODUZIONE AL 2 TEST IN ITINERE. a.a INTRODUZIONE AL 2 TEST IN ITINERE a.a. 2014-15 Modalità d esame Tipologia degli studenti: A(ll). Non Sufficienti al Primo Test in Itinere (su tutto il programma sino ad SQL base). Si presentano su tutto

Dettagli

FILE E INDICI Architettura DBMS

FILE E INDICI Architettura DBMS FILE E INDICI Architettura DBMS Giorgio Giacinto 2010 Database 2 Dati su dispositivi di memorizzazione esterni! Dischi! si può leggere qualunque pagina a costo medio fisso! Nastri! si possono leggere le

Dettagli

Corso sul linguaggio SQL

Corso sul linguaggio SQL Corso sul linguaggio SQL Modulo L2B (SQL) 3 - Aggiornamento dati 1 Prerequisiti Conoscenza tipi di dato in SQL Creare e gestire tabelle e indici 2 1 Introduzione In questa Unità descriviamo la parte di

Dettagli

Computazione per l interazione naturale: Modelli dinamici

Computazione per l interazione naturale: Modelli dinamici Computazione per l interazione naturale: Modelli dinamici Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@dsi.unimi.it

Dettagli

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si

Dettagli

Esercizi di SQL Matteo Magnani, Danilo Montesi Università di Bologna. Esercizi di SQL

Esercizi di SQL Matteo Magnani, Danilo Montesi Università di Bologna. Esercizi di SQL Esercizi di SQL Creare una tabella Docente, con i campi Codice, di 4 caratteri e chiave primaria, Nome, fino a 20 caratteri, Cognome, fino a 30 caratteri, Tipo, fino a caratteri, Superiore, di 4 caratteri

Dettagli

9In questa sezione. Ordinare e filtrare i dati. Dopo aver aggiunto dati ai fogli di lavoro, potresti voler

9In questa sezione. Ordinare e filtrare i dati. Dopo aver aggiunto dati ai fogli di lavoro, potresti voler 9In questa sezione Ordinare e filtrare i dati Ordinare i dati del foglio di lavoro Creare un elenco personalizzato Filtrare rapidamente i dati con Filtro automatico Creare un filtro avanzato Convalidare

Dettagli

Strutture fisiche e strutture di accesso ai dati

Strutture fisiche e strutture di accesso ai dati Strutture fisiche e strutture di accesso ai dati 1 A L B E R T O B E L U S S I P R I M A P A R T E A N N O A C C A D E M I C O 2 0 1 2-2 0 1 3 Gestore dei metodi di accesso 2 E il modulo del DBMS che esegue

Dettagli

Imparare a utilizzare le formule e le funzioni

Imparare a utilizzare le formule e le funzioni Imparare a utilizzare le formule e le funzioni Eseguire calcoli, di tipo semplice o complesso, può essere un'attività noiosa e che richiede tempo. È possibile semplificare le operazioni di calcolo mediante

Dettagli

Università di Cassino Facoltà di Ingegneria Modulo di Alfabetizzazione Informatica. Base Dati. Progettazione di un DB

Università di Cassino Facoltà di Ingegneria Modulo di Alfabetizzazione Informatica. Base Dati. Progettazione di un DB Università di Cassino Facoltà di Ingegneria Modulo di Alfabetizzazione Informatica Base Dati Si ringrazia l ing. Francesco Colace dell Università di Salerno Progettazione di un DB Un esempio può essere

Dettagli

Caratteristiche dei linguaggi per Database

Caratteristiche dei linguaggi per Database IL LINGUAGGIO Caratteristiche dei linguaggi per Database I linguaggi per basi di dati relazionali possiedono i comandi per: definizione del data base; manipolazione dei dati; associazione tra tabelle diverse;

Dettagli

INTRODUZIONE AL LIVELLO FISICO: FILE, PAGINE, RECORD E INDICI

INTRODUZIONE AL LIVELLO FISICO: FILE, PAGINE, RECORD E INDICI INTRODUZIONE AL LIVELLO FISICO: FILE, PAGINE, RECORD E INDICI Roberto Basili Corso di Basi di Dati a.a. 2013/14 Dati su dispositivi di memorizzazione esterni Dischi: si può leggere qualunque pagina a costo

Dettagli

SQL: Structured Query Language. T. Catarci, M. Scannapieco, Corso di Basi di Dati, A.A. 2008/2009, Sapienza Università di Roma

SQL: Structured Query Language. T. Catarci, M. Scannapieco, Corso di Basi di Dati, A.A. 2008/2009, Sapienza Università di Roma SQL: Structured Query Language 1 SQL:Componenti Principali Data Manipulation Language (DML): interrogazioni, inserimenti, cancellazioni, modifiche Data Definition Language (DDL): creazione, cancellazione

Dettagli

Imputazione dati mancanti

Imputazione dati mancanti Imputazione dati mancanti Una volta preparata la matrice dei dati, occorre controllare alcuni aspetti delle variabili disponibili. Missing Value Range Minimum & Maximum Extreme Values Per verificare la

Dettagli

RELAZIONI E BASI DI DATI

RELAZIONI E BASI DI DATI Informatica Generale (AA 07/08) Corso di laurea in Scienze della Comunicazione Facoltà di Lettere e Filosofia Università degli Studi di Salerno :Modello Relazionale (2)-Relazioni e DB, valori nulli Prof.

Dettagli

V. Moriggia Modelli di Base Dati. Modelli di Base Dati. a.a. 2001/2002 4.1

V. Moriggia Modelli di Base Dati. Modelli di Base Dati. a.a. 2001/2002 4.1 Modelli di Base Dati 4 Un DBMS: Access a.a. 2001/2002 4.1 DBMS 4.2 DBMS = Data Base Management System Software per la costruzione e la gestione di una base dati Esempi di DBMS: Oracle, MySQL, SQLServer,

Dettagli

Operatori aggregati. Operatori aggregati. Interrogazioni con raggruppamento. Interrogazioni con raggruppamento

Operatori aggregati. Operatori aggregati. Interrogazioni con raggruppamento. Interrogazioni con raggruppamento Operatori aggregati In algebra relazionale le espressioni vengono valutate sulle singole tuple in successione. Talvolta però possono essere necessarie informazioni derivabili dall esame di tutte le tuple

Dettagli

ANALISI DEI DATI PER IL MARKETING Marco Riani

ANALISI DEI DATI PER IL MARKETING Marco Riani ANALISI DEI DATI PER IL MARKETING 2018 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia

Dettagli

1 PROCESSI STOCASTICI... 11

1 PROCESSI STOCASTICI... 11 1 PROCESSI STOCASTICI... 11 Introduzione... 11 Rappresentazione dei dati biomedici... 11 Aleatorietà delle misure temporali... 14 Medie definite sul processo aleatorio... 16 Valore atteso... 16 Esercitazione

Dettagli

Esercitazione n 2. Costruzione di grafici

Esercitazione n 2. Costruzione di grafici Esercitazione n 2 Costruzione di grafici I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e del fenomeno

Dettagli

Parte 6 Esercitazione sull accesso ai file

Parte 6 Esercitazione sull accesso ai file Gestione dei dati Parte 6 Esercitazione sull accesso ai file Maurizio Lenzerini, Riccardo Rosati Facoltà di Ingegneria Sapienza Università di Roma Anno Accademico 2012/2013 http://www.dis.uniroma1.it/~rosati/gd/

Dettagli

Structured Query Language

Structured Query Language IL LINGUAGGIO SQL Structured Query Language Contiene sia il DDL sia il DML, quindi consente di: Definire e creare il database Effettuare l inserimento, la cancellazione, l aggiornamento dei record di un

Dettagli

Controllo Statistico della Qualità (alcune note) A cura della Prof.ssa Paola Vicard e della Prof.ssa Flaminia Musella

Controllo Statistico della Qualità (alcune note) A cura della Prof.ssa Paola Vicard e della Prof.ssa Flaminia Musella Controllo Statistico della Qualità (alcune note) A cura della Prof.ssa Paola Vicard e della Prof.ssa Flaminia Musella Syllabus del modulo (20 ore) Introduzione Alcuni richiami alle nozioni fondamentali

Dettagli

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione I

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione I Ulteriori conoscenze di informatica Elementi di statistica Esercitazione I Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##

Dettagli

Facoltà di Economia Università degli Studi di Cassino a.a. 2013/14

Facoltà di Economia Università degli Studi di Cassino a.a. 2013/14 ESERCIZIO La tabella littlecompany,disponibile sul sito (in formato pdf e xls) riporta i dati relativi a 40 dipendenti dell'azienda Little Company S.r.l. su cui sono state rilevate le seguenti variabili:

Dettagli

E possibile ordinare le righe del risultato di una interrogazione attraverso la clausola order by, a chiusura di una interrogazione.

E possibile ordinare le righe del risultato di una interrogazione attraverso la clausola order by, a chiusura di una interrogazione. Ordinamento E possibile ordinare le righe del risultato di una interrogazione attraverso la clausola order by, a chiusura di una interrogazione. order by AttrdiOrdinamento [asc desc] {, AttrdiOrdinamento

Dettagli

Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione

Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi

Dettagli

Corso di Informatica. Software di produttività personale e database. Ing Pasquale Rota

Corso di Informatica. Software di produttività personale e database. Ing Pasquale Rota Corso di Software di produttività personale e database Ing Pasquale Rota Argomenti I programmi di produttività personale Le basi di dati Fogli elettronici Software di produttività personale e database

Dettagli

2.5 Sottomaschere e Report avanzati MODULO L2

2.5 Sottomaschere e Report avanzati MODULO L2 Dare una breve descrizione dei termini introdotti: (A) CONOSCENZA TERMINOLOGICA Maschera principale Rottura di codice Livelli di gruppo (B) CONOSCENZA E COMPETENZA Rispondere alle seguenti domande producendo

Dettagli

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project

SQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project Database and data mining group, SQL Server 2005 Integration Services SQL Server 2005: ETL - 1 Database and data mining group, Integration Services Project Permette di gestire tutti i processi di ETL Basato

Dettagli

Excel avanzato.

Excel avanzato. Excel avanzato marco.falda@unipd.it I nomi Gli indirizzi e le formule possono essere sostituiti da nomi documentazione astrazione Si creano tramite Inserisci Nome Definisci Vengono raccolti nell area riferimento

Dettagli

Il giorno 18 febbraio 2013 verrà effettuato un esame finale (test) di verifica

Il giorno 18 febbraio 2013 verrà effettuato un esame finale (test) di verifica Titolo del corso Docente Obiettivi del corso Principali argomenti Prerequisiti Sede Calendario Modalità di svolgimento Esame Finale Microsoft Word Livello base Giuseppe Contu Alla fine del corso l allievo

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi

Dettagli

Basi di dati e Relazioni

Basi di dati e Relazioni Matricola Cognome Nome Data di nascita Studenti (Matricola,Cognome,Nome,DataNascita) Corsi (Codice,Titolo,Docente) Esami (Studente,Voto,Corso) Studenti contiene dati su un insieme di studenti Corsi contiene

Dettagli

Basi di dati DBMS Es:

Basi di dati DBMS Es: DATABASE Basi di dati (database): archivi di dati, organizzati in modo integrato attraverso tecniche di modellazione dei dati e gestiti sulle memorie di massa dei computer attraverso appositi software

Dettagli

Capitolo 3 - Popolazione e famiglie

Capitolo 3 - Popolazione e famiglie 1 Capitolo 3 - Popolazione e famiglie Elaborazione dati sui permessi di soggiorno dei cittadini stranieri (E) Fenomeni: Cittadini non comunitari regolarmente soggiornanti Unità d'analisi: Cittadini stranieri

Dettagli

Revisione dell EDP contabile A.A

Revisione dell EDP contabile A.A Revisione dell EDP contabile A.A. 2007-08 L automazione dell audit Dato l aumento delle procedure di audit derivate dalle recenti emissioni di nuovi standards e disposizioni, gli strumenti di audit supportati

Dettagli

WEKA Data Mining System

WEKA Data Mining System Alma Mater Studiorum Università di Bologna WEKA Data Mining System Sistemi Informativi a supporto delle Decisioni LS - Prof. Marco Patella Presentazione di: Fabio Bertozzi, Giacomo Carli 1 WEKA: the bird

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizio 1 (stima puntuale) In un processo di controllo di qualità, siamo interessati al numero mensile di guasti

Dettagli

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1 Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa

Dettagli

Sistemi di Elaborazione delle Informazioni

Sistemi di Elaborazione delle Informazioni SCUOLA DI MEDICINA E CHIRURGIA Università degli Studi di Napoli Federico II Corso di Sistemi di Elaborazione delle Informazioni Dott. Francesco Rossi a.a. 2017/2018 1 Sesta parte Interrogazione di una

Dettagli

Manuale per la valutazione del rischio chimico in Alfagest Web

Manuale per la valutazione del rischio chimico in Alfagest Web 4. Personal 4.0.. Dienststelle für Arbeitsschutz 4. Personale 4.0.. Servizio di prevenzione e protezione Manuale per la valutazione del rischio chimico in Alfagest Web Indirizzo intranet: http://alfagest.prov.bz/gen_login.aspx

Dettagli

:33 Pagina V. Indice. Introduzione

:33 Pagina V. Indice. Introduzione 00 20-09-2004 16:33 Pagina V Indice Introduzione XIII Capitolo 1 Gestione dei dati 1 1.1 Gli elenchi 1 Progettazione di un elenco 2 Inserimento dei dati nell elenco 3 1.2 Filtro di elenchi 5 Il filtro

Dettagli

BASE DI DATI. collezione di dati, utilizzati per rappresentare le. (accezione specifica) collezione di dati gestita da un DBMS. (accezione generica)

BASE DI DATI. collezione di dati, utilizzati per rappresentare le. (accezione specifica) collezione di dati gestita da un DBMS. (accezione generica) BASE DI DATI (accezione generica) collezione di dati, utilizzati per rappresentare le informazioni di interesse per una o più applicazioni di una organizzazione. (accezione specifica) collezione di dati

Dettagli

1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione

1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione Inferenza di Intervallo 1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione T = 300 K σ T = 50 a. Calcolare un

Dettagli

Interrogazioni di tipo insiemistico. Select. Interrogazioni di tipo insiemistico. Interrogazioni nidificate

Interrogazioni di tipo insiemistico. Select. Interrogazioni di tipo insiemistico. Interrogazioni nidificate Select La sintassi di select cui siamo arrivati dopo le estensioni viste è quindi: SelectSQL ::= select ListaAttributiOEspressioni from ListaTabelle [ where CondizioniSemplici ] [ group by ListaAttributiDiRaggruppamento]

Dettagli

viii Indice generale

viii Indice generale Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi

Dettagli

Analisi univariata Analisi bivariata Analisi multivariata

Analisi univariata Analisi bivariata Analisi multivariata L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione consiste di tre fasi: Analisi

Dettagli

Indicizzazione di feature locali. Annalisa Franco

Indicizzazione di feature locali. Annalisa Franco 1 Indicizzazione di feature locali Annalisa Franco annalisa.franco@unibo.it http://bias.csr.unibo.it/vr/ 2 Introduzione I descrittori locali sono vettori di uno spazio N- dimensionale (alta dimensionalità)

Dettagli

Tipo Livello e Corso di Studio Anno di corso Semestre e modulo Numero di crediti 3 Propedeuticità Docente Cognome Nome

Tipo Livello e Corso di Studio Anno di corso Semestre e modulo Numero di crediti 3 Propedeuticità Docente Cognome Nome Insegnamento Informatica Tipo Livello e Corso di Studio Anno di corso 2013-2014 Semestre e modulo Numero di crediti 3 Propedeuticità Docente Cognome Nome Vinci Mauro Dipartimento Stanza Telefono Email

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

Esercitazione n 3. Ancora grafici

Esercitazione n 3. Ancora grafici Esercitazione n 3 Ancora grafici I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e del fenomeno

Dettagli

MS Access: Tutorial Tabelle, Relazioni

MS Access: Tutorial Tabelle, Relazioni Università Magna Graecia di Catanzaro Informatica MS Access: Tutorial Tabelle, Relazioni Docente : Alfredo Cuzzocrea e-mail : cuzzocrea@si.deis.unical.it Tel. : 0984 831730 Microsoft Access Tutorial Tabelle,

Dettagli

Basi di dati. Concetti introduttivi

Basi di dati. Concetti introduttivi Basi di dati Concetti introduttivi ESEMPIO INSEGNAMENTI Fisica, Analisi, Informatica Aule Docenti Entità Relazioni Interrogazioni Studenti Database 2 Tabella (I) STUDENTE Attributi Nome Data di Nascita

Dettagli

Classificazione con Weka Testi degli esercizi. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna

Classificazione con Weka Testi degli esercizi. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Classificazione con Weka Testi degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Pre processing bank data Il date set bank-data.csv 600 istanze Nessun dato missing Attributo

Dettagli

Model o relazionale 1

Model o relazionale 1 Modello relazionale 1 Definizioni Base di dati insieme di tabelle tabella = relazione Tabella collezione di righe riga = tupla Riga insieme di coppie (attributo, valore) attributo = colonna = campo 2 Esempio:

Dettagli

Cenni di apprendimento in Reti Bayesiane

Cenni di apprendimento in Reti Bayesiane Sistemi Intelligenti 216 Cenni di apprendimento in Reti Bayesiane Esistono diverse varianti di compiti di apprendimento La struttura della rete può essere nota o sconosciuta Esempi di apprendimento possono

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Il Modello Relazionale e le operazioni

Il Modello Relazionale e le operazioni Il Modello Relazionale e le operazioni Prof. Giuseppe Di Capua UD 5 Modello Logico Nello sviluppo della teoria dei database sono emersi quattro tipi diversi di modelli per le basi di dati: 1. Modello gerarchico

Dettagli

Mattia Fazzi: 02/04/2019

Mattia Fazzi: 02/04/2019 Mattia Fazzi: mattia.fazzi@student.unife.it 02/04/2019 MODELLO RELAZIONALE Il modello dei dati relazionale è basato sul concetto di relazione. Una relazione è una tabella di valori: Che può essere pensata

Dettagli

Computazione per l interazione naturale: macchine che apprendono

Computazione per l interazione naturale: macchine che apprendono Computazione per l interazione naturale: macchine che apprendono Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@dsi.unimi.it

Dettagli

Indice Prefazione Funzionalit `a e architettura dei DBMS La gestione della memoria permanente e del buffer Organizzazioni seriale e sequenziale

Indice Prefazione Funzionalit `a e architettura dei DBMS La gestione della memoria permanente e del buffer Organizzazioni seriale e sequenziale Prefazione XI 1 Funzionalità e architettura dei DBMS 1 1.1 I DBMS............................... 1 1.2 Architettura dei DBMS....................... 3 1.3 Il sistema JRS............................ 5 1.4

Dettagli

PROGRAMMAZIONE ANNO SCOLASTICO 2018/2019

PROGRAMMAZIONE ANNO SCOLASTICO 2018/2019 Istituto Istruzione Superiore Cristoforo Colombo Liceo Scientifico delle Scienze applicate Liceo Scientifico Sportivo Istituto Tecnologico indirizzo Costruzioni Ambiente e Territorio Istituto Tecnico Economico:

Dettagli

lezione 13 AA Paolo Brunori

lezione 13 AA Paolo Brunori AA 2016-2017 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

INTRODUZIONE ALLE BASI DATI RELAZIONALI

INTRODUZIONE ALLE BASI DATI RELAZIONALI INTRODUZIONE ALLE BASI DATI RELAZIONALI RELAZIONI E TABELLE Nelle BASI DI DATI RELAZIONALI le informazioni sono organizzate in TABELLE; Le tabelle sono rappresentate mediante griglie suddivise in RIGHE

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili

Dettagli

PROCEDURA MAPPATURA SINISTRI

PROCEDURA MAPPATURA SINISTRI Pagina 1 di 14 PROCEDURA MAPPATURA SINISTRI Revisione Prima emissione Data. Descrizione delle modifiche Redazione Verifica Approvazione PR 2- v 0 17-09-14 Pagina 2 di 14 1. Campo di applicazione La presente

Dettagli

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...

STATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:... STATISTICA CORSO BASE. Prova scritta del 4-6-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia

Dettagli

Esercitazione # 3. Trovate la probabilita che in 5 lanci di un dado non truccato il 3 si presenti

Esercitazione # 3. Trovate la probabilita che in 5 lanci di un dado non truccato il 3 si presenti Statistica Matematica A Esercitazione # 3 Binomiale: Esercizio # 1 Trovate la probabilita che in 5 lanci di un dado non truccato il 3 si presenti 1. mai 2. almeno una volta 3. quattro volte Esercizio #

Dettagli

Strumenti per l Analisi l. ed il Preprocessing dei dati. Francesco Folino. Introduzione

Strumenti per l Analisi l. ed il Preprocessing dei dati. Francesco Folino. Introduzione Strumenti per l Analisi l ed il Preprocessing dei dati Francesco Folino Obiettivo Introdurre gli aspetti essenziali della fase di preparazione dei dati Acquisire padronanza di un processo tipicamente artigianale

Dettagli

Computazione per l interazione naturale: macchine che apprendono

Computazione per l interazione naturale: macchine che apprendono Comput per l inter naturale: macchine che apprendono Corso di Inter uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it http://boccignone.di.unimi.it/ium2_2014.html

Dettagli

SQL. Università degli Studi di Salerno. Corso di Laurea in Scienze della Comunicazione Informatica generale (matr. Dispari) Docente: Angela Peduto

SQL. Università degli Studi di Salerno. Corso di Laurea in Scienze della Comunicazione Informatica generale (matr. Dispari) Docente: Angela Peduto SQL Università degli Studi di Salerno Corso di Laurea in Scienze della Comunicazione Informatica generale (matr. Dispari) Docente: Angela Peduto A.A. 2005/2006 Select La forma di select cui siamo arrivati

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata

Dettagli

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

Analysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008.

Analysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008. SQL Server Business Intelligence Development Studio Analysis Service Dutto Riccardo riccardo.dutto@polito.it IPSI - tel.7991 http://dbdmg.polito.it/ Il Data warehouse Sorgenti dati operazionali DB relazionali

Dettagli

Access 2007 Colonna di ricerca

Access 2007 Colonna di ricerca Pagina 1 di 7 Lezioni on line -> Gestire i dati Access 2007 Colonna di ricerca Quando si riempiono i campi dei record che formano una tabella, può essere utile e comodo poter scegliere, in un elenco dei

Dettagli

BASE DI DATI. (accezione specifica) collezione di dati gestita da un DBMS. Università degli Studi di Cassino

BASE DI DATI. (accezione specifica) collezione di dati gestita da un DBMS. Università degli Studi di Cassino BASE DI DATI (accezione generica) collezione di dati, utilizzati per rappresentare le informazioni di interesse per una o più applicazioni di una organizzazione. (accezione specifica) collezione di dati

Dettagli