Pre-elaborazione dei dati (Data pre-processing)
|
|
- Fabiana Ferrante
- 5 anni fa
- Visualizzazioni
Transcript
1 Pre-elaborazione dei dati (Data pre-processing) I dati nel mondo reale sono sporchi incompleti: mancano valori per gli attributi, mancano attributi importanti, solo valori aggregati rumorosi: contengono errori e/o outliers inconsistenti: contengono codici o nomi diversi per gli stessi dati Senza dati di qualita` non c e` analisi di qualita` decisioni di qualita` debbono essere basate su dati di qualita` il data warehouse richiede una integrazione consistente di dati di qualita`
2 Una misura multi-dimensionale della qualita` dei dati accuratezza completezza consistenza tempestivita` credibilita` a valore aggiunto interpretabilita` accessibilita`
3 Attivita` principali nel data pre-processing pulizia dei dati (data cleaning) aggiunta di valori mancanti, aggiustamento dei dati rumorosi, identificazione e eliminazione degli outliers, soluzione delle inconsistenze Integrazione dei dati integrazione di database, cubi e files Trasformazione dei dati normalizzazione e aggregazione Riduzione dei dati riduzione del volume dei dati mantenendo la qualita` dell analisi Discretizzazione dei dati
4 Pulizia dei dati (data cleaning) attivita` di data cleaning: aggiunta dei dati mancanti identificazione degli outliers e riduzione dei dati rumorosi correzione dei dati inconsistenti
5 Dati mancanti I dati non sono sempre disponibili molte tuple non hanno valori registrati per alcuni attributi, p.e. il reddito dei clienti nei dati delle vendite La mancanza dei dati puo` essere dovuta a: malfunzionamento dei sistemi di acquisizione cancellazione dovuta a inconsistenza con dati gia` registrati dati non inseriti per incomprensione certi dati possono non essere considerati importanti al momento dell inserimento mancanza di registrazione dei cambiamenti nei dati Ci puo` essere necessita` di inferire i dati mancanti
6 Trattamento dei dati mancanti ingnorare la tupla; aggiungere il valore mancante manualmente usare globalmente una costante per i valori mancanti: p.e. non disponibile usare il valor medio dell attributo usare il valore piu` probabile dopo aver applicato una tecnica di inferenza (Bayesiana o albero di decisione) Uisare la correlazione con altri attributi se possibile
7 Esercitazione Usando i dati del file Catalogs.XLS sostituire il dato NA in history con un valore accettabile. Suggerimento: studiare separatamente le distribuzioni dei bassospendenti, medio-spendenti, alto-spendenti; eliminare gli outliers; calcolare le medie; classificare le history in base alle medie ottenute e ai dati di spesa dell anno in corso.
8 Dati rumorosi Rumore: errore o varianza random sui valori di una variabile Valori scorretti di un attributo possono essere dovuti a: strumenti difettosi di raccolta dati problemi di immissione dei dati problemi di trasmissione dei dati limitazioni tecnologiche inconsistenze nelle convenzioni di rappresentazione Ulteriori problemi che richiedono pulizia dei dati record duplicati dati incompleti dati inconsistenti
9 Trattamento dei dati rumorosi Binning (partizionamento): si ordinano i dati e si partizionano in bins (gruppi) di uguale dimensione) si riducono le differenze (smoothing) all interno dei bins o per valori medi, o per valori mediani, o per i valori min e max, ecc. Clustering con algoritmi di clustering si individuano e rimuovono gli outliers Combinazione di ispezione automatica e manuale determinare automaticamente i valori sospetti e farli controllare da un esperto Analisi di regressione determina gli outliers e consente di avvicinarli alla curva (fitting sulla curva)
10 Esempi di binning supponiamo di avere la seguente lista di prezzi: 4,8,9,15,21,21,24,25,26,28,29,34 Partizionamento in bins di uguale dimensione: Bin 1: 4,8,9,15 Bin 2: 21,21,24,25 Bin 3: 26,28,29,34 Smoothing usando la media: Bin 1: 9,9,9,9 Bin 2: 23,23,23,23 Bin 3: 29,29,29,29 Smoothing usando gli estremi dell intervallo Bin 1: 4,4,4,15 Bin 2: 21,21,25,25 Bin 3: 26,26,26,34
11 Esempio di scoperta di outliers Usando il file EXPENSES: Trovare gli outliers di Salary rispetto ad una distribuzione normale Trovare gli outliers di Dining rispetto a Salary mediante analisi di regressione.
12 Esempio di data cleaning in Excel Il file CLEANSING.XLS contiene i dati di 1500 clienti di una compagnia verificare che i Social Security Numbers siano tutti diversi verificare se le date di nascita contengono valori improbabili (possibili valori sconosciuti!!) verificare se i valori del campo eta` (age) contengono valori improbabili (problema anno 2000 ) verificare il campo region (possibili errori di digitazione!!) verificare il campo CredCardUser (possibile errore di formattazione) Verificare i campi Income e Purchases per missing values e outliers
13 Esercitazione Il file P04_03 contiene i dati di 500 abitazioni in un quartiere medio: Dimensione della famiglia Posizione dell abitazione nel quartiere Abitazione in affitto o di proprieta` Reddito lordo del residente col reddito piu` alto Reddito lordo del secondo residente col reddito piu` alto (se esiste) Affitto o mutuo mensile Spesa media mensile in acqua, gas ecc. Indebitamento totale (incluso il mutuo) Effettuare la pulizia dei dati
14 Filtraggio (interrogazione) di tabelle Excel: uso di AutoFilter Esempio: il file CATALOGS.XLS contiene i dati per i clienti di una compagnia di vendita per corrispondenza mediante l uso di AutoFilter ottenere le seguenti informazioni: selezionare i clienti con esattamente 2 figli selezionare i clienti maschi con esattamente 2 figli selezionare clienti con salario compreso tra e (custom query) copiare i risultati di una query per effettuare statistiche Nota bene (per quelli che sanno di database): autofilter consente di effettuare operazioni di selection e projection su una singola tabella relazionale.
15 Esercitazione Il file P04_01 contiene dati che rappresentano 30 risposte a un questionario sulle politiche ambientali del governo. Usando Autofilter: 1. Identificare tutte le risposte di donne, di mezza eta`, con 2 figli. Qual e` il loro salario medio? 2. Identificare tutte le risposte di anziani in forte disaccordo con le politiche governative. Qual e` il loro salario medio? 3. Identificare tutte le risposte in forte accordo con le politiche governative. Qual e` la percentuale di giovani tra questi ultimi?
Analisi dei Dati. Lezione 9 - Preprocessing dei dati
Analisi dei Dati Lezione 9 - Preprocessing dei dati Motivazioni I dati nel mondo reale sono sporchi incompleti: mancano valori per gli attributi, mancano attributi importanti, solo valori aggregati rumorosi:
DettagliStatistica descrittiva: analisi di regressione
Statistica descrittiva: analisi di regressione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
DettagliStatistica descrittiva
Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto
DettagliMaschere e Query. C. Marrocco. Università degli Studi di Cassino
Maschere e Query Le Maschere Per visualizzare e immettere i dati in una tabella è possibile utilizzare le maschere. Le maschere sono simili a moduli cartacei: ad ogni campo corrisponde un etichetta ed
DettagliI Componenti del processo decisionale 7
Indice Introduzione 1 I Componenti del processo decisionale 7 1 Business intelligence 9 1.1 Decisioni efficaci e tempestive........ 9 1.2 Dati, informazioni e conoscenza....... 12 1.3 Ruolo dei modelli
DettagliEsplorazione dei dati. Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi
Esplorazione dei dati Lucidi e dataset tratti da Turini - Analisi dei Dati, Dip. Inf. Unipi Analisi mono e bivariata Si utilizzano indicatori sintetici che individuano, con un singolo valore, proprieta`
DettagliMS Access Un DBMS relazionale per Windows?
MS Access Un DBMS relazionale per Windows? Quali DBMS in ambiente PC: dbase (ver. 5 per windows) FoxPro (per windows) Access (per windows) SQL Server (client/server) Oracle (client/server) Informix (client/server)...
DettagliACCESS. Database: archivio elettronico, dotato di un programma di interfaccia che facilita la registrazione e la ricerca dei dati.
ACCESS Database: archivio elettronico, dotato di un programma di interfaccia che facilita la registrazione e la ricerca dei dati. Database Relazionale: tipo di database attualmente più diffuso grazie alla
DettagliStatistica descrittiva: misure di associazione
Statistica descrittiva: misure di associazione L analisi di regressione permette di esplorare le relazioni tra due insiemi di valori (p.e. i valori di due attributi di un campione) alla ricerca di associazioni.
DettagliCorso di Access Modulo L2 A (Access) I tipi di query
Corso di Access Modulo L2 A (Access) 2.3.2 I tipi di query 1 Prerequisiti Concetto di database relazionale Utilizzo elementare del computer Concetti fondamentali di basi di dati Interrogazione di un DB
DettagliANALISI DEI DATI PER IL MARKETING 2017
ANALISI DEI DATI PER IL MARKETING 2017 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia
DettagliLe basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza
Definizione 1 Lezione 2 Le basi di dati Gli archivi di dati Organizzato in modo integrato attraverso tecniche di modellazione di dati Gestiti su memorie di massa Con l obiettivo Efficienza trattamento
DettagliOrdinamento dati La funzione Ordina disponibile nel menù consente di ordinare la matrice dati in base alla variabile scelta
Excel è un applicazione di foglio elettronico che permette di raccogliere ed elaborare i dati inseriti dall utente. Inserimento dati I dati vengono raccolti in tabelle. Tabella: insieme di celle disposte
DettagliUlteriori conoscenze di informatica Elementi di statistica Esercitazione3
Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3 Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##
DettagliMicrosoft Access. Nozioni di base. Contatti: Dott.ssa Silvia Bonfanti
Microsoft Access Nozioni di base Contatti: Dott.ssa Silvia Bonfanti silvia.bonfanti@unibg.it Introduzione In questa lezione vedremo lo strumento Microsoft Access ed impareremo come realizzare con esso
DettagliPIL Percorsi di Inserimento Lavorativo
PIL - 2008 Percorsi di Inserimento Lavorativo Basi di Dati - Lezione 2 Il Modello Relazionale Il modello relazionale rappresenta il database come un insieme di relazioni. Ogni RELAZIONE è una tabella con:
DettagliRelazioni e tabelle. Introduzione alle Basi di Dati Relazionali. Relazioni uno a uno. Esempio
Relazioni e tabelle Introduzione alle Basi di Dati Relazionali Nelle Basi di Dati relazionali le informazioni sono organizzate in tabelle Le tabelle sono rappresentate mediante griglie suddivise in colonne
DettagliI DATI E LA LORO INTEGRAZIONE 63 4/001.0
I DATI E LA LORO INTEGRAZIONE 63 4/001.0 L INTEGRAZIONE DEI DATI INTEGRAZIONE DEI DATI SIGNIFICA LA CONDIVISIONE DEGLI ARCHIVI DA PARTE DI PIÙ AREE FUNZIONALI, PROCESSI E PROCEDURE AUTOMATIZZATE NELL AMBITO
DettagliDatabases. Architettura di un DBMS: Struttura ad indice per i files, B + -Trees
Databases Architettura di un DBMS: Struttura ad indice per i files, B + -Trees Indici Un indice consiste di coppie e supporta l efficiente recupero di tutte le etichette con chiave
Dettagli( ) ( ) ( e la probabilità che si verifichi un evento compreso tra c e b a < c < b sarà data da:
e la probabilità che si verifichi un evento compreso tra c e b a < c < b sarà data da: p ( ) ( c < X < b) f ( x) LA VC NORMALE O GAUSSIANA Una vc si dice normale o gaussiana (da Gauss che la propose come
DettagliINTRODUZIONE AL 2 TEST IN ITINERE. a.a
INTRODUZIONE AL 2 TEST IN ITINERE a.a. 2014-15 Modalità d esame Tipologia degli studenti: A(ll). Non Sufficienti al Primo Test in Itinere (su tutto il programma sino ad SQL base). Si presentano su tutto
DettagliFILE E INDICI Architettura DBMS
FILE E INDICI Architettura DBMS Giorgio Giacinto 2010 Database 2 Dati su dispositivi di memorizzazione esterni! Dischi! si può leggere qualunque pagina a costo medio fisso! Nastri! si possono leggere le
DettagliCorso sul linguaggio SQL
Corso sul linguaggio SQL Modulo L2B (SQL) 3 - Aggiornamento dati 1 Prerequisiti Conoscenza tipi di dato in SQL Creare e gestire tabelle e indici 2 1 Introduzione In questa Unità descriviamo la parte di
DettagliComputazione per l interazione naturale: Modelli dinamici
Computazione per l interazione naturale: Modelli dinamici Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@dsi.unimi.it
DettagliUniversità degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali
Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 014/015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si
DettagliEsercizi di SQL Matteo Magnani, Danilo Montesi Università di Bologna. Esercizi di SQL
Esercizi di SQL Creare una tabella Docente, con i campi Codice, di 4 caratteri e chiave primaria, Nome, fino a 20 caratteri, Cognome, fino a 30 caratteri, Tipo, fino a caratteri, Superiore, di 4 caratteri
Dettagli9In questa sezione. Ordinare e filtrare i dati. Dopo aver aggiunto dati ai fogli di lavoro, potresti voler
9In questa sezione Ordinare e filtrare i dati Ordinare i dati del foglio di lavoro Creare un elenco personalizzato Filtrare rapidamente i dati con Filtro automatico Creare un filtro avanzato Convalidare
DettagliStrutture fisiche e strutture di accesso ai dati
Strutture fisiche e strutture di accesso ai dati 1 A L B E R T O B E L U S S I P R I M A P A R T E A N N O A C C A D E M I C O 2 0 1 2-2 0 1 3 Gestore dei metodi di accesso 2 E il modulo del DBMS che esegue
DettagliImparare a utilizzare le formule e le funzioni
Imparare a utilizzare le formule e le funzioni Eseguire calcoli, di tipo semplice o complesso, può essere un'attività noiosa e che richiede tempo. È possibile semplificare le operazioni di calcolo mediante
DettagliUniversità di Cassino Facoltà di Ingegneria Modulo di Alfabetizzazione Informatica. Base Dati. Progettazione di un DB
Università di Cassino Facoltà di Ingegneria Modulo di Alfabetizzazione Informatica Base Dati Si ringrazia l ing. Francesco Colace dell Università di Salerno Progettazione di un DB Un esempio può essere
DettagliCaratteristiche dei linguaggi per Database
IL LINGUAGGIO Caratteristiche dei linguaggi per Database I linguaggi per basi di dati relazionali possiedono i comandi per: definizione del data base; manipolazione dei dati; associazione tra tabelle diverse;
DettagliINTRODUZIONE AL LIVELLO FISICO: FILE, PAGINE, RECORD E INDICI
INTRODUZIONE AL LIVELLO FISICO: FILE, PAGINE, RECORD E INDICI Roberto Basili Corso di Basi di Dati a.a. 2013/14 Dati su dispositivi di memorizzazione esterni Dischi: si può leggere qualunque pagina a costo
DettagliSQL: Structured Query Language. T. Catarci, M. Scannapieco, Corso di Basi di Dati, A.A. 2008/2009, Sapienza Università di Roma
SQL: Structured Query Language 1 SQL:Componenti Principali Data Manipulation Language (DML): interrogazioni, inserimenti, cancellazioni, modifiche Data Definition Language (DDL): creazione, cancellazione
DettagliImputazione dati mancanti
Imputazione dati mancanti Una volta preparata la matrice dei dati, occorre controllare alcuni aspetti delle variabili disponibili. Missing Value Range Minimum & Maximum Extreme Values Per verificare la
DettagliRELAZIONI E BASI DI DATI
Informatica Generale (AA 07/08) Corso di laurea in Scienze della Comunicazione Facoltà di Lettere e Filosofia Università degli Studi di Salerno :Modello Relazionale (2)-Relazioni e DB, valori nulli Prof.
DettagliV. Moriggia Modelli di Base Dati. Modelli di Base Dati. a.a. 2001/2002 4.1
Modelli di Base Dati 4 Un DBMS: Access a.a. 2001/2002 4.1 DBMS 4.2 DBMS = Data Base Management System Software per la costruzione e la gestione di una base dati Esempi di DBMS: Oracle, MySQL, SQLServer,
DettagliOperatori aggregati. Operatori aggregati. Interrogazioni con raggruppamento. Interrogazioni con raggruppamento
Operatori aggregati In algebra relazionale le espressioni vengono valutate sulle singole tuple in successione. Talvolta però possono essere necessarie informazioni derivabili dall esame di tutte le tuple
DettagliANALISI DEI DATI PER IL MARKETING Marco Riani
ANALISI DEI DATI PER IL MARKETING 2018 Marco Riani mriani@unipr.it http://www.riani.it TRATTAMENTI PRELIMINARI DEI DATI Pulizia dei dati (data cleaning) = processo capace di garantire, con una certa soglia
Dettagli1 PROCESSI STOCASTICI... 11
1 PROCESSI STOCASTICI... 11 Introduzione... 11 Rappresentazione dei dati biomedici... 11 Aleatorietà delle misure temporali... 14 Medie definite sul processo aleatorio... 16 Valore atteso... 16 Esercitazione
DettagliEsercitazione n 2. Costruzione di grafici
Esercitazione n 2 Costruzione di grafici I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e del fenomeno
DettagliParte 6 Esercitazione sull accesso ai file
Gestione dei dati Parte 6 Esercitazione sull accesso ai file Maurizio Lenzerini, Riccardo Rosati Facoltà di Ingegneria Sapienza Università di Roma Anno Accademico 2012/2013 http://www.dis.uniroma1.it/~rosati/gd/
DettagliStructured Query Language
IL LINGUAGGIO SQL Structured Query Language Contiene sia il DDL sia il DML, quindi consente di: Definire e creare il database Effettuare l inserimento, la cancellazione, l aggiornamento dei record di un
DettagliControllo Statistico della Qualità (alcune note) A cura della Prof.ssa Paola Vicard e della Prof.ssa Flaminia Musella
Controllo Statistico della Qualità (alcune note) A cura della Prof.ssa Paola Vicard e della Prof.ssa Flaminia Musella Syllabus del modulo (20 ore) Introduzione Alcuni richiami alle nozioni fondamentali
DettagliUlteriori conoscenze di informatica Elementi di statistica Esercitazione I
Ulteriori conoscenze di informatica Elementi di statistica Esercitazione I Sui PC a disposizione sono istallati diversi sistemi operativi. All accensione scegliere Windows. Immettere Nome utente b## (##
DettagliFacoltà di Economia Università degli Studi di Cassino a.a. 2013/14
ESERCIZIO La tabella littlecompany,disponibile sul sito (in formato pdf e xls) riporta i dati relativi a 40 dipendenti dell'azienda Little Company S.r.l. su cui sono state rilevate le seguenti variabili:
DettagliE possibile ordinare le righe del risultato di una interrogazione attraverso la clausola order by, a chiusura di una interrogazione.
Ordinamento E possibile ordinare le righe del risultato di una interrogazione attraverso la clausola order by, a chiusura di una interrogazione. order by AttrdiOrdinamento [asc desc] {, AttrdiOrdinamento
DettagliMetodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione
Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università degli Studi
DettagliCorso di Informatica. Software di produttività personale e database. Ing Pasquale Rota
Corso di Software di produttività personale e database Ing Pasquale Rota Argomenti I programmi di produttività personale Le basi di dati Fogli elettronici Software di produttività personale e database
Dettagli2.5 Sottomaschere e Report avanzati MODULO L2
Dare una breve descrizione dei termini introdotti: (A) CONOSCENZA TERMINOLOGICA Maschera principale Rottura di codice Livelli di gruppo (B) CONOSCENZA E COMPETENZA Rispondere alle seguenti domande producendo
DettagliSQL Server Integration Services. SQL Server 2005: ETL - 1. Integration Services Project
Database and data mining group, SQL Server 2005 Integration Services SQL Server 2005: ETL - 1 Database and data mining group, Integration Services Project Permette di gestire tutti i processi di ETL Basato
DettagliExcel avanzato.
Excel avanzato marco.falda@unipd.it I nomi Gli indirizzi e le formule possono essere sostituiti da nomi documentazione astrazione Si creano tramite Inserisci Nome Definisci Vengono raccolti nell area riferimento
DettagliIl giorno 18 febbraio 2013 verrà effettuato un esame finale (test) di verifica
Titolo del corso Docente Obiettivi del corso Principali argomenti Prerequisiti Sede Calendario Modalità di svolgimento Esame Finale Microsoft Word Livello base Giuseppe Contu Alla fine del corso l allievo
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2017-2018 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliCorso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio
Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi
DettagliBasi di dati e Relazioni
Matricola Cognome Nome Data di nascita Studenti (Matricola,Cognome,Nome,DataNascita) Corsi (Codice,Titolo,Docente) Esami (Studente,Voto,Corso) Studenti contiene dati su un insieme di studenti Corsi contiene
DettagliBasi di dati DBMS Es:
DATABASE Basi di dati (database): archivi di dati, organizzati in modo integrato attraverso tecniche di modellazione dei dati e gestiti sulle memorie di massa dei computer attraverso appositi software
DettagliCapitolo 3 - Popolazione e famiglie
1 Capitolo 3 - Popolazione e famiglie Elaborazione dati sui permessi di soggiorno dei cittadini stranieri (E) Fenomeni: Cittadini non comunitari regolarmente soggiornanti Unità d'analisi: Cittadini stranieri
DettagliRevisione dell EDP contabile A.A
Revisione dell EDP contabile A.A. 2007-08 L automazione dell audit Dato l aumento delle procedure di audit derivate dalle recenti emissioni di nuovi standards e disposizioni, gli strumenti di audit supportati
DettagliWEKA Data Mining System
Alma Mater Studiorum Università di Bologna WEKA Data Mining System Sistemi Informativi a supporto delle Decisioni LS - Prof. Marco Patella Presentazione di: Fabio Bertozzi, Giacomo Carli 1 WEKA: the bird
DettagliStatistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: folgieri@mtcube.com aa 2009/2010 Esercizio 1 (stima puntuale) In un processo di controllo di qualità, siamo interessati al numero mensile di guasti
DettagliStatistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1
Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa
DettagliSistemi di Elaborazione delle Informazioni
SCUOLA DI MEDICINA E CHIRURGIA Università degli Studi di Napoli Federico II Corso di Sistemi di Elaborazione delle Informazioni Dott. Francesco Rossi a.a. 2017/2018 1 Sesta parte Interrogazione di una
DettagliManuale per la valutazione del rischio chimico in Alfagest Web
4. Personal 4.0.. Dienststelle für Arbeitsschutz 4. Personale 4.0.. Servizio di prevenzione e protezione Manuale per la valutazione del rischio chimico in Alfagest Web Indirizzo intranet: http://alfagest.prov.bz/gen_login.aspx
Dettagli:33 Pagina V. Indice. Introduzione
00 20-09-2004 16:33 Pagina V Indice Introduzione XIII Capitolo 1 Gestione dei dati 1 1.1 Gli elenchi 1 Progettazione di un elenco 2 Inserimento dei dati nell elenco 3 1.2 Filtro di elenchi 5 Il filtro
DettagliBASE DI DATI. collezione di dati, utilizzati per rappresentare le. (accezione specifica) collezione di dati gestita da un DBMS. (accezione generica)
BASE DI DATI (accezione generica) collezione di dati, utilizzati per rappresentare le informazioni di interesse per una o più applicazioni di una organizzazione. (accezione specifica) collezione di dati
Dettagli1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione
Inferenza di Intervallo 1. Sono state eseguite 250 misure di temperatura che hanno rivelato i seguenti valori stimati di media e di deviazione standard per il campione T = 300 K σ T = 50 a. Calcolare un
DettagliInterrogazioni di tipo insiemistico. Select. Interrogazioni di tipo insiemistico. Interrogazioni nidificate
Select La sintassi di select cui siamo arrivati dopo le estensioni viste è quindi: SelectSQL ::= select ListaAttributiOEspressioni from ListaTabelle [ where CondizioniSemplici ] [ group by ListaAttributiDiRaggruppamento]
Dettagliviii Indice generale
Indice generale 1 Introduzione al processo di ricerca 1 Sommario 1 Il processo di ricerca 3 Concetti e variabili 5 Scale di misura 8 Test di ipotesi 10 Evidenza empirica 10 Disegni di ricerca 11 Sintesi
DettagliAnalisi univariata Analisi bivariata Analisi multivariata
L analisi esplorativa dei dati evidenzia, tramite grafici ed indicatori sintetici, le caratteristiche di ciascun attributo presente in un dataset. Il processo di esplorazione consiste di tre fasi: Analisi
DettagliIndicizzazione di feature locali. Annalisa Franco
1 Indicizzazione di feature locali Annalisa Franco annalisa.franco@unibo.it http://bias.csr.unibo.it/vr/ 2 Introduzione I descrittori locali sono vettori di uno spazio N- dimensionale (alta dimensionalità)
DettagliTipo Livello e Corso di Studio Anno di corso Semestre e modulo Numero di crediti 3 Propedeuticità Docente Cognome Nome
Insegnamento Informatica Tipo Livello e Corso di Studio Anno di corso 2013-2014 Semestre e modulo Numero di crediti 3 Propedeuticità Docente Cognome Nome Vinci Mauro Dipartimento Stanza Telefono Email
DettagliIndice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
DettagliEsercitazione n 3. Ancora grafici
Esercitazione n 3 Ancora grafici I grafici I grafici sono rappresentazione di dati numerici e/o di funzioni. Devono facilitare all utente la visualizzazione e la comprensione dei numeri e del fenomeno
DettagliMS Access: Tutorial Tabelle, Relazioni
Università Magna Graecia di Catanzaro Informatica MS Access: Tutorial Tabelle, Relazioni Docente : Alfredo Cuzzocrea e-mail : cuzzocrea@si.deis.unical.it Tel. : 0984 831730 Microsoft Access Tutorial Tabelle,
DettagliBasi di dati. Concetti introduttivi
Basi di dati Concetti introduttivi ESEMPIO INSEGNAMENTI Fisica, Analisi, Informatica Aule Docenti Entità Relazioni Interrogazioni Studenti Database 2 Tabella (I) STUDENTE Attributi Nome Data di Nascita
DettagliClassificazione con Weka Testi degli esercizi. Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna
Classificazione con Weka Testi degli esercizi Prof. Matteo Golfarelli Alma Mater Studiorum - Università di Bologna Pre processing bank data Il date set bank-data.csv 600 istanze Nessun dato missing Attributo
DettagliModel o relazionale 1
Modello relazionale 1 Definizioni Base di dati insieme di tabelle tabella = relazione Tabella collezione di righe riga = tupla Riga insieme di coppie (attributo, valore) attributo = colonna = campo 2 Esempio:
DettagliCenni di apprendimento in Reti Bayesiane
Sistemi Intelligenti 216 Cenni di apprendimento in Reti Bayesiane Esistono diverse varianti di compiti di apprendimento La struttura della rete può essere nota o sconosciuta Esempi di apprendimento possono
DettagliStatistica di base per l analisi socio-economica
Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme
DettagliIl Modello Relazionale e le operazioni
Il Modello Relazionale e le operazioni Prof. Giuseppe Di Capua UD 5 Modello Logico Nello sviluppo della teoria dei database sono emersi quattro tipi diversi di modelli per le basi di dati: 1. Modello gerarchico
DettagliMattia Fazzi: 02/04/2019
Mattia Fazzi: mattia.fazzi@student.unife.it 02/04/2019 MODELLO RELAZIONALE Il modello dei dati relazionale è basato sul concetto di relazione. Una relazione è una tabella di valori: Che può essere pensata
DettagliComputazione per l interazione naturale: macchine che apprendono
Computazione per l interazione naturale: macchine che apprendono Corso di Interazione uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Scienze dell Informazione Università di Milano boccignone@dsi.unimi.it
DettagliIndice Prefazione Funzionalit `a e architettura dei DBMS La gestione della memoria permanente e del buffer Organizzazioni seriale e sequenziale
Prefazione XI 1 Funzionalità e architettura dei DBMS 1 1.1 I DBMS............................... 1 1.2 Architettura dei DBMS....................... 3 1.3 Il sistema JRS............................ 5 1.4
DettagliPROGRAMMAZIONE ANNO SCOLASTICO 2018/2019
Istituto Istruzione Superiore Cristoforo Colombo Liceo Scientifico delle Scienze applicate Liceo Scientifico Sportivo Istituto Tecnologico indirizzo Costruzioni Ambiente e Territorio Istituto Tecnico Economico:
Dettaglilezione 13 AA Paolo Brunori
AA 2016-2017 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
DettagliINTRODUZIONE ALLE BASI DATI RELAZIONALI
INTRODUZIONE ALLE BASI DATI RELAZIONALI RELAZIONI E TABELLE Nelle BASI DI DATI RELAZIONALI le informazioni sono organizzate in TABELLE; Le tabelle sono rappresentate mediante griglie suddivise in RIGHE
DettagliMetodi statistici per le ricerche di mercato
Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per
DettagliBLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
DettagliPROCEDURA MAPPATURA SINISTRI
Pagina 1 di 14 PROCEDURA MAPPATURA SINISTRI Revisione Prima emissione Data. Descrizione delle modifiche Redazione Verifica Approvazione PR 2- v 0 17-09-14 Pagina 2 di 14 1. Campo di applicazione La presente
DettagliSTATISTICA CORSO BASE. Prova scritta del Tempo: 2 ore Cognome e Nome:... Matricola:...
STATISTICA CORSO BASE. Prova scritta del 4-6-2013. Tempo: 2 ore Cognome e Nome:.............................. Matricola:.............................. Attenzione: Prima di affrontare la prova si consiglia
DettagliEsercitazione # 3. Trovate la probabilita che in 5 lanci di un dado non truccato il 3 si presenti
Statistica Matematica A Esercitazione # 3 Binomiale: Esercizio # 1 Trovate la probabilita che in 5 lanci di un dado non truccato il 3 si presenti 1. mai 2. almeno una volta 3. quattro volte Esercizio #
DettagliStrumenti per l Analisi l. ed il Preprocessing dei dati. Francesco Folino. Introduzione
Strumenti per l Analisi l ed il Preprocessing dei dati Francesco Folino Obiettivo Introdurre gli aspetti essenziali della fase di preparazione dei dati Acquisire padronanza di un processo tipicamente artigianale
DettagliComputazione per l interazione naturale: macchine che apprendono
Comput per l inter naturale: macchine che apprendono Corso di Inter uomo-macchina II Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it http://boccignone.di.unimi.it/ium2_2014.html
DettagliSQL. Università degli Studi di Salerno. Corso di Laurea in Scienze della Comunicazione Informatica generale (matr. Dispari) Docente: Angela Peduto
SQL Università degli Studi di Salerno Corso di Laurea in Scienze della Comunicazione Informatica generale (matr. Dispari) Docente: Angela Peduto A.A. 2005/2006 Select La forma di select cui siamo arrivati
DettagliCORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
DettagliEconometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
DettagliAnalysis Service. Dutto Riccardo IPSI - tel Dutto Riccardo - SQL Server 2008.
SQL Server Business Intelligence Development Studio Analysis Service Dutto Riccardo riccardo.dutto@polito.it IPSI - tel.7991 http://dbdmg.polito.it/ Il Data warehouse Sorgenti dati operazionali DB relazionali
DettagliAccess 2007 Colonna di ricerca
Pagina 1 di 7 Lezioni on line -> Gestire i dati Access 2007 Colonna di ricerca Quando si riempiono i campi dei record che formano una tabella, può essere utile e comodo poter scegliere, in un elenco dei
DettagliBASE DI DATI. (accezione specifica) collezione di dati gestita da un DBMS. Università degli Studi di Cassino
BASE DI DATI (accezione generica) collezione di dati, utilizzati per rappresentare le informazioni di interesse per una o più applicazioni di una organizzazione. (accezione specifica) collezione di dati
Dettagli