DataBase NoSQL. Prof. Marco Pedroni Unversità degli Studi di Ferrara
|
|
- Gianfranco Forte
- 6 anni fa
- Visualizzazioni
Transcript
1 DataBase NoSQL Prof. Marco Pedroni Unversità degli Studi di Ferrara
2 Definizione DB NoSQL = sistemi software di archiviazione, in cui la persistenza dei dati è caratterizzata dal fatto di non utilizzare il modello relazionale, di solito usato dai database tradizionali (RDBMS) Modello relazionale Next generation databases mostly addressing some of the points: being non-relational, distributed, open source and horizzontally scalable (definizione da
3 DB NoSQL - caratteristiche Database distribuiti Strumenti generalmente open-source NON dispongono di schema NON supportano operazioni di join Implementano parzialmente le proprietà ACID delle transazioni Sono scalabili orizzontalmente Sono in grado di gestire grandi moli di dati Supportano le repliche dei dati
4 ACID Le proprietà logiche che devono avere le transazioni per operare in modo corretto sui dati: Atomicità, Coerenza, Isolamento, Durabilità Perché le transazioni operino in modo corretto sui dati è necessario che i meccanismi che le implementano soddisfino queste quattro proprietà: atomicità: la transazione è indivisibile nella sua esecuzione e la sua esecuzione deve essere o totale o nulla, non sono ammesse esecuzioni parziali coerenza: quando inizia una transazione il database si trova in uno stato coerente e quando la transazione termina il database deve essere in un altro stato coerente, ovvero non deve violare eventuali vincoli di integrità, quindi non devono verificarsi contraddizioni (inconsistenza) tra i dati archiviati nel DB isolamento: ogni transazione deve essere eseguita in modo isolato e indipendente dalle altre transazioni, l'eventuale fallimento di una transazione non deve interferire con le altre transazioni in esecuzione durabilità: detta anche persistenza, si riferisce al fatto che una volta che una transazione abbia richiesto un commit work, i cambiamenti apportati non dovranno essere più persi
5 DB NoSQL - caratteristiche Leggerezza computazionale: i database NoSQL non prevedono operazioni di aggregazione sui dati (JOIN), molto dispendiose in termini dipeso computazionale, in quanto tutte le informazioni sono già raccolte in un unico documento associato all oggetto da trattare. Ne derivano migliori performance, ma si generano duplicazioni delle informazioni (i costi attuali dei sistemi di storage rendono questo svantaggio poco importante) e si richiede un controllo diretto dell'integrità dei dati Assenza di schema: i database NoSQL sono privi di schema in quanto ogni documento contiene tutti i campi necessari, senza necessità di predefinizione. In questo modo, si possono aggiungere nuovi dati e informazioni, definibili liberamente all interno dei documenti, senza rischi per l integrità dei dati. Sono quindi adatti a inglobare velocemente nuovi tipi di dati, anche semistrutturati o non strutturati Scalabilità orizzontale: l aggregazione dei dati e l assenza di uno schema definito a priori offre l opportunità di scalare orizzontalmente i database NoSQL senza difficoltà e senza rischi operativi
6 DB NoSQL - ambiti di utilizzo Volume Velocità Dati semistrutturati non strutturati Varietà
7 DB NoSQL - ambiti di utilizzo Motivazioni della diffusione dei database NoSQL: Gestione dei Big-data Limitazioni del modello relazionale Teorema CAP
8 DB NoSQL - Volume Volume: Big data = grandi moli di dati Dati Scientifici PB Web Server Log Sensori Transazioni finanziarie TB GB ERP CRM Social Media User Generated Contents Documenti Word, Excel, PDF MB Complessità bassa Complessità media Complessità alta
9 DB NoSQL - Velocità Velocità: Big data = stream di dati Stream MorningStar di dati NASDAQ: oltre record di transazioni /secondo
10 DB NoSQL - Varietà Varietà: Big data = dati eterogenei, multi-sorgente SOCIAL MEDIA DBMS OPERATIVO SITO WEB DATA WAREHOUSE SOFTWARE DI SUPPORTO DECISIONALE REPORT
11 DB NoSQL - Limiti dei modelli relazionali Il modello relazionale presuppone una rappresentazione tabellare, che accade se i dati non si presentano in tale forma? ANAGRAFICA PAGINA WEB CF Nome?? Cognome? Luogo?? Data
12 DB NoSQL - Limiti dei modelli relazionali Alcune operazioni sono complesse da implementare in SQL. Memorizzazione di un grafo, e calcolo del percorso minimo tra due punti. Esempi:
13 DB NoSQL - Limiti dei modelli relazionali Scalabilità orizzontale dei DMBS relazionali. PROBLEMI Gestione dei vincoli Throughput (operazioni / sec) Repliche dei dati Gestione delle transazioni Soddisfacimento delle proprietà ACID Servers
14 DB NoSQL - Teorema di CAP Il teorema di Brewer (CAP Theorem) afferma che un sistema distribuito può soddisfare al massimo solo due delle tre proprietà elencate sotto: Consistency Tutti i nodi della rete vedono gli stessi dati Availability Il servizio è sempre disponibile Partition Tolerance Il servizio continua a funzionare correttamente anche in presenza di perdita di messaggi o di partizionamenti della rete. Consistenza (tutti i nodi vedono gli stessi dati nello stesso momento) Disponibilità (la garanzia che ogni richiesta riceva una risposta su ciò che è riuscito o fallito) Tolleranza di partizione (il sistema continua a funzionare nonostante le perdite di messaggi)
15 DB NoSQL - Teorema di CAP DB risponde sempre DB risponde correttamente DB distribuito
16 DB NoSQL - Teorema di CAP
17 DB NoSQL - Teorema di CAP Comportamento dei database NoSQL Basically Available I nodi del sistema distribuito possono essere soggetti a guasti, ma il servizio è sempre disponibile. Soft State La consistenza dei dati non è garantita in ogni istante. Eventually Consistent Il sistema diventa consistente dopo un certo intervallo di tempo, se le attività di modifica dei dati cessano.
18 DB NoSQL - Modelli logici Il termine NoSQL identifica diverse tipologie di database, basate su modelli logici differenti: Database chiave/valore Database document-oriented Database column-oriented Database graph-oriented
19 DB NoSQL - modello Chiave-Valore Esempi: BerkeleyDB, Project Voldemort Dati di un DB come liste di coppie chiave/valore (array associativi o dizionari) Chiave valore univoco per operazioni di ricerca Valore qualsiasi tipo di dato Chiave Valore 1 {Mario Rossi, } 2 {Mario Bianchi, 23} 3 {Dipartimento Informatica, Via Zamboni, }
20 DB NoSQL - modello Document oriented Esempi: MongoDB, CouchDB Gestione di dati eterogeneei e complessi (semi-strutturati) Scalabili orizzontalmente, supporto per partizionamento (sharding) dei dati in sistemi distribuiti Documenti coppie chiave/valore (JSON) Forniscono funzionalità per aggregazione/analisi dei dati (MapReduce)
21 DB NoSQL - modello Column oriented Esempi: HBase, Cassandra Dati organizzati su colonne anziché su righe. Column family: contenitore di colonne. Ogni column family è scritta su un file diverso. Ogni riga dispone di una chiave primaria (row key). Schema flessibile Maggiore efficienza nello storage Maggiore possibilità di compressione dati Usato in sistemi dati read-oriented (es. warehousing)
22 DB NoSQL - modello Column oriented ID Nome Cognome Nascita Chiave della riga Column Family 1 (dati anagrafica) FILE 1 Lavoro Salario Contratto Column Family 2 (dati lavoro) FILE 2
23 DB NoSQL - modello Graph oriented Esempi: Neo4J, Titan PROPERTY GRAPH Dati strutturati sotto forma di grafi: nodi = attributi/righe, archi = relazioni tra attributi/righe
24 Hadoop Apache Hadoop è un framework che supporta applicazioni distribuite con elevato accesso ai dati. È composto da due elementi fondamentali: HDFS Hadoop Distributed File System è un file system distribuito e scalabile MapReduce MapReduce è un framework software che supporta la computazione distribuita su grandi quantità di dati in cluster di computer, usando le funzioni map e reduce
25 HBase HBase è un ambiente di archiviazione di dati distribuito, column-oriented, costruito su HDFS e fondato sul modello di Google BigTable HBase è un progetto Apache open source il cui obiettivo è archiviare dati per Hadoop Distributed Computing I dati sono organizzati logicamente in tables, rows, families e columns
26 Hbase Data model
27 Hbase Operations
Diego GUENZI Rodolfo BORASO
Diego GUENZI Rodolfo BORASO NOSQL Movimento che promuove una classe non ben definita di strumenti di archiviazione di dati Un nuovo modo di vedere la persistenza Si differenziano dai RDBMS: Non utilizzano
DettagliLinee di evoluzione dei Database
Linee di evoluzione dei Database DB NoSQL Linked Open Data Semantic Web Esigenze e caratteristiche Presenza di grandi volumi di dati..crescenti Struttura non regolare dei dati da gestire Elementi relativamente
DettagliNoSQL. Definizione. Nella seconda metà degli anni 2000 Google, Amazon, Facebook studiavano nuove modalità di memorizzazione persistente dei dati
NoSQL TESTO CONSIGLIATO http://martinfowler.com/nosql.html Definizione 2 Nella seconda metà degli anni 2000 Google, Amazon, Facebook studiavano nuove modalità di memorizzazione persistente dei dati Google
DettagliNoSQL. Riferimento: P. J. Sadalage, M Fowler, NoSQL Distilled, Addison Wesley. Basi di Dati: Sistemi NoSQL 10.1
NoSQL Riferimento: P. J. Sadalage, M Fowler, NoSQL Distilled, Addison Wesley Basi di Dati: Sistemi NoSQL 10.1 PERCHÉ NoSQL 20 anni di successi della tecnologia relazionale che ha garantito: Persistenza
DettagliMongoDB. Un database NoSQL Open-Source
MongoDB Un database NoSQL Open-Source Database Relazionali I dati sono divisi in tabelle. Ogni tabella è composta da diverse colonne fisse. Le tabelle possono avere riferimenti tra loro. A.C.I.D. I database
DettagliBig Query, nosql e Big Data
Big Query, nosql e Big Data Ma c'è veramente bisogno di gestire tutti questi dati? Immaginiamo che.. L'attuale tecnologia Database e Web Services fosse disponibile già DA ANNI Cosa cambierebbe nella Vita
DettagliMemoria primaria o secondaria? DFS MapReduce Scheduling & Data flow. Map Reduce. Giambattista Amati. Università di Tor Vergata.
Map Reduce, Roma Sommario 1 Memoria primaria o secondaria? 2 DFS 3 MapReduce 4 Scheduling & Data flow Alcuni numeri Jeffrey Dean, Stanford talk, November 10, 2010 Dati in-memoria o su disco? Tempi di lettura
DettagliBig ed Open Data, nosql e..
Big ed Open Data, nosql e.. Quadro d insieme Tecnologie interconnesse ed interoperanti Big Data Software Open Open Data Mobile Internet delle Cose Dispositivi indossabili Social Network e Search Metodologie
DettagliBig Data. Davide Giarolo
Big Data Davide Giarolo Definizione da Wikipedia Big data è il termine usato per descrivere una raccolta di dati così estesa in termini di volume, velocità e varietà da richiedere tecnologie e metodi analitici
Dettagli"_id": "555ae00a475a9b259281b21a", "name": "Nicola Galgano", "alias": "alikon", "gender": "maschile", "work": consulente software bancario",
1 } { "_id": "555ae00a475a9b259281b21a", "name": "Nicola Galgano", "alias": "alikon", "gender": "maschile", "work": consulente software bancario", "company": sto cercando ", "email": "info@alikonweb.it",
DettagliTecnologie NoSQL: HBase
Scuola Politecnica e delle Scienze di Base Corso di Laurea in Ingegneria Informatica Elaborato finale in Basi di Dati Tecnologie NoSQL: HBase Anno Accademico 2014/2015 Candidato: Daniela Bianco matr. N46001409
DettagliProgettazione ed implementazione di un database per le gestione della mappa della connettività urbana utilizzando tecnologie NoSQL
Alma Mater Studiorum Università di Bologna SCUOLA DI SCIENZE Corso di Laurea in Informatica per il Management Progettazione ed implementazione di un database per le gestione della mappa della connettività
DettagliNoSql Databases: Analisi prestazionale e confronto col modello relazionale. Un applicazione: MongoDB
1 Università Cà Foscari Venezia Corso di Laurea magistrale in Informatica (ordinamento ex D.M. 270/2004) Tesi di Laurea NoSql Databases: Analisi prestazionale e confronto col modello relazionale. Un applicazione:
DettagliSQL, NoSQL, o entrambi?
Introduzione Nella prima parte di questo corso abbiamo fatto una prima introduzione sul quando e come scegliere un database per risolvere un determinato problema. In questa parte finale vedremo attraverso
DettagliDB NoSQL Analisi prestazionale
DB NoSQL Analisi prestazionale 1 I database NoSQL... 2 1.1 Perché NoSQL? Il teorema di CAP e il No-SQL data model... 2 1.2 Un confronto tra le famiglie di DB NoSQL... 5 1.3 I database document-oriented
DettagliBig data ed eventi: quasi un tutorial. Prof. Riccardo Melen melen@disco.unimib.it
Big data ed eventi: quasi un tutorial Prof. Riccardo Melen melen@disco.unimib.it Big Data Monitoraggio di reti e infrastrutture IT performance: data center, SOA/ESB, infrastrutture virtuali, configurazione
DettagliNoSQL Database: Cassandra
Elaborato finale in Basi di Dati NoSQL Database: Cassandra Anno Accademico 2015/2016 Candidato: Stefano Cutillo matr. N46001738 Indice Introduzione 2 1 NoSQL Database 3 1.1 Differenze con i RDBMS................................
DettagliMS Access Un DBMS relazionale per Windows?
MS Access Un DBMS relazionale per Windows? Quali DBMS in ambiente PC: dbase (ver. 5 per windows) FoxPro (per windows) Access (per windows) SQL Server (client/server) Oracle (client/server) Informix (client/server)...
DettagliIntroduzione alle Basi di Dati
Introduzione alle Basi di Dati Angelo Chianese, Vincenzo Moscato, Antonio Picariello, Lucio Sansone Basi di dati per la gestione dell'informazione 2/ed McGraw-Hill Capitolo 1 Appunti dalle lezioni SQL
DettagliINFORMATICA. Prof. MARCO CASTIGLIONE ITS Tito Acerbo - PESCARA
INFORMATICA Prof. MARCO CASTIGLIONE ITS Tito Acerbo - PESCARA Database 1. ARCHIVI ITS Tito Acerbo - PE INFORMATICA Prof. MARCO CASTIGLIONE 2 1. Archivi ARCHIVIO Permanenza Razionalità Sistematicità Insieme
DettagliNoSQL http://nosql. nosql-database.org/ Corso di Laurea Specialistica in Ingegneria Informatica. Corso di Linguaggi e Tecnologie Web A. A.
Corso di Laurea Specialistica in Ingegneria Informatica Corso di Linguaggi e Tecnologie Web A. A. 2011-2012 NoSQL http://nosql nosql-database.org/ Eufemia TINELLI Cosa è NoSQL? 1998 il termine NoSQL è
DettagliBig Data: tecnologie, metodologie e applicazioni per l analisi dei dati massivi
Big Data: tecnologie, metodologie e applicazioni per l analisi dei dati massivi Ministero Dello Sviluppo Economico Istituto Superiore delle Comunicazioni e delle Tecnologie dell Informazione Seminario
DettagliSperimentazione del file-system distribuito HDFS in ambiente GRID. III Borsista Day, Roma, 06.12.2012
Sperimentazione del file-system distribuito HDFS in ambiente GRID Tutor: Domenico Diacono Outline Use cases Hadoop Distributed File System Test di funzionalità Sviluppo di politiche di replica dei dati
DettagliDipartimento di Scienze Umane Corso di studi in Marketing & digital communication. Project work. Data Mining e IT. Database
Dipartimento di Scienze Umane Corso di studi in Marketing & digital communication Project work Data Mining e IT Database Obiettivi della lezione Comprendere i principi fondamentali per la corretta organizzazione
DettagliLiceo Scientifico V. Volterra Fabriano. Informatica Basi di dati Anno C Scienze Applicate Prof. Amedeo De Amicis
Liceo Scientifico V. Volterra Fabriano Informatica Basi di dati Anno 2014-15 5 C Scienze Applicate Prof. Amedeo De Amicis Obiettivi del corso: competenze da raggiungere Progettare e realizzare autonomamente
DettagliBasi di Dati e Sistemi Informativi. Database NoSQL. Corso di Laurea in Ing. Informatica Ing. Gestionale Magistrale
Giuseppe Loseto Corso di Laurea in Ing. Informatica Ing. Gestionale Magistrale NoSQL (Not Only SQL) I principali metodi d implementazione dei database NoSQL sono i seguenti: Column Store/Column Family
DettagliNoSQL Databases. Massimo Carro
NoSQL Databases Massimo Carro Politecnico di Milano Piazza Leonardo da Vinci 32 20133 Milano massimo.carro@mail.polimi.it 1. Introduzione L arrivo di internet negli anni 90 ha permesso a molte aziende
DettagliL Affidabilità dei Sistemi di Input-Output ad Elevate Prestazioni
1 tesi di laurea Anno Accademico 2005/2006 relatore Ch.mo prof. Domenico Cotroneo correlatore Ing. Generoso Paolillo candidato Emanuele Di Pascale Matr. 534/789 2 Il Contesto Le moderne applicazioni scientifiche
DettagliBasi di dati (database)
Basi di dati (database) 1 Scopo Gestione dell informazione Informazione: difficile da definire ma a tutti è chiara l importanza della sua gestione in diversi tipi di attività Esempi: aziende, banche, anagrafi,
DettagliCap. 1-I 1 I sistemi informatici
Libro di testo A. Chianese,V. Moscato, A. Picariello, L. Sansone Basi di dati per la gestione dell informazione McGraw-Hill, 2007 Informazioni sul corso http://www.docenti.unina.it/lucio.sansone Ricevimento
DettagliNOSQL Origini e Significato. NOSQL = NO a SQL. NOSQL = Not Only SQL
NOSQL NOSQL Origini e Significato NOSQL = NO a SQL NOSQL = Not Only SQL Il termine NOSQL fu introdotto da Carlo Strozzi nel 1998 per indicare il suo database relazionale open-source che non aveva una interfaccia
DettagliI DSS e la gestione dei dati e della conoscenza. Prof. Luca Gnan
I DSS e la gestione dei dati e della conoscenza Prof. Luca Gnan Argomenti I decision support system Tipologie di DSS Logiche di funzionamento Tipologie di analisi La gestione dei dati e della conoscenza
DettagliPanoramica dei più diffusi NoSQL Database
Scuola Politecnica e delle Scienze di Base Corso di Laurea in Ingegneria Informatica Elaborato finale in Basi di Dati Panoramica dei più diffusi NoSQL Database Anno Accademico 2013/2014 Candidato: Buonocore
DettagliFoglio elettronico e Banche dati e per la Pubblica Amministrazione
Foglio elettronico e Banche dati e per la Pubblica Amministrazione MASTER UNIVERSITARIO DI II LIVELLO IN MANAGER NELLE AMMINISTRAZIONI PUBBLICHE A.A. 2013-2014 PROF.SSA BICE CAVALLO Introduzione La pubblica
DettagliIntroduzione Concetti Generali Pratica su Access Link utili. ECDL - Database. European Computer Driving Licence - Modulo 5 - Database LEZIONE 1
ECDL - Database Introduzione European Computer Driving Licence - Modulo 5 - Database LEZIONE 1 Informazioni sul corso orario: Giovedì - 14.30-16.30 materiale: http://www.fotoboni.com/carlo/ docente: webmaster@fotoboni.com
DettagliMODELLI DEI DATI. Informatica Generale (AA 07/08) Corso di laurea in Scienze della Comunicazione Facoltà di Lettere e Filosofia
Informatica Generale (AA 07/08) Corso di laurea in Scienze della Comunicazione Facoltà di Lettere e Filosofia Università degli Studi di Salerno : Modelli dei Dati MODELLI DEI DATI Prof. Alberto Postiglione
DettagliInformatica Generale (AA 07/08) Corso di laurea in Scienze della Comunicazione Facoltà di Lettere e Filosofia. Università degli Studi di Salerno
Informatica Generale (AA 07/08) Corso di laurea in Scienze della Comunicazione Facoltà di Lettere e Filosofia Università degli Studi di Salerno : Modelli dei Dati Prof. Alberto Postiglione Università degli
DettagliPOLITECNICO DI MILANO Facoltà di Ingegneria dell Informazione. Modellazione e valutazione delle prestazioni di database NoSQL
POLITECNICO DI MILANO Facoltà di Ingegneria dell Informazione Corso di Laurea Magistrale in Ingegneria Informatica Dipartimento di Elettronica, Informazione e Bioingegneria Modellazione e valutazione delle
DettagliDa Big Data ai Graph Database
Scuola Politecnica e delle Scienze di Base Corso di Laurea in Ingegneria Informatica Elaborato finale in Basi di Dati Da Big Data ai Graph Database Anno Accademico 2014/2015 Candidato: Luigi Carbone matr.
DettagliCORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE
CORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE Ing. Mariano Di Claudio Lezione del 20/10/2014 1 Indice 1. HBase e Hrider Caratteristiche chiave Modello dati Architettura Installazione
DettagliLe basi di dati. Le basi di dati. dalla teoria all'utilizzo di tutti i giorni. Alessandro Tanasi
Le basi di dati Le basi di dati dalla teoria all'utilizzo di tutti i giorni Alessandro Tanasi alessandro@lonerunners.net http://www.lonerunners.net 1 Sistemi Informativi Il problema: organizzare dati in
DettagliV. Moriggia Modelli di Base Dati. Modelli di Base Dati. a.a. 2001/2002 4.1
Modelli di Base Dati 4 Un DBMS: Access a.a. 2001/2002 4.1 DBMS 4.2 DBMS = Data Base Management System Software per la costruzione e la gestione di una base dati Esempi di DBMS: Oracle, MySQL, SQLServer,
DettagliLe basi di dati. Definizione 1. Lezione 2. Bisogna garantire. Definizione 2 DBMS. Differenza
Definizione 1 Lezione 2 Le basi di dati Gli archivi di dati Organizzato in modo integrato attraverso tecniche di modellazione di dati Gestiti su memorie di massa Con l obiettivo Efficienza trattamento
DettagliSubsection 1. MapReduce
MapReduce Subsection 1 MapReduce MapReduce La programmazione distribuita è molto pesante Soluzione: MapReduce MapReduce viene incontro alle sfide della programmazione distribuita. Le 3 regole Archivia
DettagliRelazioni e tabelle. Introduzione alle Basi di Dati Relazionali. Relazioni uno a uno. Esempio
Relazioni e tabelle Introduzione alle Basi di Dati Relazionali Nelle Basi di Dati relazionali le informazioni sono organizzate in tabelle Le tabelle sono rappresentate mediante griglie suddivise in colonne
DettagliNOSQL Il database relazionale va in pensione,
Giovedì, 17 maggio 2012 Speaker: Manuel Scapolan NOSQL Il database relazionale va in pensione, avanza il movimento NOSQL RavenDB, database non relazionale, rappresentante del movimento NOSQL Sondaggio
DettagliBasi di Dati. Concetti e Principi Generali. Maria Mirto
Basi di Dati Concetti e Principi Generali Maria Mirto Organizzazione dei Dati Archivi o file Procedure di accesso in qualunque linguaggio di programmazione Duplicazione dati: ridondanza incoerenza formati
Dettagli2. Gli strumenti di gestione e di analisi per i big data
Archeologia e Calcolatori Supplemento 4, 2013, 139-146 1. Premessa ARCHITETTURE SCALABILI PER MEMORIZZAZIONE, ANALISI, CONDIVISIONE E PUBBLICAZIONE DI GROSSE MOLI DI DATI Con l incremento esponenziale
DettagliInformatica e Bioinformatica: Basi di Dati
Informatica e Bioinformatica: Date TBD Bioinformatica I costi di sequenziamento e di hardware descrescono vertiginosamente si hanno a disposizione sempre più dati e hardware sempre più potente e meno costoso...
DettagliBasi di dati e GIS. Paolo Zatelli. Dipartimento di Ingegneria Civile, Ambientale e Meccanica Università di Trento
Database e GIS Basi di dati e GIS Paolo Zatelli Dipartimento di Ingegneria Civile, Ambientale e Meccanica Università di Trento Paolo Zatelli Università di Trento 1 / 41 Database e GIS Outline 1 Basi di
DettagliINDEXING: DISTRIBUITO O MAPREDUCE? Davide Tuccilli Algoritmi Avanzati A.A. 2011/2012
INDEXING: DISTRIBUITO O MAPREDUCE? Davide Tuccilli Algoritmi Avanzati A.A. 2011/2012 Introduzione Grandi moli di dati su cui effettuiamo ricerche quotidianamente Google indicizza per il motore di ricerca
DettagliINTRODUZIONE ALLE BASI DATI RELAZIONALI
INTRODUZIONE ALLE BASI DATI RELAZIONALI RELAZIONI E TABELLE Nelle BASI DI DATI RELAZIONALI le informazioni sono organizzate in TABELLE; Le tabelle sono rappresentate mediante griglie suddivise in RIGHE
DettagliBig Data. Alessandro Rezzani. alessandro.rezzani@dataskills.it www.dataskills.it
Big Data Alessandro Rezzani alessandro.rezzani@dataskills.it Chi sono? I big data Caratteristiche Fonti Agenda Creare valore con i big data Aspetto del business Aspetto finanziario Aspetto tecnologico
DettagliBasi di dati Architetture e linee di evoluzione
Basi di dati Architetture e linee di evoluzione Paolo Atzeni Stefano Ceri Piero Fraternali Stefano Paraboschi Riccardo Tarlane web site McGraw-Hill IUAV - VENEZIA H 9891 BIBLIOTECA CENTRALE I J ()(),,.
DettagliAnalisi e sperimentazione del DBMS NoSQL MongoDB: il caso di studio della Social Business Intelligence
ALMA MATER STUDIORUM - UNIVERSITA' DI BOLOGNA CAMPUS DI CESENA SCUOLA DI SCIENZE CORSO DI LAUREA IN SCIENZE E TECNOLOGIE INFORMATICHE TITOLO DELLA RELAZIONE FINALE Analisi e sperimentazione del DBMS NoSQL
DettagliAlla scoperta dei Graph Database
Alla scoperta dei Graph Database Matteo Pani 24 ottobre 2015 One size doesn t fit all Modellare le relazioni I Graph Database Il Labeled Property Graph Model I Graph-DBMS Neo4j Neo4j Internals Cypher Interagire
DettagliARCHITETTURA DI UN DBMS
ARCHITETTURA DI UN DBMS Modelli di dati Un approccio con basi di dati fornisce un certo livello di astrazione dei dati Nasconde i dettagli sulla memorizzazione dei dati stessi Un modello dei dati fornisce
DettagliPoliglottismo tecnologico & innovazione: un matrimonio perfetto?
Maggio 2016 Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze dal campo raccontate a due voci Stefano Gatti Head of Innovation & Data Sources Antonello Mantuano Chief Technology
DettagliIndice. Ringraziamenti dell Editore
Prefazione Autori Ringraziamenti dell Editore XVII XXI XXIII 1 Introduzione 1 1.1 Sistemi informativi, informazioni e dati 1 1.2 Basi di dati e sistemi di gestione di basi di dati 3 1.3 Modelli dei dati
DettagliINFORMATICA GENERALE Prof. Alberto Postiglione Scienze della Comunicazione
2.1c: MODELLI DEI DATI MODELLI DEI DATI Atzeni, cap. 1.3 DBMS: Modelli dei Dati 10 ott 2011 Dia 3 Modelli Logici e Modelli Concettuali Modelli Logici (disponibili sui DBMS commerciali) E un insieme di
DettagliElena Baralis 2007 Politecnico di Torino 1
Introduzione Sistemi informativi 2 Introduzione Base di dati Modello dei dati Accesso ai dati Vantaggi e svantaggi dei DBMS 4 6 2007 Politecnico di Torino 1 7 8 9 10 Sistema informatico Nei sistemi informatici,
DettagliLe basi di dati. Base di dati = dati + DBMS.
Le basi di dati. Lo scopo di una base di dati è la gestione dell informazione (in genere una grande quantità di informazione). L informazione è difficile da definire, dal momento che i database vengono
DettagliConcetti di base. Modulo B.2
Concetti di base Modulo B.2 Dati B.2.1 Qualsiasi applicazione informatica gestisce ed elabora dati Dati interni (risultato di una elaborazione) I/O da e verso l utente (interfaccia uomo-macchina) I/O da
DettagliEsperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti
Esperienze di Advanced Analytics nella statistica ufficiale: strumenti e progetti Direzione Centrale per le tecnologie informatiche e della comunicazione Introduzione I Big Data nella statistica ufficiale
DettagliNoSQL database: la soluzione Oracle.
Scuola Politecnica e delle Scienze di Base Corso di Laurea in Ingegneria Informatica Elaborato finale in Basi di Dati NoSQL database: la soluzione Oracle. Anno Accademico 2013/2014 Candidato: Alfonso Di
DettagliBasi di Dati. prof. Letizia Tanca. Le transazioni e il database server, cenni sui nuovi sistemi per Big Data
Basi di Dati prof. Letizia Tanca Le transazioni e il database server, cenni sui nuovi sistemi per Big Data (lucidi parzialmente tratti dal libro: Atzeni, Ceri, Paraboschi, Torlone Introduzione alle Basi
DettagliSQL e linguaggi di programmazione. Cursori. Cursori. L interazione con l ambiente SQL può avvenire in 3 modi:
SQL e linguaggi di programmazione L interazione con l ambiente SQL può avvenire in 3 modi: in modo interattivo col server attraverso interfacce o linguaggi ad hoc legati a particolari DBMS attraverso i
DettagliI DATI E LA LORO INTEGRAZIONE 63 4/001.0
I DATI E LA LORO INTEGRAZIONE 63 4/001.0 L INTEGRAZIONE DEI DATI INTEGRAZIONE DEI DATI SIGNIFICA LA CONDIVISIONE DEGLI ARCHIVI DA PARTE DI PIÙ AREE FUNZIONALI, PROCESSI E PROCEDURE AUTOMATIZZATE NELL AMBITO
DettagliCORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE
CORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE Ing. Mariano Di Claudio Lezione del 17/09/2014 Indice 1. Aspetti fondamentali delle tecnologie Big Data Aspetti di Data Management
DettagliUnità D3. Sicurezza nelle basi di dati. Sicurezza e concorrenza nelle basi di dati. Controllo accesso. Protezione e integrità dati
Sicurezza nelle basi di dati Unità D3 Sicurezza e concorrenza nelle basi di dati Una base di dati è sicura quando soddisfa i seguenti parametri: regola l accesso ai dati protetti; evita la modifica o la
DettagliDataBase Management System - DBMS
DataBase Management System - DBMS Un sistema per la gestione di basi di dati o DBMS (Data Base Management System) è un sistema software in grado di gestire collezioni di dati che siano grandi condivise
DettagliBig Data Tecnologie, metodologie per l analisi di dati massivi Seminario ISCOM
Big Data Tecnologie, metodologie per l analisi di dati massivi Seminario ISCOM, Simone Angelini, Marco Bianchi, Giuseppe Marcone, Roma 26 febbraio 2016 Sommario 1 Il progetto SNOOPI 2 Piattaforme di Big
DettagliPRINCIPI DI INFORMATICA CORSO DI LAUREA IN SCIENZE BIOLOGICHE
PRINCIPI DI INFORMATICA CORSO DI LAUREA IN SCIENZE BIOLOGICHE Gennaro Cordasco e Rosario De Chiara {cordasco,dechiara}@dia.unisa.it Dipartimento di Informatica ed Applicazioni R.M. Capocelli Laboratorio
DettagliCap. 1-I 1 I sistemi informatici
Libro di testo A. Chianese,V. Moscato, A. Picariello, L. Sansone Basi di dati per la gestione dell informazione McGraw-Hill Hill,, 2007 Ricevimento studenti Lunedì ore 11-13 Didattica su web Si interagisce
DettagliStudio delle principali Tecnologie No-SQL
Facoltà di Ingegneria Corso di Studi in Ingegneria Informatica Elaborato finale in Basi di Dati Studio delle principali Tecnologie No-SQL Anno Accademico 2010/2011 Candidato: Giovanni Trotta matr. N46/000047
DettagliHBase Data Model. in più : le colonne sono raccolte in gruppi di colonne detti Column Family; Cosa cambia dunque?
NOSQL Data Model HBase si ispira a BigTable di Google e perciò rientra nella categoria dei column store; tuttavia da un punto di vista logico i dati sono ancora organizzati in forma di tabelle, in cui
DettagliGrid Data Management Services. Griglie e Sistemi di Elaborazione Ubiqui
Grid Data Management Services D. Talia - UNICAL Griglie e Sistemi di Elaborazione Ubiqui Sommario Grid Data Management GridFTP RFT RLS OGSA-DAI GridFTP GT4 Data Services High-performance Data transfer
DettagliSperimentazione del file system distribuito HDFS in ambiente grid
Sperimentazione del file system distribuito HDFS in ambiente grid Giovanni Marzulli INFN Bari Tutor: dott. Domenico Diacono 4 Borsisti Day 13/09/2013 Outline Cosa è HDFS Attività svolta nel 2012 Test e
DettagliSISTEMA INFORMATIVO E SISTEMA INFORMATICO. Sistema informativo e sistema informatico
BASE DI DATI Una base di dati, detta anche database, può essere considerata come una raccolta di dati logicamente correlati tra di loro e utilizzati per modellare una determinata realtà. In questo caso,
DettagliBasi di dati Basi di dati per bioinformatica
Basi di dati Basi di dati per bioinformatica DOCENTI PROF. ALBERTO BELUSSI PROF CARLO COMBI Anno accademico 2013/14 Organizzazione degli insegnamenti 3 Basi di dati Basi di dati per Bioinformatica Teoria
DettagliCONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI
CONCETTI E ARCHITETTURA DI UN SISTEMA DI BASI DI DATI Introduzione alle basi di dati (2) 2 Modelli dei dati, schemi e istanze (1) Nell approccio con basi di dati è fondamentale avere un certo livello di
DettagliESERCIZIO 1 (12 punti) Dato il seguente schema relazionale, che modella i dati di un sistema di gestione di campionati di basket.
NOME COGNOME MATRICOLA ESERCIZIO 1 (12 punti) Dato il seguente schema relazionale, che modella i dati di un sistema di gestione di campionati di basket. GIOCATORE (Codice, Nome, Cognome, AnnoNascita) CONTRATTO(Id,
DettagliDATABASE PER IL WEB. Programmazione Web 1
DATABASE PER IL WEB Programmazione Web 1 Archite3ura web con database Client Tier Web/App Tier DB Tier Client Web / App Server Database Il server web comunica con un altro server che con8ene il la banca
DettagliBibliografia. INFORMATICA GENERALE Prof. Alberto Postiglione. Scienze della Comunicazione Università di Salerno. Definizione di DB e di DBMS
INFORMATICA GENERALE DBMS: Introduzione alla gestione dei dati Bibliografia 4 ott 2011 Dia 2 Curtin, Foley, Sen, Morin Vecchie edizioni: 8.4, 8.5, 8.6, 8.7, 8.8 Edizione dalla IV in poi: 6.5, 21.1, 19.4,
DettagliSommario. Sommario... 1 CAPITOLO 1: DBMS Introduzione... 32
Sommario Sommario... 1 CAPITOLO 1: DBMS... 2 Introduzione... 2 1.1 DBMS... 4 1.2 Il modello relazionale... 5 1.3 Il modello non relazionale... 8 1.3.1 Classificazione dei database non relazionali... 13
DettagliArchitetture Client/Server. Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo
Basi di Dati Architetture Client/Server D B M G Architettura centralizzata Un architettura è centralizzata quando i dati e le applicazioni (programmi) risiedono in un unico nodo elaborativo Tutta l intelligenza
DettagliCURRICOLO DIPARTIMENTO INFORMATICA PRIMO BIENNIO
dei limiti nel contesto culturale e sociale in cui vengono applicate CURRICOLO PARTIMENTO INFORMATICA PRIMO BIENNIO MODULO 1 Concetti di base della tecnologia dell informazione Acquisire e interpretare
DettagliCORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE
CORSO I.F.T.S TECNICHE PER LA PROGETTAZIONE E LA GESTIONE DI DATABASE Ing. Mariano Di Claudio Lezione del 24/09/2014 Indice 1. Aspetti di Data Management CouchBase 2. Aspetti Architetturali Infrastruttura
DettagliBig-data e Turismo: Analisi delle recensioni utente sulla piattaforma Expedia
Alma Mater Studiorum Università di Bologna SCUOLA DI SCIENZE Corso di Laurea in Informatica per il Management Big-data e Turismo: Analisi delle recensioni utente sulla piattaforma Expedia Relatore: Chiar.mo
DettagliSistemi avanzati di gestione dei Sistemi Informativi
Esperti nella gestione dei sistemi informativi e tecnologie informatiche Sistemi avanzati di gestione dei Sistemi Informativi Docente: Email: Sito: Eduard Roccatello eduard@roccatello.it http://www.roccatello.it/teaching/gsi/
DettagliBasi di Dati. Corso di Informatica. Memorizzazione dei Dati. Accesso ai Dati. Corso di Laurea in Conservazione e Restauro dei Beni Culturali
Corso di Laurea in Conservazione e Restauro dei Beni Culturali Corso di Informatica Gianluca Torta Dipartimento di Informatica Tel: 011 670 6782 Mail: torta@di.unito.it Basi di Dati lo scopo delle Basi
DettagliKickoff Progetto DaSSIA 29 Settembre 2014
www.crs4.it Kickoff Progetto DaSSIA 29 Settembre 2014 Ordine del giorno Breve Presentazione del CRS4 CRS4 & Big Data Il Progetto DaSSIA Sviluppo di un caso test paradigmatico L'Attività di Formazione Discussione
DettagliBasi di dati. Elena Baralis Politecnico di Torino
Libri di testo Atzeni, Ceri, Paraboschi, Torlone, Basi di dati, 2 a ed., McGraw Hill, 1999. Baralis, Belussi, Psaila, Basi di dati: temi d esame svolti, Esculapio, 2000. Introduzione - 2 Introduzione Sistema
DettagliDatabase: Introduzione. Basi di Dati e Microsoft Access. Database: Esempio. Informazioni facilmente reperibili
Basi di Dati e Microsoft Access Database: Introduzione Alessandro Lolli - alolli@csr.unibo.it - Un database è una collezione di informazioni organizzata in gruppi, che consentono un semplice recupero delle
DettagliProgettazione di un architettura distribuita per l aggregazione di sorgenti dati streaming
politecnico di milano Facoltà di Ingegneria Scuola di Ingegneria Industriale e dell informazione Dipartimento di Elettronica, Informazione e Bioingegneria Corso di Laurea Magistrale in Computer Science
DettagliMongoDB Analisi e prototipazione su applicazioni di Social Business Intelligence
ALMA MATER STUDIORUM UNIVERSITÀ DI BOLOGNA SEDE DI CESENA FACOLTÀ DI SCIENZE MATEMATICHE, FISICHE E NATURALI Corso di Laurea Triennale in Scienze e Tecnologie Informatiche MongoDB Analisi e prototipazione
DettagliDANIEL EKLUND CAPIRE I BIG DATA E LA TECNOLOGIA HADOOP ROMA 2-3 NOVEMBRE 2015 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231
LA TECHNOLOGY TRANSFER PRESENTA DANIEL EKLUND CAPIRE I BIG DATA E LA TECNOLOGIA HADOOP ROMA 2-3 NOVEMBRE 2015 RESIDENZA DI RIPETTA - VIA DI RIPETTA, 231 info@technologytransfer.it www.technologytransfer.it
DettagliArchivi e database. Lezione n. 7. Dagli archivi ai database (1)
Archivi e database Lezione n. 7 Dagli archivi ai database (1) I dati non sempre sono stati considerati dall informatica oggetto separato di studio e di analisi Nei primi tempi i dati erano parte integrante
DettagliMS Access: Tutorial Tabelle, Relazioni
Università Magna Graecia di Catanzaro Informatica MS Access: Tutorial Tabelle, Relazioni Docente : Alfredo Cuzzocrea e-mail : cuzzocrea@si.deis.unical.it Tel. : 0984 831730 Microsoft Access Tutorial Tabelle,
DettagliSISTEMI INFORMATIVI E DATABASE
SISTEMI INFORMATIVI E DATABASE SISTEMA INFORMATIVO AZIENDALE (S.I.) In una realtà aziendale si distingue: DATO elemento di conoscenza privo di qualsiasi elaborazione; insieme di simboli e caratteri. (274,
Dettagli