Big Data e Calcolo Parallelo

Похожие документы
Cosa è un foglio elettronico

Big Data. Davide Giarolo

MICHELANGELO REPORT è un

Il clustering HA con Linux: Kimberlite

Introduzione al data base

Software di base e software applicativo. Titolo: dic (1 di 9)

Gestione ed analisi di base dati nell epidemiologia. delle malattie infettive

Architetture Informatiche. Dal Mainframe al Personal Computer

Architetture Informatiche. Dal Mainframe al Personal Computer

Creare una Rete Locale Lezione n. 1

L informatica INTRODUZIONE. L informatica. Tassonomia: criteri. È la disciplina scientifica che studia

La Gestione Strategica delle Parti alla IMAFORNI INT L S.p.A. Storia di Successo

LE CARATTERISTICHE. Caratteristiche. - tel fax pag. 2

Simple & Efficient.

Introduzione al Cloud Computing

nuovo software Enterprise Resource Planning

COSTI E CONSUMI SOTTO CONTROLLO

In estrema sintesi, NEMO VirtualFarm vuol dire:

Flessibile Altamente personalizzabile Semplice ed intuitivo Integrato con MS Office Completo e potentissimo Multiversione (Cloud, C/S e stand alone)

Introduzione alla Virtualizzazione

IT Cloud Service. Semplice - accessibile - sicuro - economico

Archivi e database. Prof. Michele Batocchi A.S. 2013/2014

Gestione Laboratorio dott. P. Leonardi e dott. B. Martini

IL SOFTWARE. Giada Agostinacchio Classe 2^ Beat ISIS G.Meroni Lissone Anno Scolastico 2007/2008

GOW GESTIONE ORDINI WEB

GridSense. L energia gestita con intelligenza.

Docebo: la tua piattaforma E-Learning Google Ready.

L Informatica al Vostro Servizio

Scenario di Progettazione

e-dva - eni-depth Velocity Analysis


MODULO 02. Iniziamo a usare il computer

Resusci Anne Skills Station

database: modello entityrelationship

Attività 9. La città fangosa Minimal Spanning Trees

Progetto: Copertura Wi-Fi per l accesso ad Internet autenticato e per il controllo energetico

DSCube. L analisi dei dati come strumento per i processi decisionali

RADAR. Raccolta e Analisi Dati per Attribuzione Rating

LA NUOVA GESTIONE STUDIO

San Giovanni Teatino 29 Novembre Marco Perini Collaboration Value

Protocollo. Outlook Documenti

itime Chiaramente inclusa la stampa del cartellino presenze come previsto dalle normative

Ibpm è lo strumento per la gestione dei processi, dalla modellazione, all esecuzione, al monitoraggio.

Sviluppo Applicativi personalizzati per automatizzare le Analisi SPC

Esame Di Stato A.S. 2004/2005 Istituto Tecnico Commerciale Corso Sperimentale Progetto Mercurio Corso di Ordinamento - Programmatori

Software di sistema e software applicativo. I programmi che fanno funzionare il computer e quelli che gli permettono di svolgere attività specifiche

ISTITUTO TECNICO ECONOMICO MOSSOTTI

STORIA DI UN INTEGRAZIONE

Scopo della lezione. Informatica. Informatica - def. 1. Informatica

Architetture Applicative

I MODULI Q.A.T. PANORAMICA. La soluzione modulare di gestione del Sistema Qualità Aziendale

LA SOLUZIONE. EVOLUTION, con la E LA TECNOLOGIA TRASPARENTE IL SOFTWARE INVISIBILE INVISIBILE ANCHE NEL PREZZO R.O.I. IMMEDIATO OFFERTA IN PROVA

Lavora dove vuoi FIGARO

PROFILO AZIENDALE 2011

Cos è la FatturaPA. Come creare una fattura elettronica con Fattura Facile (creazione del file XML)

Presentazione integrazione AdHoc e KarthaDoc

Cloud Service Broker

Capire i benefici di una rete informatica nella propria attività. I componenti di una rete. I dispositivi utilizzati.

Raccolta, condivisione e analisi dei dati

Breve storia del calcolo automatico

Piacere di conoscerla

INTEGRATA OTTIMIZZAZIONE DEI PROCESSI AZIENDALI

L architettura di un DBMS

Controllo di Gestione

la soluzione CAD/CAM per la piegatura proposta da Infolab

Il Centro Elaborazione Dati per Il Professionista all avanguardia SPINOFF AZIENDA LISTINO E DESCRIZIONE SOFTWARE. Progettato per sistemi operativi

ORACOLO Gestione questionari.

online La situazione operativa. In ambito aziendale i processi decisionali richiedono assunzioni di responsabilità a vari LABORATORIO 1

Prospettive di sviluppo di servizi

È evidente dunque l'abbattimento dei costi che le soluzioni ASP permettono in quanto:

IMPIANTI.NET E il gestionale verticale ideato per le aziende che realizzano IMPIANTI TECNOLOGICI

ProSky Progettare una facciata continua non è mai stato così semplice.

PMS. Productivty Monitor System. Nibax Software

Software. Definizione, tipologie, progettazione

WORK LINE LASER MACHINE: DAL FILE 2D AL TAGLIO

Progetto: Copertura Wi-Fi per l accesso ad Internet autenticato per i collaboratori esterni dell azienda

Ambienti di calcolo a griglia Parte 2. Risorse (e loro gestione) Job di griglia e applicazioni di griglia Riservare le risorse ai job

PIANO ANNUALE DI LAVORO INFORMATICA CLASSI PRIME. Tecnico in Turismo

Le caratteristiche must have del software gestionale ideale

Appunti del corso di Informatica 1 (IN110 Fondamenti) 4 Linguaggi di programmazione

ICT Trade 2013 Special Edition

Lezione 1. Introduzione e Modellazione Concettuale

Gestione delle formazione

COMMERCIALISTI CONSULENTI DEL LAVORO IL PORTALE PER COMUNICARE E COLLABORARE CON I TUOI CLIENTI

Comprendere il Cloud Computing. Maggio, 2013

Business Intelligence

DATAMORFOSI. E la sintesi della strategia di prodotto di Webgate400.

Corso di Informatica

Sistemi centralizzati e distribuiti

Organizzazione delle informazioni: Database

APPRODO IMPIANTI Approdo Impianti Approdo Impianti

Big data ed eventi: quasi un tutorial. Prof. Riccardo Melen

Транскрипт:

Big Data e Calcolo Parallelo Luigi Roggia

Tempi che cambiano... I sistemi informatici di ieri non sono più idonei a gestire le esigenze informative odierne Oggi più che mai è indispensabile ottimizzare tempi, risorse, qualità e strategie Enormi quantità di dati aspettano di essere strutturati ed analizzati per rivelare informazioni ancora non emerse

L invasione dei dati Ogni giorno il mondo in cui viviamo e lavoriamo produce incessantemente dati Esiste una netta differenza tra dati e informazioni: i dati di per sè sono pressochè inutili! Se i dati vengono raccolti ed archiviati senza un metodo adeguato, possono diventare costosi o impossibili da utilizzare in un secondo momento

Big data e dati in generale Non esiste una definizione quantitaviva di quando un dataset diventi un large dataset; il termine Big Data è spesso usato impropriamente Per i veri large dataset sono indispensabili le nuove tecnologie nate e studiate appositamente Alcune delle strategie usate per i big data sono utili e convenienti anche per dataset più piccoli

Database relazionali e non Esiste molta confusione su cosa sia effettivamente un database e su quanto sia importante un vero database in azienda! Un foglio Excel o un documento Access non rappresentano soluzioni per creare database la struttura logica più stabile, utile, performante e versatile è quella del database relazionale per i big data esistono invece i database non relazionali In alcuni casi un mix di database relazionali e non relazionali rappresenta la soluzione ottimale

Database relazionale...? tbd_colore id_colore codice_colore descrizione_colore 1 K0123 Grigio Argento 2 S9111 Nero Notte 3 L0091 Rosso Fuoco 4 K0125 Grigio Fucile tbd_modello id_modello codice_modello descrizione_modello 1 PT002 Punto 2 FR001 Freemont 3 CR004 Croma 4 PD005 Panda tbl_produzione id_produzione id_colore id_modello anno_mese_produzione 1 1 4 201302 2 2 3 201302 3 2 1 201303 4 4 2 201304

Hardware e architettura di sistema Il mondo informatico è irreversibilmente lanciato verso le soluzioni web based, oggi chiamate cloud In questo contesto, l acquisto di ferro non ha più molto senso e senz altro è anti economico Il concetto di cloud è estremamente importante per il trattamento dei big data e offre soluzioni vincenti e strategiche anche per basi dati non necessariamente big Tenere i dati in casa su hardware proprietario, non è più la soluzione sempre corretta e conveniente

Problemi dei big data Come gestire il file system Come effettuare il back up o la ridondanza dei dati Come eseguire analisi statistiche Come affrontare l allestimento hardware Come eseguire ricerche veloci In realtà tutti questi punti possono essere affrontati anche per dataset di dimensioni standard e condurre a grandi ottimizzazioni...

Calcolo parallelo e distribuito

Calcolo parallelo e distribuito Solitamente questa situazione si verifica nel calcolo scientifico, soprattutto quando si fannno moodelli di sistemi fisici complessi

Calcolo parallelo e distribuito

Apache Hadoop The Apache Hadoop software library is a framework that allows for the distributed processing of large data sets across clusters of computers using simple programming models. It is designed to scale up from single servers to thousands of machines, each offering local computation and storage.

Apache Hadoop Dispone di un file system distribuito, capace di gestire file di dimensioni ingenti Permette di aggiungere e rimuovere macchine al cluster con estrema facilità E compatibile con diversi linguaggi di programmazione Gestisce in modo automatico l utilizzo dei nodi di calcolo Risolve il problema del plateau parallelo

Apache Hadoop

Data Science La nuova disciplina nata dalla necessità di trasformare i dati in informazioni e le informazioni in fatturato Unisce matematica, informatica, creatività e competenze di settore Il futuro appartiene alle aziende che sapranno sfruttare al meglio i dati

Conclusione GMSL Consulting svolge consulenze di Data Science ed è in grado di progettare e realizzare soluzioni per la gestione e l analisi di big data. www.gmslconsulting.it