GridGain. Aumentare scalabilità e performance con l'aiuto del Open Source e della Grid Computing. Alfonso Focareta, Christian Mongillo.

Documenti analoghi
Ambienti di calcolo a griglia Parte 2. Risorse (e loro gestione) Job di griglia e applicazioni di griglia Riservare le risorse ai job

TYPO3 in azione con l infrastruttura ZEND: affidabilità e sicurezza. Mauro Lorenzutti CTO di Webformat srl mauro.lorenzutti@webformat.

Docebo: la tua piattaforma E-Learning Google Ready.

Introduzione al Cloud Computing

hi-com software realizzato da Hi-Think

JOB - Amministrazione del personale. La soluzione Sistemi per il professionista delle paghe.

CONTENT MANAGEMENT SYSTEM

Capitolo 3. L applicazione Java Diagrammi ER. 3.1 La finestra iniziale, il menu e la barra pulsanti

Indice generale. Gli autori...xiii. Prefazione...xv. Benvenuti nel cloud computing...1

Tirocinio per la Laurea Triennale

Guida Joomla. di: Alessandro Rossi, Flavio Copes

Sommario. Oracle Database 10g (laboratorio) Grid computing. Oracle Database 10g. Concetti. Installazione Oracle Database 10g

Pannelli per Gestione Avanzata Ordini

La piattaforma di lettura targhe intelligente ed innovativa in grado di offrire servizi completi e personalizzati

ProSky Progettare una facciata continua non è mai stato così semplice.

UN APP FLESSIBILE E INTUITIVA PER GESTIRE I TUOI AFFARI IN TUTTA COMODITÀ

InfiXor. il programma facile e versatile per preventivi veloci e completi. il software di preventivazione per produttori e rivenditori di infissi

Gartner Group definisce il Cloud

PHP ), con l'introduzione di un middleware quale Zend Framework a

Il CRM per la Gestione del Servizio Clienti

Giardinerie Digitali Evoco di Coppola Nicola. Web Marketing Bologna - Consulenza Progetti Comunicazione Online

Il modello di ottimizzazione SAM

Introduzione alla Virtualizzazione

L o. Walter Ambu japs: una soluzione agile (

Linux nel calcolo distribuito

Archiviazione ottica documentale

LE CARATTERISTICHE. Caratteristiche. - tel fax pag. 2

Guida all uso di Java Diagrammi ER

Mon Ami 3000 Documentale Archiviazione elettronica dei documenti cartacei

Gestione Forniture Telematiche

Le effettive esigenze della Direzione del Personale nella gestione delle risorse umane in azienda. Andamento dal 2005 ad oggi

Il controllo della tua infrastruttura in palmo di mano, come anticipare i problemi prima che sia troppo tardi

Turismo Virtual Turismo Virtual Turismo Virtual

Hospitality Solutions 2.0. Soluzioni integrate per la tua Azienda

Allegato 1 CIG FF PROCEDURA DI AFFIDAMENTO PER LA FORNITURA DI UNA PIATTAFORMA PER SERVICE MASHUP AND DELIVERY CAPITOLATO TECNICO

Il CMS Moka. Giovanni Ciardi Regione Emilia Romagna

I MODULI Q.A.T. PANORAMICA. La soluzione modulare di gestione del Sistema Qualità Aziendale

Stai impaginando manualmente centinaia di pagine?

NOVITÀ SITI COMMERCIALISTA

PIANIFICAZIONE AUTOMATICA DEGLI INTERVENTI DI ASSISTENZA TECNICA. 2 Dicembre 2010

SPERIMENTAZIONE DI FIRMA ELETTRONICA AVANZATA PRESSO SEDI

Azienda: cooperativa di consumatori nata nel 1989 e presente nelle Province di Modena e di Ferrara e nella Regione Puglia e Basilicata.

Ogni documento digitalizzato, carta attivo o passivo, viene di infatti accompagnato identità da una sorta di elettron

Base di dati e sistemi informativi

LEZIONE 3. Il pannello di amministrazione di Drupal, configurazione del sito

La secolare arte di progettare articoli di pelletteria unisce la creatività alla capacità tecnica di realizzare modelli.

DuBackup+ OnlineBackups BestPractices

YO Y U O R U OP O E P R E A R T A O T R O G R D G O GESTIONE VOLANTINI

Sistemi Operativi. Conclusioni e nuove frontiere

SDD System design document

FNOMCeO. Erogazione di servizi per la gestione delle Anagrafiche presso gli Ordini provinciali dei Medici. Lecce 27 Novembre 2009

JOB. JOB - Amministrazione del personale. La soluzione Sistemi per le paghe in Azienda.

SurfCop. Informazioni sul prodotto

CREA IL CATALOGO DEI TUOI PRODOTTI SU IPAD E IPHONE CON UN APP. ANZI, CON UPP!

My.CassaNova Configura, gestisci e studia il tuo punto vendita. Gruppo Pixel srl Via Enrico Mattei, 86/5 Bologna Tel

Business Simulation in ambiente web

MService La soluzione per ottimizzare le prestazioni dell impianto

NOVITA VERSIONE La soluzione CAD/CAM per il cablaggio elettrico

Cloud Archiving

Gestione Turni. Introduzione

Addition X DataNet S.r.l.

EasyMACHINERY ERPGestionaleCRM. partner

Brochure informativa del prodotto

Royal Academy - Formazione e Certificazione Informatica. v7.x

DATANET Innovation & Integration

Uso dei modelli/template

SysAround S.r.l. L'efficacia delle vendite è l elemento centrale per favorire la crescita complessiva dell azienda.

Retail L organizzazione innovativa del tuo punto vendita

Brochure prodotto Infrastrutture di ricarica per veicoli elettrici Servizi di connessione ABB

<Insert Picture Here> Il Successo nel Cloud Computing con Oracle Advanced Customer Services (ACS)

Progettaz. e sviluppo Data Base


DW-SmartCluster (ver. 2.1) Architettura e funzionamento

#cloudaws. Community - Cloud AWS su Google+ Amazon Web Services. Amazon EFS (elastic file system)

Receptionist 2.0. La soluzione semplice ed affidabile per il contact center

Università degli Studi di Salerno

Managed Print Services

Joomla! 2.5:Utenti e permessi - Il wiki di Joomla.it

In estrema sintesi, NEMO VirtualFarm vuol dire:

ora elettrica Babele è stato infatti progettato per:

SOLUZIONI INFORMATICHE PER LO STUDIO LEGALE

Il Sistema di Valutazione nel Gruppo UniCredit

Sistemi informativi secondo prospettive combinate

Sistema Ambiente 2010": Il Network Nazionale della Biodiversità. Checklist, chiavi di identificazione, archivi di immagini ed altre risorse

Plurima Protocollo. Soluzione di gestione Protocollo Informatico e Flusso documentale

Samodoc è un servizio Segesta s.r.l. Via Giacomo Peroni, Roma 06/ Powered by Pross s.r.l.

EXPLOit Content Management Data Base per documenti SGML/XML

Soluzioni per archiviazione sicura di log di accesso server Windows. PrivacyLOG

ESERCITAZIONE Semplice creazione di un sito Internet

Il calendario di Windows Vista

Optimize your energy park.

L ARMONIZZAZIONE DEI PROCESSI CON IL CLIENTE AL CENTRO

Scheda. Il CRM per la Gestione del Marketing. Accesso in tempo reale alle Informazioni di rilievo

DESCRIZIONE SOFTWARE ECALL

Mac Application Manager 1.3 (SOLO PER TIGER)

Istruzione Operativa Richiesta di Offerta on-line in busta chiusa digitale

GUIDA AL PRODOTTO PRESENTAZIONE MEXAL JUNIOR. il gestionale affidabile e flessibile come la tua azienda

FidelJob gestione Card di fidelizzazione

Transcript:

GridGain Aumentare scalabilità e performance con l'aiuto del Open Source e della Grid Computing Alfonso Focareta, Christian Mongillo Pro-netics

Introduzione Enterprise Cms? ECMS: un caso di studio Problematiche e troubleshooting GridGain e i vantaggi della grid-computing

Enterprise CMS Differenze tra CMS e ECMS : Molti utenti (più redazioni ognuna con più utenti che lavorano in maniera concorrente) Elevata quantità di contenuti (di archivio e pubblicati) Alimentazione da fonti esterne (base dati esterne) Automazioni sulle pubblicazioni (schedulare orari di pubblicazione e automazione) Utilizzo maggiore delle risorse hardware

Enterprise CMS Amministrazione intuitiva ed elastica (pronta ad accogliere ogni tipologia di contenuti senza modifiche) Uptime 365x24 Elevato numero di utenti abituali con picchi frequenti (molti utenti che in base ad un particolare evento consultano una pagina) Meccanismi per il risparmio di banda (gestione qualità img, crop e ridimensionamento automatizzato)

ECMS un caso reale Boxes (nome fittizio) Tecnologie e framework utilizzati : JMS WICKET FRAMEWORK DOZER XSTREAM QUARTZ SPRING HIBERNATE GRIDGAIN (*)

ECMS un caso reale Componenti (Moduli) di Boxes Client (amministrazione per la gestione dei contenuti) Feeder: componente automatizzato per l'importazione di dati da fonti esterne (DB, rss... ) Publisher: componente che dall'analisi dei dati immessi tramite il client, crea uno snapshot dei siti, e lancia la generazione dei contenuti (xml / html...) Dispatcher: invocato dal Publisher pubblica sui webserver di frontend tramite JMS il contenuto generato al fine di renderlo visibile agli utenti finali.

ECMS un caso reale

Performance di un ECMS Le performance di un ECMS sono regolate dai seguenti requisiti: Concorrenza di lavorazione (due utenti lavorano allo stesso contenuto) Velocità di generazione e pubblicazione del contenuto (tenendo presente gli automatismi temporali e di auto pubblicazione) Alta scalabilità (aumentano i contenuti e i siti ma non ram e cpu)

Performance di un ECMS 2 : le macchine di BE Boxes in numeri 3 : anni di sviluppo del progetto 5 : sviluppatori impegnati nel progetto 6 : le macchine di FE 20 : fonti da cui ciclicamente Boxes attinge dati per la pubblicazione 150 : utenti che attualmente utilizzano l'amministrazione(client) 400.000 : picco di accessi contemporanei al sito. 600.000 : content attualmente salvati presenti in Boxes.

ECMS Troubleshooting Problemi di scalabilità nell'architettura di Boxes Publisher : Dovendo per questioni di concorrenza questo componente analizzare tutto il ramo dei contenuti era esposto a una degradazione delle performance inevitabile. Soluzioni possibili : scalare sull'hardware (soluzione non finale e costosa) forti modifiche software (refactoring lenti e costosi) grid computing (dividere i task di analisi tra più installazioni del modulo publisher)

Dobbiamo scegliere cosa fare?...il cliente aspetta...il vostro capo aspetta...la risposta è?

GridGain Open Source Grid Computing Creato e Supportato da GridGain Systems (Community e Professional) Implementazione Map/Reduce potente,semplice,divertente http://www.gridgain.com/

GridGain Grid Computing Un modo per sfruttare gli ambienti multi-core per ottenere scalabilità orizzontale. Map Reduce Paradigma classico nella grid computing per implementare soluzioni scalabili. Modello di programmazione per processare grandi set di dati Metodologia standard per la parallelizzazione di processi di calcolo onerosi

GridGain Map Reduce: Splittare i nostri task in n job parallelizzabili raggruppati per chiave. Mappare i nostri job in unità di processo raggruppate per chiave. Merging dei risultati dei singoli processi di calcolo in un risultato globale di task

Map Reduce 1.Il task arriva al primo nodo, dove viene splittato in tre job.il primo è self-assigned e viene processato localmente 2.il secondo job viene mandato al secondo nodo dove viene processato 3.il terzo job viene mandato al terzo nodo dove viene processato 4.il risultato del secondo job viene collezionato dal task del primo nodo 5.Il risultato del terzo job viene collezionato dal task del primo nodo 6.I risultati dei due job dai nodi remoti vengono collezionati insieme a quello ottenuto localmente, ridotti dal task e racchiusi in un unico risultato

Utilizziamo il Map/Reduce Il nostro task : tagliare a fette un filone di pane da 25 metri per il Nutella Javaday Party!!!

Utilizziamo il Map/Reduce Soluzione : Dividere il filone in 25 parti, assegnare ogni parte ad un tagliatore (quelli in prima fila sono perfetti). Quando tutti hanno tagliato il loro metro di pane raggruppare le fette.

Utilizziamo il Map/Reduce Il nostro task : ordinare e raggruppare per colore un mazzo di carte francesi per il Javaday Texas Hold'em Tournament.

Utilizziamo il Map/Reduce Soluzione : Dividere le carte in 4 mazzetti assegnati a 4 giocatori (quelli in prima fila...di nuovo :-D) che le raggruppano per colore. Aggregare i mazzetti di ogni giocatore per colore e passare all'ordinamento dei mazzetti.

GridGain Features Map/Reduce avanzato Architettura SPI Load Balancing Fault-Tolerance Zero Deployment Model Annotation-Based Grid-Enabling AOP JMX Management e Monitoring

GridGain Features Configurazione basata su SPI (Service Provider Interface) Discovery SPI Topology SPI Checkpoint SPI Load Balancing SPI Collision SPI Failover SPI Metrics SPI

GridGain Map/Reduce Api a supporto dell'intera fase di map e reduce GridTask,GridJob,GridConfiguration,GridFactory Gestione asincrona della fase di reduce Configurazione checkpoint per task con lunghi tempi di running

Checkpoint a questo punto......conosciamo i punti deboli di Boxes......siamo esperti di grid computing......il cliente sta ancora aspettando......il capo sta ancora aspettando... è il momento di...

Do the right thing! INTEGRARE...

Integrazione Individuiamo i processi sequenziali e ripetitivi del modulo publisher Analisi sequenziale dei siti Pubblicazione sequenziale dei contenuti modificati Individuiamo l'entry point del nostro algoritmo dove poter integrare GridGain (quale processo sarà il nostro task?) Modifichiamo l'algoritmo del publisher : introduciamo il Map/Reduce e trasformiamo i cicli di calcolo in job paralleli

Integrazione Analizziamo e ottimizziamo la nostra griglia configuriamo la topologia della griglia e scegliamo quali nodi effettueranno determinati job. pesiamo il deployment dei job in base alla potenza di calcolo delle singole macchine. In Boxes esistono siti con differente quantità di contenuti e con differente necessità di velocità di pubblicazione siti leggeri -> raggrupati in un unico job su macchine meno performanti siti pesanti -> splittati in un unico job sulle macchine più performanti

I vantaggi dell'integrazione Performance immediate abbiamo parallelizzato tutti i processi che erano in una catena sequenziale (ora i siti vengono analizzati con letture parallele) Affidabilità e scalabilità abbiamo distribuito il carico di lavoro fra i nodi della nostra griglia (i processi più pesanti verrano presi in carico dalle macchine più performanti) Facilità nell'upgrade usiamo una parte della griglia per garantire la disponibilità dell'applicativo mentre aggiorniamo gli altri nodi.

Ottimizzazione graduale L'architettura di GridGain ci permette l'ottimizzazione graduale dell'integrazione Ottimizzazione intuitiva grazie alla configurazione delle SPI

Contatti Grazie per l'attenzione!!!! buona Grid Computing a tutti alfonso.focareta@pronetics.it christian.mongillo@pronetics.it http://www.pro-netics.it