INFORMATION MINING: TRACCE DIGITALI DATI UTILI ALLA CONOSCENZA STRATEGICA

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "INFORMATION MINING: TRACCE DIGITALI DATI UTILI ALLA CONOSCENZA STRATEGICA"

Transcript

1 I quaderni di di Claudio Carpineto INFORMATION MINING: TRACCE DIGITALI DATI UTILI ALLA CONOSCENZA STRATEGICA L Information Mining può essere spiegata in maniera semplice come l estrazione di informazione utile da insiemi di dati. Nella società cosiddetta dell informazione i dati raccolti e le analisi dei dati raccolti diventano sempre più determinanti per promuovere business a qualsiasi livello. Questo numero de I Quaderni di Telèma, dedicato al settore ci accompagna in questo universo in cui la matematica viene applicata all'analisi dei dati. Questo tipo di attività è cruciale in molti ambiti della ricerca scientifica, ma anche in altri settori (per esempio in quello delle ricerche di mercato). Nel mondo professionale è utilizzata per risolvere problematiche diverse tra loro, che vanno dalla gestione delle relazioni con i clienti (CRM), all individuazione di comportamenti fraudolenti per finire all ottimizzazione di siti web. In futuro i processi decisionali delle aziende potrebbero basarsi esclusivamente su questo genere di analisi, infatti la possibilità di analizzare automaticamente dati apre nuovi scenari applicativi finora inimmaginabili permettendo la creazione di una nuova gamma di servizi basati sulla conoscenza. La ricerca proposta nelle pagine seguenti dalla Fondazione Bordoni può portare alla scoperta di regole e associazioni nascoste nelle sequenze di dati, al riconoscimento di entità semantiche nei testi, alla modellazione in tempo reale delle rilevazioni sensoriali e strumentali, e alla profilazione implicita dell utente. La quantità di dati digitali prodotti dall utente aumenta vertiginosamente di giorno in giorno e dunque è quanto mai importante far divulgazione su questo concetto: ognuno di noi lascia una quantità sempre maggiore di tracce digitali. Da queste tracce è possibile risalire ai gusti, alle preferenze, finanche alle abitudini di ciascuno. La conferenza annuale più importante del settore è la KDD (Knowledge Discovery in Databases) Conference; inaugurata nel 1995, nelle ultime edizioni è arrivata a totalizzare 1000 par tecipanti, con sponsorizzazioni milionarie da parte delle aziende informatiche e dei motori di ricerca. In queste pagine sono tre le tecniche specifiche approfondite: la classificazione automatica basata sugli esempi (principalmente con riferimento a basi di dati); la strutturazione automatica dei risultati delle ricerche Web; e l analisi delle opinioni ( sentiment analysis ). Supplemento al numero 266 maggio 2009 di

2 I N D I C e Introduzione Classificazione automatica Analisi e strutturazione dei risultati delle ricerche Web Analisi delle opinioni e dei sentimenti Limitazioni e problemi aperti Information Mining in FUB Il quaderno di Telèma è stato realizzato dalla Fondazione Ugo Bordoni. presidente enrico manca direttore delle ricerche l ing. mario Frullone Curatore del Quaderno: claudio carpineto Hanno collaborato: giambattista amati, andrea Bernardini, raffaele nicolussi, giovanni romano, Fondazione ugo Bordoni SONO USCITI NEL /2009: utente senza segreti informazione personalizzata aprile nuove piattaforme di diffusione terrestre e satellitare della tv digitale: gli standard dvb-t2 e dvb-s2 maggio piattaforme e contenuti in un mondo in movimento giugno la tecnologie Fotoniche per la larga Banda e per le ngn luglio/agosto robot con noi, tra noi e dentro di noi SettemBre robot: tra realtà e fantasia ottobre passaggio al digitale: il modello Sardegna novembre tv digitale terrestre in Sardegna: ecco i primi bilanci dicembre /gennaio e-inclusion: accessibilità nella società dell informazione FeBBraio tecnologia e disabilità: due mondi non ancora globali marzo il futuro di internet: ipv6 un indirizzo per tutti e tutto aprile Iquadernidi

3 introduzione La quantità di dati prodotta in formato digitale ha subito una brusca accelerazione. L universo Web con le sue reti sociali, le tracce lasciate sui siti di commercio elettronico e sui motori di ricerca, i dati raccolti attraverso i dispositivi per la comunicazione mobile personale e dalle reti di sensori sono solo alcuni esempi di questo autentico diluvio informativo. Secondo stime recenti la dimensione dell universo digitale ha raggiunto i 281 miliardi di Giga-bytes, che vuol dire circa 45 Giga-bytes a testa. La possibilità di analizzare automaticamente questi dati aprirebbe scenari applicativi impensabili, con la creazione di una nuova gamma di servizi basati sulla conoscenza. La ricerca ha raccolto questa sfida e sta inventando nuove tecniche di Information Mining, per consentire ad esempio la scoperta di regole e associazioni nascoste nelle sequenze di dati, il riconoscimento di entità semantiche nei testi, la modellazione in tempo reale delle rilevazioni sensoriali e strumentali, e la profilazione implicita dell utente. Information Mining è una disciplina con radici in intelligenza artificiale, apprendimento automatico, information retrieval, statistica e teoria delle basi di dati. Il suo obiettivo principale è fare predizioni, basandosi tipicamente sull analisi di un campione di dati di addestramento dal quale viene appresa conoscenza sotto forma di regolarità o pattern, conoscenza che poi verrà utilizzata per interpretare nuovi dati. In questo senso, le tecniche di Information Mining integrano ed estendono strumenti di analisi dei dati più tradizionali come OLAP (On-line Analytic Processing) e eda (exploratory Data Analysis), che sono basati principalmente sulla verifica delle ipotesi e la modellizzazione dei dati. L interesse scientifico, delle aziende private e degli organismi pubblici è fortissimo. La conferenza annuale più importante del settore è la KDD (Knowledge Discovery in Databases) Conference; inaugurata nel 1995, nelle ultime edizioni è arrivata a totalizzare 1000 partecipanti, con sponsorizzazioni milionarie da parte delle aziende informatiche e dei motori di ricerca. Tantissime sono le università e i centri di ricerca coinvolti, con molta ricerca industriale, numerosi prodotti commerciali, e un grande mondo del software open source. Non c è virtualmente settore produttivo e dei servizi in cui siano coinvolte grandi quantità di dati in forma digitale - marketing, sorveglianza, reti. scoperta scientifica - che non possa beneficiare dell impiego di queste tecnologie. Solo per citare alcuni esempi, esse sono il fondamento dei metodi avanzati per la gestione relazione clienti, il controllo di qualità, l elaborazione dei reclami, la sicurezza delle infrastrutture digitali, la scoperta di frodi, e l erogazione del credito. e nuove promettenti scienze applicative basate sull estrazione automatica delle informazioni stanno nascendo proprio ora, dalla pubblicità contestualizzata (computational advertising) all analisi automatica delle reti sociali del web 2.0 (social web mining). Non è possibile in poche pagine presentare una panoramica esaustiva di un settore così vasto. Noi ci limiteremo ad approfondire tre tecniche specifiche con importanti valenze applicative, e cioè la classificazione automatica basata sugli esempi (principalmente con riferimento a basi di dati), la strutturazione automatica dei risultati delle ricerche Web, e l analisi delle opinioni ( sentiment analysis ). Successivamente discuteremo alcuni aspetti di carattere generale che riguardano le limitazioni e l applicabilità delle tecniche di Information Mining, vedremo quali sono i principali insegnamenti che si possono trarre da una storia di successi (e anche di fallimenti) che ha oramai più di dieci anni, e identificheremo gli sviluppi più promettenti. Infine illustreremo brevemente alcune ricerche in corso presso la Fondazione Ugo Bordoni in questo settore. MAGGIO

4 INFORMATION MINING: TRACCE DIGITALI DATI UTILI ALLA CONOSCENZA STRATEGICA classificazione automatica Figura 1. Frontiere di decisione per problemi di classificazione multipla. È probabilmente il tema che è stato analizzato meglio da un punto di vista scientifico e che ha prodotto tecniche e strumenti software che sono stati applicati in una miriade di casi reali. È anche l argomento sul quale i progressi scientifici sono misurabili in modo più oggettivo grazie alla disponibilità di misure semplici e attendibili e di banchi di prova condivisi. Ogni anno, in occasione della KDD conference, si svolge una competizione - la KDD Cup - nella quale i partecipanti devono cimentarsi con compiti predittivi su basi di dati di grandi dimensioni, solitamente messe a disposizione da grandi aziende che hanno un interesse diretto allo sviluppo di metodi sempre più efficaci. Nel, ad esempio, si trattava di indovinare i gusti degli utenti di Netflix, il più grosso servizio online di noleggio dvd negli USA. Nella KDD Cup 2009, attualmente in corso di svolgimento, bisogna prevedere il grado di fedeltà e la propensione all acquisto di servizi aggiuntivi relativi al compor tamento dei clienti della compagnia telefonica francese Orange. Alla KDD Cup 2009 par tecipano circa duecento squadre, che puntano ad aggiudicarsi anche il premio in denaro messo in palio. esistono vari metodi per realizzare una classificazione. Attraverso l analisi di un insieme di istanze (record, testi, pagine Web) pre-classificate (training set), viene costruito un modello dei dati che poi viene impiegato in fase di predizione sul test set. Questo modello può essere espresso con regole simboliche (ad esempio, se l istanza possiede gli attributi a AND b AND c allora appartiene alla classe X), con regole probabilistiche (se l istanza possiede gli attributi a AND b AND c allora appartiene con probabilità p 1 alla classe X, con probabilità p 2 alla classe Y,...), oppure con una rete neurale, o ancora con metodi geometrici. Quest ultimo paradigma è quello che si è affermato maggiormente negli ultimi anni e al quale dedicheremo un breve approfondimento.le istanze di training vengono rappresentate come punti in uno spazio multi-dimensionale (dove ogni coordinata corrisponde al valore dei singoli attributi che descrivono le istanze) e l obiettivo è trovare le regioni corrispondenti a ciascuna classe; in fase di test le istanze verranno assegnate alla classe della regione in cui cadono. Le frontiere di queste regioni, chiamate frontiere di decisione, possono essere regolari o irregolari (si veda esempio in Figura 1). Quando le frontiere di decisione sono funzioni lineari si parla di metodi lineari per la classificazione e vengono definite attraverso la funzione: Figura 2. Classificazione binaria lineare. n=2 K=2 Quando k=2 la classificazione è detta binaria e il problema della classificazione di un nuovo caso si riduce all individuazione dei coefficienti w e b (Figura 2). In generale il calcolo della frontiera di decisione non è banale a causa della disposizione dei casi da esaminare e della presenza di diverse possibili soluzioni. Tra le metodologie usate per determinate la frontiera di decisione uno dei più utilizzati è quello basato sulle Support Vector Machine (SVM), o macchine a vettori di supporto, che permette di determinare l iperpiano di sepa- 58 Iquadernidi

5 classificazione automatica Figura 3. Classificazione a massimo margine. razione L tale da massimizzare la distanza d (detto margine dell iperpiano) tra i punti più vicini appartenenti alle due classi (Figura 3). Le SVM furono sviluppate negli anni 90 da Vladimir Vapnik e dai suoi collaboratori presso i laboratori Bell AT&T. Appartengono alla famiglia dei classificatori lineari generalizzati e sono anche note come classificatori a massimo margine, poiché allo stesso tempo minimizzano l errore empirico di classificazione e massimizzano il margine geometrico. Le SVM sono state successivamente estese per trattare anche la presenza di punti singolari e per separare istanze che non sono linearmente separabili. Il trucco è quello di trasformare la rappresentazione delle istanze da classificare, passando ad uno spazio a dimensione maggiore. In Figura 4 questo concetto è esemplificato con riferimento al passaggio dal piano allo spazio tridimensionale, dove è facile trovare un piano di separazione per gli stessi oggetti che sul piano non erano invece linearmente separabili. Il metodo SVM, così come altri algoritmi di classificazione, offrono in generale buone prestazioni, ma la loro efficacia va rapportata allo scostamento che i dati reali presentano rispetto alle assunzioni ideali (esplicite o implicite) che sono necessarie per garantire il corretto funzionamento del classificatore. In effetti, in pratica è spesso necessario adottare politiche sofisticate di trattamento e pre-elaborazione dei dati di addestramento senza le quali il classificatore potrebbe offrire risultati molto deludenti. È inoltre fondamentale adottare tecniche computazionalmente efficienti perché le basi di dati possono arrivare a contenere milioni di istanze descritte da decine di migliaia di variabili. Ancora, è importante ottimizzare in modo accurato i parametri del classificatore utilizzando i dati di addestramento ma cercando di evitare il fenomeno di overfitting fra modello e campione. In Tabella 1 vengono riportate le principali difficoltà che si incontrano nei problemi reali. Figura 4. Classificazione con trasformazione dello spazio di rappresentazione. MAGGIO

6 INFORMATION MINING: TRACCE DIGITALI DATI UTILI ALLA CONOSCENZA STRATEGICA Dati ideali Dati reali Distribuzione classi Bilanciata Sbilanciata Tipo di dati Valori mancanti Numerici o simbolici No Misti Si Istanze rumorose Dimensionalità Scale di valori No Bassa Uguali Si Alta Differenti Tabella 1. Condizioni ideali e reali nella classificazione automatica. analisi e Strutturazione dei risultati delle ricerche web Uno dei temi emergenti più interessanti dell Information Mining è costituito dalle metodologie di analisi dei risultati delle ricerche fatte sul Web con i normali motori di ricerca. È nata infatti la necessità di affiancare ai potenti strumenti di interrogazione adeguate metodologie di visualizzazione e di aggregazioni dei risultati. La risposta ad una interrogazione generica espressa con pochi termini è costituita spesso da migliaia di documenti destrutturati che non consentono all utente di discriminare fra i vari aspetti contenuti nei risultati. Se i documenti di interesse si riferiscono ad un particolare significato o aspetto dell interrogazione, il rischio è quello di dover scandire una lunga lista di risultati prima di trovarne qualcuno pertinente. Un classico esempio di termine ambiguo è costituito dalla parola Jaguar che può riferirsi, fra l altro, all automobile e all animale. Anche una interrogazione generica come Roma fa sorgere lo stesso problema: si potrebbe voler cercare informazioni sui monumenti presenti nella città, su una squadra di calcio o sull antica Roma. Questo fenomeno si presenta spesso, sia perché la maggior parte delle ricerche Web sono di tipo informazionale sia perché, a causa delle dimensioni del Web e della proliferazione di sigle, acronimi, nomi propri e altro, praticamente ogni interrogazione formata da uno o due termini è potenzialmente ambigua. In questi casi sarebbe auspicabile fornire all utente la possibilità di accedere direttamente, o con uno sforzo comunque limitato, al significato di interesse. Per affrontare questo problema, il modo più naturale probabilmente consiste nel fare il clustering dei risultati. Analizzando il contenuto testuale dei risultati, è possibile partizionare i documenti in gruppi con significati omogenei, e dare all utente la possibilità di cliccare sul cluster d interesse per vedere i documenti che contiene. Se l etichetta che descrive il cluster è sufficientemente informativa e se i documenti contenuti in esso si riferiscono effettivamente a quell argomento, è possibile accedere ai documenti di ciascun argomento dell interrogazione in tempo logaritmico (invece che lineare) nella lunghezza della lista dei documenti. Uno dei sistemi commerciali più noti che offrono questo servizio è Vivìsimo. Si noti che il clustering dei risultati non è alternativo ai normali motori di ricerca; è un metodo complementare nel caso in cui questi ultimi offrano un risultato insoddisfacente. Mantenendo invece l interfaccia tradizionale a lista di risultati, ci può essere un riordinamento nell ordine di presentazione con l obiettivo di aumentare la copertura dei possibili significati dell interrogazione presenti nella prima pagina mostrata all utente (di solito i primi dieci risultati). Ci si riferisce a questo approccio come diversificazione, e le tecniche impiegate consistono nello scegliere documenti che non solo siano pertinenti rispetto all interrogazione (che è il criterio di ordinamento standard) ma anche sufficientemente nuovi o differenti rispetto ai risultati che sono già stati generati. Un altro approccio è costituito dai motori di ricerca a faccette (faceted search). L idea di base è quella di permettere all utente di esplorare le informazioni uti- 60 Iquadernidi

7 analisi e Strutturazione dei risultati delle ricerche web lizzando dei filtri sulle caratteristiche delle informazioni. Ogni oggetto, infatti, può essere catalogato e classificato in molteplici modi, superando i limiti di una singola tassonomia predefinita. Ogni faccetta è quindi una caratteristica, cui corrispondono molteplici valori, che può essere utilizzata per declinare e scremare le informazioni. esempi disponibili online di faceted search sono il tool Flamenco (http://flamenco.berkeley.edu) o il più recente mspace (http://mspace.fm). Nell esempio di mspace accanto al tradizionale box di ricerca vengono forniti all utente delle opzioni per selezionare le pagine per decade, anno, tema, soggetto e titolo. Accanto alla necessità di poter discriminare fra i risultati, c è anche l esigenza di integrarli con informazioni utili che tipicamente vengono acquisite mediante l interrogazione di basi di dati e/o l accesso a servizi Web. L integrazione in forma strutturata di questo tipo di informazione nei risultati (ad esempio mediante tabelle, o fogli di calcolo) potrebbe consentire all utente una forma di interazione coi risultati molto più mirata ed efficace, paragonabile alla consultazione di una base di dati specializzata virtuale. A tutte queste esigenze di miglioramento della fase di analisi e presentazione dei risultati sembra aver cominciato a rispondere sul serio anche Google. È di qualche giorno fa la notizia del lancio di nuove search features. Si tratta di tre servizi sperimentali: Wonder Wheel (letteralmente ruota delle meraviglie ) offre suggerimenti per raffinare la ricerca e consente l applicazione di filtri, Squared costruisce tabelle che riassumono caratteristiche e valori delle informazioni in oggetto (ad esempio, una ricerca per "cani piccoli" restituisce risultati che comprendono nomi, descrizioni, taglia, peso, origine, ecc., di tutti i cani di taglia piccola), e Rich Snippets, che include i dati relativi alle recensioni disponibili per particolari prodotti o i dati di LinkedIn per le persone all'interno della pagina nei risultati (un servizio simile era già disponibile in Yahoo! Search Monkey). analisi delle opinioni e dei Sentimenti Figura 5. Cosa pensano gli appassionati di musica dei Radiohead? La Sentiment Analysis riguarda la possibilità di reperire e trattare computazionalmente le opinioni e i sentimenti espressi dalle persone sui media digitali (ad esempio nei blog) a proposito di determinati argomenti. Le opinioni, una volta reperiti i documenti nelle quali sono contenute, possono essere classificate in due o più classi, ciascuna classe indicante l intensità o la polarità (positiva o negativa) dei sentimenti espressi, e una volta aggregate statisticamente possono concorrere, ad esempio, a fornire il livello di gradimento nella rete di un servizio della Pubblica Amministrazione, o di un prodotto o di un film (vedi Figura 5). La comprensione delle emozioni espresse nei blog dischiude le porte per una vera e propria rivoluzione nella comprensione dei fenomeni del web. Oggi è possibile tastare il polso in tempo reale al gradimento di nuovi prodotti commerciali, soggetti pubblici ed eventi della vita quotidiana. Ad esempio l ultima campagna elettorale americana è stata caratterizzata dall utilizzo di strumenti di Sentiment Analysis da parte dei giornalisti e da parte degli stessi politici per valutare le reazioni degli elettori alle dichiarazioni dei candidati. Anche i primi 100 giorni di governo del presidente degli Stati Uniti Barack Obama sono stati oggetto di valutazione. È molto interessante verificare come l opinione e l apprezzamento degli elettori sia cambiato nel tempo in seguito alle decisioni prese da Obama (vedi Figura 6). Da un punto di vista tecnologico la Sentiment Analysis è un problema molto complesso, ancora oggetto di molte ricerche. In prima approssimazione, si può pensare che l analisi delle opinioni possa essere affrontata e risolta come un problema tipico di classificazione di documenti. Di fatto, le tecniche convenzionali di apprendimento automatico, quali i classificatori SVM o ancor più i classificatori Bayesiani, si sono rivelati scarsamente efficaci, soprattutto se comparati con le prestazioni analoghe ottenute quando si classifica sulla base del contenuto. Il problema spesso si concentra sulla creazione di un dizionario in cui vengono inserite le parole che possono indicare opinioni e polarità di opinioni ed in base a cui vengono e MAGGIO

8 INFORMATION MINING: TRACCE DIGITALI DATI UTILI ALLA CONOSCENZA STRATEGICA Figura 6. Quali sono stati gli eventi che hanno segnato la popolarità di Obama? pesati e giudicati i documenti. Presso la Fondazione Ugo Bordoni è stato costruito in modo automatico un dizionario dei sentimenti. La novità della soluzione proposta dalla FUB è nell'utilizzo di molte parole che spesso sono scartate dai motori di ricerca poiché prive di contenuto informativo, ma che allo stesso tempo sono ricche di contenuto emozionale come ad esempio le parole inglesi I, but, d ( d è usato per esprimere i condizionali I d ). Un problema generale è che la classificazione è computazionalmente costosa. Ad esempio l analisi delle co-occorrenze di aggettivi e verbi al fine di stabilirne un orientamento concorde o dissimile è di fatto intrattabile, in quanto oc- correrebbe addestrare un classificatore contenente centinaia di migliaia di features. Un alternativa più efficiente alla classificazione completa è di considerare per ogni documento solo quei termini che coincidono con quelli utilizzati nella interrogazione formulata dall utente e cercare di stabilire se essi cadono nel raggio di azione di aggettivi e verbi che esprimono sentimenti. In generale, per accelerare il reperimento e la classificazione di opinioni, si devono adottare tecniche di riduzione della dimensione del dizionario (index pruning) e di term-caching o document-caching che permettono di pesare e ordinare efficacemente i documenti per contenuto e qualità di opinione. limitazioni e problemi aperti In questi anni nel mondo Information Mining ci sono stati molti casi di successo e anche fallimenti, da cui c è molto da imparare. Quali sono gli ingredienti essenziali per costruire delle applicazioni riuscite e quali sono gli errori che bisogna evitare? Alcune considerazioni al riguardo si possono fare, in particolare con riferimento al problema della classificazione automatica. In alcuni casi (basti pensare alla diagnosi di malattie) si preferisce avere soluzioni meno accurate ma che siano motivate e comprensibili piuttosto che soluzioni teoricamente migliori ma prodotte da sistemi a scatola nera (tipo rete neurale). La scelta del particolare metodo di classifica- zione è importante perché il comportamento è differente in funzione delle caratteristiche dei dati (ad esempio se i dati sono linearmente separabili, se sono numerici o categorici, se sono bilanciati o sbilanciati...). La pre-elaborazione dei dati è spesso la chiave per una classificazione efficace, indipendentemente dalla scelta del classificatore. Le operazioni più importanti sono: normalizzazione delle variabili numeriche, raggruppamento di modalità per variabili categoriche, trattamento dei dati mancanti, ordinamento e filtraggio delle variabili, campionamento delle istanze. La validazione e l interpretazione dei risultati è 62 Iquadernidi

9 information mining in FuB un operazione cruciale perché il sistema costruisce un modello basandosi sui dati di addestramento e non è detto che le conclusioni valgano sull'intera popolazione. Le tecniche per ottimizzare i parametri ed effettuare classificazioni robuste sono di grande ausilio. Classici errori che vengono commessi sono: l'utilizzazione di dati di addestramento non rappresentativi, la non considerazione della fluttuazione della popolazione nel caso di dati che cambiano col tempo, un campionamento sbagliato, la focalizzazione su una singola tecnica di apprendimento, la non utilizzazione o l'utilizzazione impropria di metodi di valutazione di laboratorio. È anche interessante provare a tracciare un bilancio scientifico della disciplina. Negli ultimi dieci anni c'è stato un miglioramento importante nelle prestazioni rispetto ai primi sistemi che sono stati impiegati (ad esempio per quanto riguarda la capacità di classificazione)? Alcuni pensano che siamo entrati in una fase, come succede per molti settori nuovi dopo un po di anni, in cui i progressi cominciano ad essere lenti rispetto ai risultati iniziali. D altra parte, continuano a nascere sfide scientifiche, come ad esempio real-time data mining e sequence data mining, e vengono fondate nuove scienze applicative. È il caso di computational advertising, dove il problema è riuscire a identificare i siti Web il cui contenuto è il più adatto ad ospitare i messaggi degli inserzionisti per massimizzare il ritorno dell investimento pubblicitario, o social web mining, in cui si vogliono sfruttare le somiglianze fra i comportamenti e i gusti espressi dalle persone che aderiscono alle stesse reti sociali per fornire raccomandazioni o identificare comunità virtuali (Amazon, ad esempio, dà consigli per gli acquisti analizzando gli acquisti fatti da persone con profili simili). Poiché si tratta di problemi e tipologie di dati inediti, bisogna inventare nuove tecniche o adattare in modo significativo quelle già disponibili. Al contempo, possono nascere difficoltà o contro-indicazioni difficili da prevedere. È il caso ad esempio di Facebook, che negli ultimi mesi del aveva lanciato una forma di pubblicità obliqua e chiaramente lesiva della privacy in cui ciascun utente veniva informato, praticamente in tempo reale, degli acquisti effettuati dalle persone registrate come friends. Qualcuno si è lamentato di aver scoperto proprio così che gli amici gli stavano organizzando una festa a sorpresa, la protesta è montata, e il servizio è stato cancellato. Naturalmente le preoccupazioni a proposito di un uso rispettoso delle informazioni personali è rimasto. Il problema della possibile violazione della privacy insito nell analisi automatica dei dati - in par ticolare nella profilazione automatica dell utente - e dei rimedi che è possibile adottare è stato trattato in un numero recente dei Quaderni di Telèma (Utente senza segreti: informazione personalizzata, Media Duemila n. 255, XXVI - Aprile ), al quale si rimanda il lettore interessato. information mining in FuB classificazione automatica Alla base di molti metodi di classificazione per dati simbolici c è la definizione di una misura di similarità fra due istanze con alcune proprietà aggiuntive (kernel). In pratica, è possibile stabilire una somiglianza quando le due istanze contengono qualche variabile identica (nel caso di testi, esattamente le stesse parole). In FUB si sta investigando una nuova misura di similarità concettuale, in grado di cogliere le relazioni fra variabili (parole) differenti, basata sulla distanza fra le due variabili sul reticolo concettuale associato alla base di dati. Inoltre si stanno studiando nuovi metodi per campionare i dati di addestramento, con l obiettivo di ridurre la complessità computazionale degli algoritmi di classificazione senza sacrificare la loro accuratezza. C. Carpineto, C. Michini, R. Nicolussi (2009). A concept-lattice based kernel for SVM text classification Figura 7. Schermata del motore di clustering KeySRC per l interrogazione jaguar. MAGGIO

10 INFORMATION MINING: TRACCE DIGITALI DATI UTILI ALLA CONOSCENZA STRATEGICA Figura 8. KeySrc su iphone. To appear in Proceedings of the 7th International Conference on Formal Concept Analysis (ICFCA 2009), Darmstadt, Germany. Strutturazione dei risultati delle ricerche web Proprio in questi giorni è stato completato e messo in linea (http://keysrc.fub.it) KeySRC (Keyphrasebased Search Results Clustering), un nuovo motore di clustering per il Web basato sulla estrazione e trattamento delle frasi chiave presenti nei risultati delle ricerche. In Figura 7 vengono mostrati i risultati di KeySRC relativi all interrogazione jaguar ; KeySRC genera etichette molto espressive e dettagliate, che sembrano in grado di individuare con maggiore precisione e affidabilità il contenuto dei cluster. Presso la FUB, inoltre, si sta studiando e sperimentando l applicazione del paradigma di ricerca basato su clustering dei risultati nello scenario mobile, perché l interfaccia di ricerca standard può essere particolarmente inefficace per dispositivi con schermo ridotto e funzionalità limitate di input/output. Abbiamo verificato che l adozione di un motore di clustering su un palmare o un cellulare sembra in grado di ridurre la durata della sessione e di ampliare la gamma delle ricerche effettuate dall utente. KeySRC è stato sviluppato anche come applicazione iphone (vedi Figura 8). Carpineto C., Mizzaro S., Romano G., Snidero M. (2009) Mobile Information Retrieval with Search Results Clustering: Prototypes and evaluations. J. Am. Soc. Inf. Sci. Tec. (JASIST), 60(5), pp Carpineto C., Osinski S., Romano G., Weiss G. (2009) A Survey of Web Clustering engines In publication in ACM Computing Surveys. analisi delle opinioni In FUB è stato sviluppato un metodo per costruire automaticamente un dizionario di termini pesati con il loro contenuto di opinione, in un dominio di interesse assegnato. L idea è di ricondurre il contenuto di opinione al differente comportamento che un termine ha nei documenti che esprimono opinioni e nei documenti generici. In pratica, viene misurata la divergenza fra la distribuzione di probabilità dei termini presenti in documenti con opinioni e la distribuzione di probabilità dei termini presenti in documenti generici, assegnando punteggi elevati ai termini che contribuiscono maggiormente a detta divergenza. G. Amati1, e. Ambrosi, M. Bianchi, C. Gaibisso, G. Gambosi, Automatic construction of an opinion-term vocabulary for ad hoc retrieval, in Proceedings of european Conference on Information Retrieval, ecir, LNC 4956, pp ,. Claudio Carpineto, Giambattista Amati, Andrea Bernardini, Raffaele Nicolussi, Giovanni Romano Fondazione Ugo Bordoni 64 Iquadernidi

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Sistemi informazionali La crescente diffusione dei

Dettagli

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali

Text mining ed analisi di dati codificati in linguaggio naturale. Analisi esplorative di dati testuali Text mining ed analisi di dati codificati in linguaggio naturale Analisi esplorative di dati testuali Il text mining: una definizione Data mining per dati destrutturati ovvero documenti codificati in linguaggio

Dettagli

Data mining e rischi aziendali

Data mining e rischi aziendali Data mining e rischi aziendali Antonella Ferrari La piramide delle componenti di un ambiente di Bi Decision maker La decisione migliore Decisioni Ottimizzazione Scelta tra alternative Modelli di apprendimento

Dettagli

Modelli matematici avanzati per l azienda a.a. 2010-2011

Modelli matematici avanzati per l azienda a.a. 2010-2011 Modelli matematici avanzati per l azienda a.a. 2010-2011 Docente: Pasquale L. De Angelis deangelis@uniparthenope.it tel. 081 5474557 http://www.economia.uniparthenope.it/siti_docenti P.L.DeAngelis Modelli

Dettagli

Indice dei contenuti

Indice dei contenuti Gesttiione Knowlledge Base Serrviiziio dii Conttactt Centterr 055055 Manualle dii consullttaziione Indice dei contenuti 1. Introduzione... 4 2. Modalità di accesso alle informazioni... 5 2.1. Accesso diretto

Dettagli

SISTEMI INFORMATIVI AZIENDALI

SISTEMI INFORMATIVI AZIENDALI SISTEMI INFORMATIVI AZIENDALI Prof. Andrea Borghesan venus.unive.it/borg borg@unive.it Ricevimento: Alla fine di ogni lezione Modalità esame: scritto 1 Data Mining. Introduzione La crescente popolarità

Dettagli

LAVORO DI GRUPPO. Caratteristiche dei gruppi di lavoro transnazionali

LAVORO DI GRUPPO. Caratteristiche dei gruppi di lavoro transnazionali LAVORO DI GRUPPO Caratteristiche dei gruppi di lavoro transnazionali Esistono molti manuali e teorie sulla costituzione di gruppi e sull efficacia del lavoro di gruppo. Un coordinatore dovrebbe tenere

Dettagli

Marzo 2014. OrphaNews Italia Questionario di Gradimento. www.orpha.net/actor/cgi-bin/oahome.php?ltr=italianews

Marzo 2014. OrphaNews Italia Questionario di Gradimento. www.orpha.net/actor/cgi-bin/oahome.php?ltr=italianews Marzo 2014 OrphaNews Italia Questionario di Gradimento www.orpha.net/actor/cgi-bin/oahome.php?ltr=italianews Indice Introduzione... 3 Metodologia... 3 Conclusioni... 14 Ringraziamenti... 15 Questionario

Dettagli

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE

MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE MANUALE UTENTE DELLA BIBLIOTECA VIRTUALE Il sistema di ricerca della biblioteca virtuale permette di accedere in maniera rapida ai materiali didattici di interesse degli studenti presenti all interno del

Dettagli

SPORTLANDIA TRADATE Cookie Policy

SPORTLANDIA TRADATE Cookie Policy SPORTLANDIA TRADATE Cookie Policy Informativa Privacy (art.13 D.Lgs. 196/2003): i dati che i partecipanti al Blog conferiscono all atto della loro iscrizione sono limitati all indirizzo e-mail e sono obbligatori

Dettagli

Analisi delle opinioni dei clienti in ambito automotive: due casi studio

Analisi delle opinioni dei clienti in ambito automotive: due casi studio Analisi delle opinioni dei clienti in ambito automotive: due casi studio Negli ultimi anni le decisioni strategiche o di business di un azienda si affidano sempre più alla tecnologia: nuovi strumenti di

Dettagli

Indagini statistiche attraverso i social networks

Indagini statistiche attraverso i social networks Indagini statistiche attraverso i social networks Agostino Di Ciaccio Dipartimento di Scienze Statistiche Università degli Studi di Roma "La Sapienza" SAS Campus 2012 1 Diffusione dei social networks Secondo

Dettagli

Intelligenza Artificiale

Intelligenza Artificiale Intelligenza Artificiale Anno accademico 2008-2009 Information Retrieval: Text Categorization Una definizione formale Sia D il dominio dei documenti Sia C = {c 1,,c C } un insieme di categorie predefinite

Dettagli

Data Mining e Analisi dei Dati

Data Mining e Analisi dei Dati e Analisi dei Dati Rosaria Lombardo Dipartimento di Economia, Seconda Università di Napoli La scienza che estrae utili informazioni da grandi databases è conosciuta come E una disciplina nuova che interseca

Dettagli

Feature Selection per la Classificazione

Feature Selection per la Classificazione 1 1 Dipartimento di Informatica e Sistemistica Sapienza Università di Roma Corso di Algoritmi di Classificazione e Reti Neurali 20/11/2009, Roma Outline Feature Selection per problemi di Classificazione

Dettagli

Università di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali

Università di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea Specialistica in Informatica (classe 23/S: Informatica) Corso di Laurea Specialistica in Tecnologie Informatiche (classe 23/S: Informatica)

Dettagli

MACHINE LEARNING e DATA MINING Introduzione. a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it

MACHINE LEARNING e DATA MINING Introduzione. a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it MACHINE LEARNING e DATA MINING Introduzione a.a.2015/16 Jessica Rosati jessica.rosati@poliba.it Apprendimento Automatico(i) Branca dell AI che si occupa di realizzare dispositivi artificiali capaci di

Dettagli

Informatica per le discipline umanistiche 2 lezione 12

Informatica per le discipline umanistiche 2 lezione 12 Informatica per le discipline umanistiche 2 lezione 12 Nella lezione precedente: In realtà non tutto il data mining è dettato dagli interessi economici (commercial) data mining Abbiamo visto risvolti commerciali

Dettagli

Come si cerca personale con LavoroTurismo.it

Come si cerca personale con LavoroTurismo.it Come si cerca personale con LavoroTurismo.it LavoroTurismo le offre un servizio qualificato e professionale che: 1. riduce al minimo il tempo necessario per la ricerca del personale; 2. evita telefonate

Dettagli

Uno standard per il processo KDD

Uno standard per il processo KDD Uno standard per il processo KDD Il modello CRISP-DM (Cross Industry Standard Process for Data Mining) è un prodotto neutrale definito da un consorzio di numerose società per la standardizzazione del processo

Dettagli

Introduzione all Information Retrieval

Introduzione all Information Retrieval Introduzione all Information Retrieval Argomenti della lezione Definizione di Information Retrieval. Information Retrieval vs Data Retrieval. Indicizzazione di collezioni e ricerca. Modelli per Information

Dettagli

Corso di Marketing Industriale

Corso di Marketing Industriale U N I V E R S I T A' D E G L I S T U D I D I B E R G A M O Facoltà di Ingegneria Corso di Marketing Industriale Prof Ferruccio Piazzoni ferruccio.piazzoni@unibg.it Le ricerche di mercato I Mktg-L21 Il

Dettagli

DESCRIZIONE DEL MODELLO DI CERTIFICAZIONE DELLE COMPETENZE

DESCRIZIONE DEL MODELLO DI CERTIFICAZIONE DELLE COMPETENZE ALLEGATO n.4 DESCRIZIONE DEL MODELLO DI CERTIFICAZIONE DELLE COMPETENZE La certificazione delle competenze chiave, delineate dal documento tecnico (http://www.pubblica.istruzione.it/normativa/2007/dm139_07.shtml)

Dettagli

online La situazione operativa. In ambito aziendale i processi decisionali richiedono assunzioni di responsabilità a vari LABORATORIO 1

online La situazione operativa. In ambito aziendale i processi decisionali richiedono assunzioni di responsabilità a vari LABORATORIO 1 LABORATORIO 1 Scelta tra preventivi per l acquisto di un impianto di Luca CAGLIERO Materie: Informatica, Matematica, Economia aziendale (Triennio IT) L attività da svolgere in laboratorio, di carattere

Dettagli

Analisi dei requisiti e casi d uso

Analisi dei requisiti e casi d uso Analisi dei requisiti e casi d uso Indice 1 Introduzione 2 1.1 Terminologia........................... 2 2 Modello del sistema 4 2.1 Requisiti hardware........................ 4 2.2 Requisiti software.........................

Dettagli

MASTER UNIVERSITARIO

MASTER UNIVERSITARIO MASTER UNIVERSITARIO Analisi Dati per la Business Intelligence In collaborazione con II edizione 2013/2014 Dipartimento di Culture, Politica e Società Dipartimento di Informatica gestito da aggiornato

Dettagli

SOCIAL NETWORK MANUALE OPERATIVO

SOCIAL NETWORK MANUALE OPERATIVO SOCIAL NETWORK MANUALE OPERATIVO 1 INTRODUZIONE I social media sono diventati uno strumento essenziale di comunicazione e marketing e vengono utilizzati da utenti di ogni fascia di età: dai teenager agli

Dettagli

Liceo Linguistico I.F.R.S. Marcelline. Curriculum di Matematica

Liceo Linguistico I.F.R.S. Marcelline. Curriculum di Matematica Liceo Linguistico I.F.R.S. Marcelline Curriculum di Matematica Introduzione La matematica nel nostro Liceo Linguistico ha come obiettivo quello di far acquisire allo studente saperi e competenze che lo

Dettagli

Influenza e uso dei social network per il messaggio politico. alessandro scartezzini

Influenza e uso dei social network per il messaggio politico. alessandro scartezzini Influenza e uso dei social network per il messaggio politico alessandro scartezzini CHI SONO http://www.linkedin.com/pub/alessandro-scartezzini/0/393/721 alessandro@webperformance.it - Dal 2010 fondatore

Dettagli

SOLUZIONE Web.Orders online

SOLUZIONE Web.Orders online SOLUZIONE Web.Orders online Gennaio 2005 1 INDICE SOLUZIONE Web.Orders online Introduzione Pag. 3 Obiettivi generali Pag. 4 Modulo di gestione sistema Pag. 5 Modulo di navigazione prodotti Pag. 7 Modulo

Dettagli

COME CATTURARE I MOMENTI CHE CONTANO: raggiungere le persone giuste con il messaggio giusto al momento giusto, ogni volta.

COME CATTURARE I MOMENTI CHE CONTANO: raggiungere le persone giuste con il messaggio giusto al momento giusto, ogni volta. COME CATTURARE I MOMENTI CHE CONTANO: raggiungere le persone giuste con il messaggio giusto al momento giusto, ogni volta. Parlare di sessione online è ormai obsoleto: oggi non si va più online, si vive

Dettagli

Le imprese Web Active in Italia

Le imprese Web Active in Italia Le imprese Web Active in Italia per settore di attività Introduzione p. 2 Obiettivo e variabili utilizzate p. 2 La classifica p. 4 Analizziamo i dati p. 5 Metodologia p. 9 1 Le imprese Web Active in Italia

Dettagli

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD

PDF created with pdffactory trial version www.pdffactory.com. Il processo di KDD Il processo di KDD Introduzione Crescita notevole degli strumenti e delle tecniche per generare e raccogliere dati (introduzione codici a barre, transazioni economiche tramite carta di credito, dati da

Dettagli

02 L Informatica oggi. Dott.ssa Ramona Congiu

02 L Informatica oggi. Dott.ssa Ramona Congiu 02 L Informatica oggi Dott.ssa Ramona Congiu 1 Introduzione all Informatica Dott.ssa Ramona Congiu 2 Che cos è l Informatica? Con il termine Informatica si indica l insieme dei processi e delle tecnologie

Dettagli

PROMUOVERSI MEDIANTE INTERNET di Riccardo Polesel. 1. Promuovere il vostro business: scrivere e gestire i contenuti online» 15

PROMUOVERSI MEDIANTE INTERNET di Riccardo Polesel. 1. Promuovere il vostro business: scrivere e gestire i contenuti online» 15 Indice Introduzione pag. 9 Ringraziamenti» 13 1. Promuovere il vostro business: scrivere e gestire i contenuti online» 15 1. I contenuti curati, interessanti e utili aiutano il business» 15 2. Le aziende

Dettagli

Privacy e motori di ricerca

Privacy e motori di ricerca E privacy 26 Firenze, 2 maggio Privacy e motori di ricerca La minaccia fantasma Claudio Agosti vecna@sikurezza.org http://www.sftpj.org Questo documento è distribuito sotto la licenza Gnu GPL 2 1 Copyright

Dettagli

La nuova voce del verbo CRM. La soluzione ideale per il marketing e le vendite. A WoltersKluwer Company

La nuova voce del verbo CRM. La soluzione ideale per il marketing e le vendite. A WoltersKluwer Company La nuova voce del verbo CRM La soluzione ideale per il marketing e le vendite A WoltersKluwer Company Player il cliente al centro della nostra attenzione. Player: la Soluzione per il successo nelle vendite,

Dettagli

Data Mining a.a. 2010-2011

Data Mining a.a. 2010-2011 Data Mining a.a. 2010-2011 Docente: mario.guarracino@cnr.it tel. 081 6139519 http://www.na.icar.cnr.it/~mariog Informazioni logistiche Orario delle lezioni A partire dall 19.10.2010, Martedì h: 09.50 16.00

Dettagli

Introduzione alla Progettazione per Componenti

Introduzione alla Progettazione per Componenti Introduzione alla Progettazione per Componenti Alessandro Martinelli 6 ottobre 2014 Obiettivo del Corso Il Progetto Software Reale Il Componente Software La Programmazione Ad Oggetti Fondamenti di Informatica

Dettagli

Obiettivo Principale: Spiegare come la stessa cosa possa essere realizzata in molti modi diversi e come, a volte, ci siano modi migliori di altri.

Obiettivo Principale: Spiegare come la stessa cosa possa essere realizzata in molti modi diversi e come, a volte, ci siano modi migliori di altri. 6 LEZIONE: Algoritmi Tempo della lezione: 45-60 Minuti. Tempo di preparazione: 10-25 Minuti (a seconda che tu abbia dei Tangram disponibili o debba tagliarli a mano) Obiettivo Principale: Spiegare come

Dettagli

Company Overview. Settembre 2015 www.pangeaformazione.it

Company Overview. Settembre 2015 www.pangeaformazione.it Company Overview Settembre 2015 www.pangeaformazione.it Chi siamo! L azienda Siamo specializzati nella progettazione di modelli statistico-matematici a supporto delle decisioni strategiche, fornendo anche

Dettagli

Collaborazione: gli entusiasti ed i ritardatari

Collaborazione: gli entusiasti ed i ritardatari Collaborazione: gli entusiasti ed i ritardatari Obiettivi di apprendimento Sono sempre di più le aziende interessate ad approfondire la conoscenza degli strumenti di collaborazione per migliorare la propria

Dettagli

INDICE. 1. Agenzia di viaggi leader nel Sud Europa

INDICE. 1. Agenzia di viaggi leader nel Sud Europa INDICE 1. Agenzia di viaggi leader nel Sud Europa 2. Una storia di successo 3. Valori che fanno la differenza Prezzo Servizio clienti Sicurezza degli acquisti Facilità e flessibilità Innovazione e tecnologia

Dettagli

MASTER UNIVERSITARIO. Analisi Dati per la Business Intelligence e Data Science. IV edizione 2015/2016

MASTER UNIVERSITARIO. Analisi Dati per la Business Intelligence e Data Science. IV edizione 2015/2016 MASTER UNIVERSITARIO Analisi Dati per la Business Intelligence e Data Science In collaborazione con IV edizione 2015/2016 Dipartimento di Culture, Politica e Società Dipartimento di Informatica Dipartimento

Dettagli

COME AVERE SUCCESSO SUL WEB?

COME AVERE SUCCESSO SUL WEB? Registro 1 COME AVERE SUCCESSO SUL WEB? Guida pratica per muovere con successo i primi passi nel web INTRODUZIONE INDEX 3 6 9 L importanza di avere un dominio e gli obiettivi di quest opera Come è cambiato

Dettagli

-Possibilità di svolgere le attività commerciali per via elettronica, in particolare tramite Internet.

-Possibilità di svolgere le attività commerciali per via elettronica, in particolare tramite Internet. COMMERCIO ELETTRONICO -Possibilità di svolgere le attività commerciali per via elettronica, in particolare tramite Internet. -Un qualsiasi tipo di transazione tendente a vendere o acquistare un prodotto

Dettagli

Abstract. Paolo Rocca Comite Mascambruno 1

Abstract. Paolo Rocca Comite Mascambruno 1 Paolo Rocca Comite Mascambruno 1 Abstract La progressiva diffusione dei social network, sia generalisti (quali Twitter, Facebook o Google+, la recente piattaforma messa a punto da Google) sia specializzati

Dettagli

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario

Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Progetto ASTREA WP2: Sistema informativo per il monitoraggio del sistema giudiziario Nell ambito di questa attività è in fase di realizzazione un applicativo che metterà a disposizione dei policy makers,

Dettagli

ISTITUTO COMPRENSIVO 3 VICENZA DIPARTIMENTO DI MATEMATICA SCIENZE - TECNOLOGIA CURRICOLO D MATEMATICA - SCUOLA PRIMARIA

ISTITUTO COMPRENSIVO 3 VICENZA DIPARTIMENTO DI MATEMATICA SCIENZE - TECNOLOGIA CURRICOLO D MATEMATICA - SCUOLA PRIMARIA ISTITUTO COMPRENSIVO 3 VICENZA DIPARTIMENTO DI MATEMATICA SCIENZE - TECNOLOGIA CURRICOLO D MATEMATICA - SCUOLA PRIMARIA Fine classe terza COMPETENZE CHIAVE EUROPEE Competenza matematicoscientifica COMPETENZE

Dettagli

Introduzione alle basi di dati (prima parte)

Introduzione alle basi di dati (prima parte) Introduzione alle basi di dati (prima parte) Università degli Studi di Salerno Corso di Laurea in Scienze della Comunicazione Informatica generale (matr. Dispari) Docente: Angela Peduto A.A. 2007/2008

Dettagli

Liceo Scientifico " C. CATTANEO " PIANO DI LAVORO DI INFORMATICA CLASSE 3 LSA SEZ. H

Liceo Scientifico  C. CATTANEO  PIANO DI LAVORO DI INFORMATICA CLASSE 3 LSA SEZ. H Liceo Scientifico " C. CATTANEO " PIANO DI LAVORO DI INFORMATICA CLASSE 3 LSA SEZ. H Sommario PIANO DI LAVORO DI INFORMATICA... 1 INDICAZIONI GENERALI... 2 PREREQUISITI... 2 CONOSCENZE, COMPETENZE E CAPACITA...

Dettagli

Tecniche di riconoscimento statistico

Tecniche di riconoscimento statistico Tecniche di riconoscimento statistico Applicazioni alla lettura automatica di testi (OCR) Parte 8 Support Vector Machines Ennio Ottaviani On AIR srl ennio.ottaviani@onairweb.com http://www.onairweb.com/corsopr

Dettagli

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA

AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA AREA MATEMATICO-SCIENTIFICO-TECNOLOGICA MATEMATICA TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA SECONDARIA DI PRIMO GRADO. L alunno ha rafforzato un atteggiamento positivo rispetto

Dettagli

Sezione: 10. RIEPILOGO E COSTI DELLA PIATTAFORMA

Sezione: 10. RIEPILOGO E COSTI DELLA PIATTAFORMA Scopri come Creare e Vendere viaggi online! Sezione: 10. RIEPILOGO E COSTI DELLA PIATTAFORMA Tutto ciò che ti serve e quanto devi investire per cominciare Ricapitoliamo quali sono gli strumenti e le risorse

Dettagli

I sondaggi consentono la realizzazione di strategie di marketing, promozione e PR, consapevoli e mirate. LORENZA MIGLIORATO - CONSULENTE

I sondaggi consentono la realizzazione di strategie di marketing, promozione e PR, consapevoli e mirate. LORENZA MIGLIORATO - CONSULENTE La comunicazione efficace - cioè quella qualità nella comunicazione che produce il risultato desiderato nell interlocutore prescelto - è il prodotto di un perfetto ed equilibrato mix di scientificità,

Dettagli

Verifica e Validazione del Simulatore

Verifica e Validazione del Simulatore Verifica e del Simulatore I 4 passi principali del processo simulativo Formulare ed analizzare il problema Sviluppare il Modello del Sistema Raccolta e/o Stima dati per caratterizzare l uso del Modello

Dettagli

LE STRATEGIE DI INTERNAZIONALIZZAZIONE

LE STRATEGIE DI INTERNAZIONALIZZAZIONE LE STRATEGIE DI INTERNAZIONALIZZAZIONE Prof. Fabio Musso Università degli Studi di Urbino Facoltà di Economia fabio.musso@uniurb.it pagina 1 Fasi del processo di sviluppo della strategia di internazionalizzazione

Dettagli

AREA MARKETING E COMUNICAZIONE

AREA MARKETING E COMUNICAZIONE AREA MARKETING E COMUNICAZIONE Si tratta di un area particolarmente centrale del nostro settore, che punta a sviluppare le capacità comunicative e le tecniche di marketing (anche quelle non convenzionali),

Dettagli

GESTIONE VIRTUALE DELLO STUDIO LEGALE. Intervento dell Avv. Gerardina Abbondandolo. La telematizzazione del processo civile, tra i suoi mille limiti e

GESTIONE VIRTUALE DELLO STUDIO LEGALE. Intervento dell Avv. Gerardina Abbondandolo. La telematizzazione del processo civile, tra i suoi mille limiti e GESTIONE VIRTUALE DELLO STUDIO LEGALE Intervento dell Avv. Gerardina Abbondandolo La telematizzazione del processo civile, tra i suoi mille limiti e difficoltà, raccoglie però l occasione di modificare

Dettagli

Il Piano di comunicazione

Il Piano di comunicazione Il Piano di comunicazione 23 lezione 11 novembre 2011 Cosa è un piano di comunicazione Il piano di comunicazione è uno strumento utilizzato da un organizzazione per programmare le proprie azioni di comunicazione

Dettagli

Verifica acquisizione conoscenze. Pubblico: fornisce informazioni anche all esterno (diplomi, voti,...) Alla fine di un segmento di formazione

Verifica acquisizione conoscenze. Pubblico: fornisce informazioni anche all esterno (diplomi, voti,...) Alla fine di un segmento di formazione VALUTAZIONE SOMMATIVA VALUTAZIONE FORMATIVA Verifica acquisizione conoscenze Pubblico: fornisce informazioni anche all esterno (diplomi, voti,...) Alla fine di un segmento di formazione SCOPO CARATTERE

Dettagli

Restaurant Manager Academy

Restaurant Manager Academy Restaurant Manager Academy 1 La conoscenza non ha valore se non la metti in pratica L Accademia Un percorso formativo indispensabile per l attività di un imprenditore nel settore della ristorazione e dell

Dettagli

Compilazione Profilo Azienda Laboratorio (PAL) Domanda/Offerta

Compilazione Profilo Azienda Laboratorio (PAL) Domanda/Offerta Compilazione Profilo Azienda Laboratorio (PAL) Domanda/Offerta Come Iniziare: La compilazione del profilo online è utile per dare visibilità della propria azienda/laboratorio e per facilitare l incontro

Dettagli

VC-dimension: Esempio

VC-dimension: Esempio VC-dimension: Esempio Quale è la VC-dimension di. y b = 0 f() = 1 f() = 1 iperpiano 20? VC-dimension: Esempio Quale è la VC-dimension di? banale. Vediamo cosa succede con 2 punti: 21 VC-dimension: Esempio

Dettagli

E-learning. Struttura dei moduli formativi

E-learning. Struttura dei moduli formativi E-learning Per e-learning (o apprendimento on-line) s intende l uso delle tecnologie multimediali e di Internet per migliorare la qualità dell apprendimento facilitando l accesso alle risorse e ai servizi,

Dettagli

Alcune persone guardano le cose accadere. Altre fanno in modo che accadano!

Alcune persone guardano le cose accadere. Altre fanno in modo che accadano! 2013 Alcune persone guardano le cose accadere. Altre fanno in modo che accadano! Nel mondo economico dei nostri tempi, la maggior parte delle organizzazioni spende migliaia (se non milioni) di euro per

Dettagli

Standard minimi formativi nazionali delle competenze di base del terzo e quarto anno della Istruzione e Formazione Professionale

Standard minimi formativi nazionali delle competenze di base del terzo e quarto anno della Istruzione e Formazione Professionale Allegato 4 Standard minimi formativi nazionali delle competenze di base del terzo e quarto anno della Istruzione e Formazione Professionale L articolo 18, comma 2 del D.lgs. n. 226/2005 prevede, quale

Dettagli

ORIENTARE GLI ORIENTATORI. di Andrea Cammelli

ORIENTARE GLI ORIENTATORI. di Andrea Cammelli ORIENTARE GLI ORIENTATORI di Andrea Cammelli N egli ultimi anni abbiamo cominciato ad occuparci sempre più spesso di orientamento, portando la preziosa esperienza accumulata dal Consorzio Interuniversitario

Dettagli

SEO WEB. I nostri obiettivi: Fornire consulenza per quanto riguarda la visibilità e il marketing sul web alle aziende.

SEO WEB. I nostri obiettivi: Fornire consulenza per quanto riguarda la visibilità e il marketing sul web alle aziende. SEO WEB Seo Web Vi offre l'opportunità di realizzare un sito internet ben costruito, facilmente navigabile dagli utenti e visibile sui motori di ricerca. Un sito web deve essere uno strumento di lavoro

Dettagli

CRM Deduplica. Deduplica automatica anagrafiche Vers. 1.3.1.7

CRM Deduplica. Deduplica automatica anagrafiche Vers. 1.3.1.7 CRM Deduplica Deduplica automatica anagrafiche Vers. 1.3.1.7 8 maggio 2009 Rev. Maggio 2013 La presente pubblicazione ha lo scopo di illustrare, in modo generale, i principi operativi del gestionale applicativo.

Dettagli

monitoraggio media in tempo reale

monitoraggio media in tempo reale servizi evoluti monitoraggio media in tempo reale Una nuova soluzione web per conoscere e analizzare in tempo reale le news trasmesse da tutti i media Cerca qualsiasi argomento di tuo interesse politica,

Dettagli

Augure Influencers Ranking Tutto sulla metodologia AIR

Augure Influencers Ranking Tutto sulla metodologia AIR Augure Influencers Ranking Tutto sulla metodologia AIR V1.0 Ottobre 2014 Oualid Abderrazek Product Marketing Augure Influencers Ranking 2 Contents 1. Contesto...4 2. L algoritmo...4 a. Esposizione...5

Dettagli

Regressione non lineare con un modello neurale feedforward

Regressione non lineare con un modello neurale feedforward Reti Neurali Artificiali per lo studio del mercato Università degli studi di Brescia - Dipartimento di metodi quantitativi Marco Sandri (sandri.marco@gmail.com) Regressione non lineare con un modello neurale

Dettagli

Obiettivo Principale: Aiutare gli studenti a capire cos è la programmazione

Obiettivo Principale: Aiutare gli studenti a capire cos è la programmazione 4 LEZIONE: Programmazione su Carta a Quadretti Tempo della lezione: 45-60 Minuti. Tempo di preparazione: 10 Minuti Obiettivo Principale: Aiutare gli studenti a capire cos è la programmazione SOMMARIO:

Dettagli

Mining Positive and Negative Association Rules:

Mining Positive and Negative Association Rules: Mining Positive and Negative Association Rules: An Approach for Confined Rules Alessandro Boca Alessandro Cislaghi Premesse Le regole di associazione positive considerano solo gli item coinvolti in una

Dettagli

L insegnamento del Laboratorio di Fisica. Alcune considerazioni didattiche

L insegnamento del Laboratorio di Fisica. Alcune considerazioni didattiche L insegnamento del Laboratorio di Fisica Alcune considerazioni didattiche La Fisica nasce come scienza sperimentale, ma è spesso insegnata in modo soltanto teorico. Senza il supporto del laboratorio, si

Dettagli

Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi

Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi Estratto del capitolo 5 Edizione italiana a cura di Studio Pleiadi 1. Come funzionano i motori di ricerca Una panoramica generale sul funzionamento dei motori di ricerca risultati). 2. Come le persone

Dettagli

IL CAF DELLA CISL. Il posto giusto

IL CAF DELLA CISL. Il posto giusto Carta dei Servizi IL CAF DELLA CISL Il Caf Cisl opera per fornire ad iscritti, lavoratori e pensionati assistenza e consulenza completa e qualificata nel campo fiscale e delle agevolazioni sociali. Nato

Dettagli

TASTIERA COLORI&PAROLE (PER UNA COMUNICAZIONE AUMENTATIVA)

TASTIERA COLORI&PAROLE (PER UNA COMUNICAZIONE AUMENTATIVA) Modena, dicembre 2007 Presenta TASTIERA COLORI&PAROLE (PER UNA COMUNICAZIONE AUMENTATIVA) INTRODUZIONE...2 COME UTILIZZARE LA TASTIERA...5 DETTAGLI TASTIERE...7 1 INTRODUZIONE Assieme ad altre tastiere

Dettagli

Il calcolo su larga scala

Il calcolo su larga scala Il calcolo su larga scala Dall'analisi dei dati genetici all'analisi del web Luca Pireddu CRS4Distributed Computing Group October 13, 2011 luca.pireddu@crs4.it (CRS4) Il calcolo su larga scala October

Dettagli

Che cos è, dove si trova, e a cosa serve Internet? Possono sembrare domande banali, ma a pensarci bene la risposta non è tanto facile.

Che cos è, dove si trova, e a cosa serve Internet? Possono sembrare domande banali, ma a pensarci bene la risposta non è tanto facile. di Pier Francesco Piccolomini 1 Che cos è, dove si trova, e a cosa serve Internet? Possono sembrare domande banali, ma a pensarci bene la risposta non è tanto facile. Oggi attraverso questa gigantesca

Dettagli

INVALSI English Language Test

INVALSI English Language Test INVALSI English Language Test Rapporto scuola Scuola secondaria di primo grado Settembrini - Roma Pretest 2012 APPENDICE 1. Risultati dei singoli studenti Introduzione Questo rapporto presenta i risultati

Dettagli

1 Forum Internazionale sulla Regolazione dei Servizi Idrici e la Sostenibilità

1 Forum Internazionale sulla Regolazione dei Servizi Idrici e la Sostenibilità 1 Forum Internazionale sulla Regolazione dei Servizi Idrici e la Sostenibilità Roma, 21 Gennaio 2009 Palazzo Marini Sala delle Colonne Discorso di apertura, Luciano Baggiani Presidente ANEA Illustri ospiti,

Dettagli

PROGRAMMAZIONE ANNUALE IN BASE ALLE NUOVE INDICAZIONI PER IL CURRICOLO SCUOLA PRIMARIA

PROGRAMMAZIONE ANNUALE IN BASE ALLE NUOVE INDICAZIONI PER IL CURRICOLO SCUOLA PRIMARIA PROGRAMMAZIONE ANNUALE IN BASE ALLE NUOVE INDICAZIONI PER IL CURRICOLO SCUOLA PRIMARIA CLASSI PRIME ANNO SCOLASTICO 2013/2014 AREA SOVRADISCIPLINARE LINGUISTICO-ARTISTICO-ESPRESSIVA LINGUA ITALIANA Obiettivi

Dettagli

Massimi e minimi vincolati di funzioni in due variabili

Massimi e minimi vincolati di funzioni in due variabili Massimi e minimi vincolati di funzioni in due variabili I risultati principali della teoria dell ottimizzazione, il Teorema di Fermat in due variabili e il Test dell hessiana, si applicano esclusivamente

Dettagli

Il massimo dei risultati, con il minimo sforzo e nel minor tempo possibile! Creative Consulting

Il massimo dei risultati, con il minimo sforzo e nel minor tempo possibile! Creative Consulting Il massimo dei risultati, con il minimo sforzo e nel minor tempo possibile! Creative Consulting La maggior parte della nostra attività di consulenza ruota intorno a un Framework che abbiamo ideato e perfezionato

Dettagli

La soluzione al D.Lgs. 231/2001, distinguendosi. Network231 è un marchio registrato di LF ITALIA S.r.l. Piazza Quattro Novembre, 7 - Milano

La soluzione al D.Lgs. 231/2001, distinguendosi. Network231 è un marchio registrato di LF ITALIA S.r.l. Piazza Quattro Novembre, 7 - Milano La soluzione al D.Lgs. 231/2001, distinguendosi Il contesto legislativo Come noto, con il D.Lgs. 231/01, il Legislatore ha introdotto nell ordinamento italiano un regime di responsabilità diretta a carico

Dettagli

Vi siete mai chiesti quanta importanza hanno, nella comunicazione odierna, INTERNET e MOBILE?

Vi siete mai chiesti quanta importanza hanno, nella comunicazione odierna, INTERNET e MOBILE? Vi siete mai chiesti quanta importanza hanno, nella comunicazione odierna, INTERNET e MOBILE? SCHIARITEVI UN ATTIMO LE IDEE Ecco dei dati fondamentali Il mercato della comunicazione nel XX SECOLO Il mercato

Dettagli

Uso del browser, posta elettronica e motori di ricerca Gmail e Google

Uso del browser, posta elettronica e motori di ricerca Gmail e Google Facoltà di Lettere e Filosofia Cdl in Scienze dell Educazione A.A. 2010/2011 Informatica (Laboratorio) Uso del browser, posta elettronica e motori di ricerca Gmail e Google Author Kristian Reale Rev. 2011

Dettagli

IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE

IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE IDENTIFICAZIONE DEI BISOGNI DEL CLIENTE 51 Dichiarazione d intenti (mission statement) La dichiarazione d intenti ha il compito di stabilire degli obiettivi dal punto di vista del mercato, e in parte dal

Dettagli

ANNO SCOLASTICO 2014/2015. LICEO SCIENTIFICO STATALE A. VOLTA Via Juvarra, 14 - Torino

ANNO SCOLASTICO 2014/2015. LICEO SCIENTIFICO STATALE A. VOLTA Via Juvarra, 14 - Torino ANNO SCOLASTICO 2014/2015 LICEO SCIENTIFICO STATALE A. VOLTA Via Juvarra, 14 - Torino Obiettivi minimi Informatica Prime Conoscere il sistema di numerazione binaria e la sua importanza nella codifica delle

Dettagli

Introduzione ad OLAP (On-Line Analytical Processing)

Introduzione ad OLAP (On-Line Analytical Processing) Introduzione ad OLAP (On-Line Analytical Processing) Metodi e Modelli per il Supporto alle Decisioni 2002 Dipartimento di Informatica Sistemistica e Telematica (Dist) Il termine OLAP e l acronimo di On-Line

Dettagli

What you dream, is what you get.

What you dream, is what you get. What you dream, is what you get. mission MWWG si propone come punto di riferimento nella graduale costruzione di una immagine aziendale all'avanguardia. Guidiamo il cliente passo dopo passo nella creazione

Dettagli

STRUTTURA UDA U.D.A. 4. Classe III A PRESENTAZIONE

STRUTTURA UDA U.D.A. 4. Classe III A PRESENTAZIONE STRUTTURA UDA UNITÀ DIDATTICA di APPRENDIMENTO di TECNOLOGIE ELETTRICO-ELETTRONICHE E APPLICAZIONI U.D.A. 4 Classe III A.S. 2015/2016 TITOLO: Componenti fondamentali di un impianto Strumenti di misura

Dettagli

SCIENZE E TECNOLOGIA

SCIENZE E TECNOLOGIA SCIENZE E TECNOLOGIA COMPETENZE Dimostra conoscenze scientifico-tecnologiche che gli consentono di analizzare dati e fatti della realtà e di verificare l'attendibilità delle analisi quantitative e statistiche

Dettagli

SNAP Proposte e coupon personalizzati in tempo reale sui canali digitali

SNAP Proposte e coupon personalizzati in tempo reale sui canali digitali SNAP Proposte e coupon personalizzati in tempo reale sui canali digitali Canali e Core Banking Finanza Crediti Sistemi Direzionali Sistemi di pagamento e Monetica SNAP Proposte e coupon personalizzati

Dettagli

CRM DEDUPLICA. Deduplica e Normalizzazione dei clienti doppi... o simili. Validità: Settembre 2014

CRM DEDUPLICA. Deduplica e Normalizzazione dei clienti doppi... o simili. Validità: Settembre 2014 CRM DEDUPLICA Deduplica e Normalizzazione dei clienti doppi... o simili Validità: Settembre 2014 Questa pubblicazione è puramente informativa. SISECO non offre alcuna garanzia, esplicita od implicita,

Dettagli

BOZZA DEL 06/09/2011

BOZZA DEL 06/09/2011 ARTICOLAZIONE: INFORMATICA Disciplina: COMPLEMENTI DI MATEMATICA (C4) Il docente di Complementi di matematica concorre a far conseguire allo studente, al termine del percorso quinquennale, i seguenti risultati

Dettagli

Statistica 4038 (ver. 1.2)

Statistica 4038 (ver. 1.2) Statistica 4038 (ver. 1.2) Software didattico per l insegnamento della Statistica SERGIO VENTURINI, MAURIZIO POLI i Il presente software è utilizzato come supporto alla didattica nel corso di Statistica

Dettagli