EVOLUZIONE VERSO LA MULTIMEDIALITA : SCENARI DI SERVIZIO ED ARCHITETTURE ABILITANTI F. Cerone - ERICSSON - Core Network, Multimedia and Messaging Sono Fabio Cerone e lavoro come Customer Solution Manager in Ericsson. Prima di cominciare la sessione specifica sulla multimedialità - vista l audience - vorrei spendere due parole su questo ruolo. Cosa fa un Customer Solution Manager? Si tratta essenzialmente di una figura dal profilo tecnico, che ha il ruolo di interfacciare il cliente, che in questo caso é l operatore - nel mio caso specifico Wind - per recepirne i requisiti e per proporgli delle soluzioni. Nella mia area, mi occupo di Core Network a pacchetto e di IMS. Essenzialmente si tratta di condividere con il cliente finale quelle che sono le prospettive evolutive, i servizi a cui l operatore pensa, essere propositivi in questo senso e quindi proporre quelle soluzioni che meglio aderiscano, sia da un punto di vista tecnico che commerciale, a quelle che sono le esigenze di business dell operatore. In questo processo bisogna sempre avere chiare due cose: da un lato avere una professionalità tecnica e una solida conoscenza di quelle che sono le architetture delle telecomunicazioni, dall altro avere in mente i valori che i servizi che proponiamo hanno rispetto all utente finale: perché infatti, come diceva il Collega di Yahoo! prima 1, queste sono cose che hanno successo se portano valore aggiunto agli utenti. Fatta questa premessa, nel corso di questo intervento affronteremo essenzialmente due temi: il primo é quello dell evoluzione verso la multimedialità, intesa essenzialmente come arricchimento della comunicazione person-to-person, cercando di avere un approccio più intuitivo possibile, quindi cercando di partire effettivamente dalle esigenze comunicative che intendiamo coprire con l architettura di cui parleremo, che é l IP Multimedia Subsystem, IMS. il secondo tema é un caso specifico, sul quale spenderò solo qualche parola, che é quello legato alla interoperatività, all inter-working tra domini tec nologici diversi: ci occuperemo di un caso specifico, quello della videotelefonata tra utente fisso ed utente mobile, ad esempio un utente che utilizza il suo pc con MS NetMeeting per videochiamare un utente con terminale UMTS.
Bene, per cominciare credo possa essere utile inquadrare le esigenze della multimedialità, quindi dell arricchimento della comunicazione person-to-person, all interno del percorso evolutivo degli ultimi 20-25 anni, essendo molto eseplificativi in questo senso - naturalmente é solo un punto di vista che vi porterò, ce ne potrebbero essere molti altri... E utile inquadrare questa evoluzione avendo in mente le due principali tipologie di comunicazione: la sfera della comunicazione person-to-person e la sfera della comunicazione person-to-content, incrociando queste due esigenze comunicative con le tecnologie che possono essere utilizzate per soddisfarle: tecnologie essenzialmente a banda stretta (narrow band) o tecnologie a banda larga. Diciamo che sino a tutti gli anni 80 eravamo in grado di utilizzare la sfera della comunicazione person-to-person (la chiamata voce, appunto): la tecnologia TDM, che ci ha assistiti in questo, é una tecnologia di rete intelligente per sviluppare servizi evolutivi. Tenete conto che ancora oggi la sfera person-toperson basata su questa tecnologia rappresenta il grosso delle revenues degli operatori, sia mobili che fissi. Il passaggio successivo é stato quello dell avvento di internet, essenzialmente negli anni 90: quindi rendere disponibili agli utenti finali dei contenuti, accessibili attraverso una connessione in dial-up (massimo 56 kb), quindi ancora narrow band, ma non più soltanto per parlarsi tra persone ma per andare a pescare dei contenuti in rete. Il passaggio successivo, a partire dal 2000, é stato poi quello di utilizzare nuove tecnologie, quindi da una parte su rete fissa il passaggio dalla connessione in dial-up alla connessione ADSL, e quindi ovviamente velocizzare l utente finale nell accedere ai contenuti; dall altro sul radiomobile abbiamo assistito ad un passaggio abbastanza epocale. Infatti, con l introduzione della tecnologia GPRS il telefonino, che prima era esclusivamente uno strumento per fare voce e mandare SMS, é diventato in effetti un device IP: quindi esso stesso diventa un oggetto per accedere a contenuti. Con l avvento dell UMTS aumenta la banda e aumentano le capacità dell interfaccia radio, che sono abilitanti senz altro a migliorare la fruizione dei servizi di person-tocontent; ma a questo punto ci si chiede se possono diventare anche abilitanti a
inventare qualcosa di nuovo nella comunicazione person-to-person. La risposta che é stata data é si, a patto però che si introduca nel dominio a pacchetto una tecnologia - l IMS - che gli garantisca meccanismi per fare il session control. Per fare cosa? Lo vediamo anche dal punto di vista intuitivo, da utente: quando con un telefonino dobbiamo comunicare con una persona, oggi ci troviamo di fronte ad una scelta: cosa fare? Chiamarla? Videotelefonarle? Mandarle un MMS? Mandarle un SMS? La sfida che vogliamo affrontare con questa scelta tecnologica é quella di vedere tutti questi servizi, che sono verticali e in alternativa uno all altro, come diversi media da poter combinare dinamicamente all interno di una sessione comunicativa. Quindi cosa può accadere? che io chiami qualcuno in voce, dopodoché decida di fotografare l ambiente in cui mi trovo, di condividerlo inviando l immagine e di commentarla; magari questa immagine può essere una mappa e posso voler condividere il percorso da seguire per raggiungere in certo posto. La sfida che vogliamo affrontare é dunque quella di arricchire la comunicazione person-to-person utilizzando quelli che attualmente sono dei servizi rigidamente verticali e separati, combinandoli dinamicamente all interno della stessa sesssione senza soluzione di continuità. A questo punto il telefonino diventa non più uno strumento di connessione uno-auno, per cui o faccio voce, o faccio videotelefonata, o faccio browsing su web, o mando MMS, ma piuttosto uno strumento che mette a disposizione innanzi a tutto degli abilitatori, come lo stato di presenza dei miei amici, dei gruppi che ho definito e la possibilità di interagire con queste persone cercando di riprodurre nel modo più fedele possibile la situazione in cui le persone si trovano a comunicare con visibilità, quindi n sostanza condividere i l ambiente circostante attraverso strumenti (che possono essere ad esempio la condivisione dell immagine) che arricchiscono la comunicazione. Arricchire la comunicazione person-to-person in questo senso significa ad esempio - mentre si sta decidendo (in comunicazione voce) di andare al cinema - la possibilità di scaricare il trailer del film che voglio vedere, condividerlo con l altra persona, guadarlo insieme a lei senza interrompere la comunicazione, discuterne e decidere. E chiaro che é uno shift notevole, sia dal punto di vista dell end-user, sia dal punto di vista tecnologico.
I vantaggi essenziali che porta sono due: introdurre un esperienza di comunicazione nuova, più ricca, da parte dell utente finale in una sfera che é quella centrale, quella della comunicazione person-to-person; quindi anche dal punto di vista del business, é lì che sta il grosso delle revenues, quindi sia dal punto di vista dei produttori di infrastrutture (Ericsson, Siemens, Nokia, Alcatel...), sia dal punto di vista degli operatori c é una particolare attenzione a questa sfera. per gli operatori, in particolare, avere uno strumento di questo tipo significa avere uno strumento completo di differenziazione - la differenziazione la potete vedere nelle offerte dei vari operatori: Vodafone live piuttosto che i-mode, piuttosto che i-tim: avere uno strumento del genere offre come unico limite la fantasia per capire quali possono essere i servizi a valore aggiunto di tipo person-to-person. Ad esempio possiamo riallacciarci a quello di cui parlava prima il Collega di Siemens 2, in cui l infrastruttura IMS viene utilizzata per inventare un nuovo paradigma comunicativo, un modo diverso di utilizzare il cellulare: ma il PoC é soltanto un esempio, ne vedremo in seguito un altro. Ciò detto, vediamo - senza scendere in dettagli tecnici - come si inquadra IP Multimedia Subsystem dal punto di vista architetturale. Partiamo da quella che é la struttura ormai universalmente accettata, a tre livelli: quindi uno strato di connettività, uno strato di controllo ed uno strato di applicazioni. Lo strato di controllo, a sua volta, un tempo - essenzialmente fino al 2000 - era soltanto dominio a circuito, dopodiché, con l introduzione del GPRS si é aggiunto questo ulteriore dominio, il dominio a pacchetto, che ad oggi é utilizzato per accedere a contenuti su internet. Introdurre IMS significa essenzialmente introdurre dei server, sia a livello di packet domain sia a livello di application layer, che portino la possibilità di controllare la sessione: quindi si é introdotto un protocollo che é il SIP, che permette di governare la sessione multimediale e quindi di fruire di quelle applicazioni e quei servizi la cui logica risiede nell ambito application layer. Pertanto, se vogliamo identificare all interno del dominio IP multimedia quelli che
sono i blocchi funzionali principali abbiamo l IMS delivery subsystem, che essenzialmente consiste degli application server, che implementano la logica del servizio: il PoC server ne é un esempio. Sotto la parte service delivery, quindi sotto la parte application server ci sono i server specifici, che servono uno a controllare la sessione (il CSCF, Session Control Subsystem di cui si parlava prima), un secondo (MRF, Media Handling Function) a controllare la parte di media, quindi essenziamente media-conferencing e media transponig e il terzo (HSS) la parte altrettanto fondamentale di gateway verso le reti preesistenti, che possono essere reti a circuito, la rete a banda larga di rete fissa ecc. Da un punto di vita end-to-end, quindi, come si colloca l IMS? Abbiamo in primo luogo la parte di accesso radio in cui l UMTS porta le maggiori novità, in termini di maggiore banda e di possibilità per uno stesso utente di attivare più RAB, quindi più risorse radio, per effettuare la comunicazione e i servizi di cui abbiamo parlato prima; dopodiché c é la parte core network che anche per l UMTS resta basata sulla parte SGSN e GGSN e dopo di questa c é la parte di core IMS, che abbiamo visto: contollo delle sessioni (CSCF) controllo del subscriber profile (HSS) controllo del media stream (MHF) Ora, per riprendere un po quello che diceva il collega di STS, l architettura di IMS per come é stata concepita può essere pensata come qualcosa che in teoria va a sostituire il dominio a circuito, perché ha un protocollo di session control, potenzialmente c è la possibilità di portare quindi anche servizi real-time su protocollo. In teoria, quindi, potrebbe essere utilizzata anche per sostituire il dominio a circuito, ma in realtà tale sostituzione presenta due grossi inconvenienti, uno di ordine economico e l altro di ordine tecnologico: non ha molto senso, in termini economici, proporre agli operatori di migrare tutto il traffico voce, che oggi viene gestito - benissimo - attraverso il dominio a circuito, verso il dominio a pacchetto. portare servizi real-time di tipo conversational a pacchetto su interfaccia radio comporta comunque delle sfide tutt alto che banali da risolvere; tant è che ad oggi presso nessun costruttore si é definito un meccanismo per portare servizi conversa-
tional su pacchetto radio. Ciò non toglie però che l IMS, anche con l utilizzo parallelo del dominio a circuito e del dominio a pacchetto, può essere utilizzato per raggiungere l obiettivo che dicevamo prima, e cioé abilitare i servizi di tipo combinational. In che modo? Utilizzando la capacità dell UMTS di mettere a disposizione più RAB per la comunicazione: uno verrà quindi utilizzato sotto il dominio a circuito e servirà per effettuare la chiamata voce, mentre gli altri potranno essere utilizzati per accadere su dominio a pacchetto IMS ed effettuare gli altri servizi che verranno combinati alla chiamata voce o alla videotelefonata: quindi essenzialmente possibilità di condividere dei contenuti in real-time mentre ci si parla. Un esempio di questo é il c.d. combinational service, quindi passiamo dalla situazione attuale in cui io telefono, quindi faccio la tradizionale chiamata voce, oppure la videotelefonata, o PoC alla situazione in cui con il combinational service, quindi utilizzando da una parte il domino a circuito dandogli il ruolo per cui é nato, quindi conversational, e dall altra il dominio a pacchetto con l IMS per fare condivisione evoluta di immagini, di video, di games, raggiungiamo l obiettivo iniziale che ci eravamo dati, quello di abilitare un paradigma combinazionale, di arricchimento della comunicazione. Un esempio concreto potrebbe essere questo: abbiamo parlato di push-to-talk, ma perché non di push-to-watch (su cui peraltro è in atto una attività fervida in ambito di sperimentazione)? Come funzionerebbe il tutto? Mi trovo in chiamata voce; ad un certo punto decido che é necessario far vedere al mio interlocutore ciò di cui sto parlando, ad esempio perché non mi segue. A questo punto scatta push-to-watch - da un punto di vista tecnologico entra in gioco il dominio a pacchetto e l IMS che controlla la sessione - e otteniamo il risultato inedito di aver abilitato una comunicazione in cui io e il mio interlocutore oltre a parlarci, stiamo condividendo quello di cui parliamo. A questo punto, finita questa parte sulla centralità dell arricchimento del person-toperson come elemento giustificativo dell introduzione di questa architettura, concentriamoci per un attimo sull importanza dell IMS: perché é importante avere soluzioni che abilitano l interworking tra diversi strumenti tecnologici? Perché avere un mezzo di questo tipo consente di massimizzare la base d utenza che può utilizzare un certo servizio. La videotelefonata é un esempio: oggi é possibile videotelefonare su UMTS ma anche su rete fissa; ma applicando l interworking a queste due aree tecnologichecon un videogateway si ottiene una base d utenza potenziale
straordinariamente più ampia. Questo é un aspetto molto importante soprattutto per quanto riguarda il lancio di nuovi servizi: non a caso Tre, nel momento in cui ha lanciato la videotelefonia mobile-mobile, si é preoccupata di mettere in campo un dispositivo di questo genere che permette di fare videotelefonia anche verso fisso - in particolare verso gli utenti ADSL Tiscali. In questo caso la soluzione é stata proprio un videogateway di Ericsson. E chiaro che senza questa funzionalità di gateway sarebbe possibile videotelefonare soltanto da utente mobile ad utente mobile e da utente fisso ad utente fisso, invece con questo oggetto in mezzo é possibile abilitare la comunicazione tra le due reti. Molto velocemente, vediamo di cosa consta tecnologicamente questo apparato: abbiamo due domini, da un lato la parte mobile a circuito, con l utilizzo di un terminale 3G per fare videotelefonia; dall altro la broadband in rete fissa, essenzialmente ADSL. Per mettere in comunicazione queste due isole, quello che serve é un gateway verso la parte a circuito che faccia direct convertion, TDM da una parte ed IP dall altra e media transponig, quindi sia trasposizione video che audio, ed una parte di gateway o direttamente verso gli utenti finali (quindi interfacce tipo userto-network) oppure un interfaccia network-to-network. TUTTI I DIRITTI RISERVATI 2003/2004 ASSOCIAZIONE FRONTIERE DELLA COMUNICAZIONE UNIVERSINET NB: TESTO NON RIVISTO DALL AUTORE 1 P. Andreotti - Yahoo! Italia - user experience e usability verso la banda larga, intervento a questo stesso convegno. 2 A. Dell Arte - Siemens Mobile - PoC (Push-to-talk over Cellular): il servizio che trasforma il cellulare in un walkie-talkie, intervento a questo stesso convegno.