Introduzione al Progetto NIR e ai suoi strumenti di sviluppo Costantino Ciampi ITTIG-CNR URL: http://www.ittig ittig.cnr.it e-mail: c.ciampi ciampi@ittig.cnr.it 1
Il progetto NIR Accesso alle Norme in Rete Ha come scopo quello di costituire un servizio di accesso unificato alla normativa pubblicata sui siti istituzionali italiani, con il concorso di tutti i soggetti aderenti al progetto. E il primo e più significativo esempio in Italia di cooperazione interistituzionale per l accesso alle norme tramite strumenti informatici 2
Obiettivi dichiarati E un portale specialistico (d (d interesse giuridico) cioè uno strumento (porta di accesso) per reperire in Internet i testi di legge e gli altri provvedimenti a carattere normativo, nonché tutte le altre informazioni di riferimento al servizio di: cittadini (per l esercizio l del diritto all informazione) pubblica amministrazione (per poter assolvere all obbligo di assicurare piena accessibilità alla documentazione giuridica prodotta) operatori del diritto gratuito E operativo un primo prototipo all indirizzo: http://www.normeinrete.it 3
I servizi del Portale Motore di ricerca specialistico Servizi informativi di vario genere: servizi al cittadino sezione links progetti di legge, atti di prossima pubblicazione, Gazzetta Ufficiale, glossari Altri servizi (forum, e-mail, e ecc.) 4
Peculiarità di NIR Nuovo servizio WEB di tipo portale per l informazione giuridica a distribuita da siti istituzionali / non è una nuova banca dati centralizzata Il motore NIR è di tipo specialistico : non indicizza il sito nella n sua interezza ma solo i documenti d interesse normativo / di qui l importanza dell analisi dei siti e delle istruzioni da dare al ragno di indicizzazione (files( NIR.TXT) Il Progetto NIR ha introdotto il concetto di strutturazione e metainformazione di base, comuni a tutti i documenti, per uniformare l informazione proveniente da diversi produttori e per permettere una ricerca avanzata modellata lata sulle esigenze dell operatore del diritto / di qui l importanza della creazione e aggiornamento del Catalogo delle norme Il Progetto NIR ha introdotto lo standard URN come metainformazione obbligatoria, per fornire identificatori univoci e persistenti delle risorse giuridiche presenti nella Rete; l adozione di questo standard e del software collegato (parser e risolutori) favorirà il reperimento e la navigazione fra i documenti giuridici Il Progetto NIR raccomanda l uso del linguaggio XML per la descrizione dei documenti giuridici e ha individuato alcuni modelli di strutturazione dei dati per la normativa italiana (DTD Document Type Definition) 5
Gli attori del Progetto Protagonisti principali: Ministero della Giustizia (promotore) (www.giustizia.it) AIPA - Autorità per l Informatica nella Pubblica Amministrazione (finanziatore e coordinatore) (www.cnipa.it) Partners scientifici e tecnologici: l'istituto di Teoria e Tecniche dell Informazione giuridica del CNR di Firenze (www.ittig.cnr.it) il Consorzio CINECA di Bologna (www.cineca.it) Amministrazioni aderenti al Progetto 6
Articolazione temporale e risorse del Progetto I Fase (maggio 1999 maggio 2000) Studio di fattibilità e realizzazione del sito sperimentale II Fase (dicembre 2000 novembre 2001) Studio di fattibilità, estensione della base documentale ed evoluzione qualitativa del Portale III Fase III Fase (anni 2002-2004) Affidamento a gestori esterni ed operatività piena del Portale (finaziamenti da AIPA + altri finanziamenti pubblici previsti dal Piano E-Government e dalle leggi finanziarie) 7
Strumenti per la ricerca Indice unificato delle raccolte normative presso un unico server centralizzato (problema della indicizzazione dei documenti di interesse) Catalogo delle norme centralizzato (strutturazione di base e metadati associati ai documenti) documenti) (esaurirà le sue funzioni con l adozione generale dello standard XML) 8
Indicizzazione dei documenti visita automatica e periodica di tutti i siti degli organismi istituzionali interessati dal Progetto per mezzo di uno spider (robot di navigazione), allo scopo di preparare un indice centralizzato (tecnologia spider engine) esame di come è pubblicato sul sito il materiale d interesse: individuando l eventuale sezione normativa ed in generale analizzando l albero del sito 9
Il file NIR.TXT NIR.TXT: file esterno non modifica il contenuto dei documenti sempre consultabili dal sito originario in grado di limitare l indicizzazione ai soli materiali pertinenti, ti, grazie ad apposite istruzioni per la navigazione dello spider (directory da visitare e documenti da indicizzare) il robot: visita periodicamente i siti in base al contenuto del NIR.TXT, controlla i file e preleva i nuovi documenti i file vengono mantenuti in un area temporanea per l indicizzazione del loro contenuto, e poi vengono cancellati il risultato di una ricerca rimanda direttamente alla URL originaria del documento, per la completa visualizzazione dei documenti 10
Esempio di file NIR.TXT #url:: http://www.giustizia.it it #ambito: nazionale #aut_emit emit: : Presidente della Repubblica e Parlamento #desc_materiale: Selezione di leggi in materie eterogenee #desc_ed_tel:: Corte Suprema di Cassazione - CED #id_t_mat:: NN #desc_t_mat:: Normativa nazionale Options: recurse, remove Fixup: run URL:http://www.giustizia.it it/cassazione/leggi/leggi. /cassazione/leggi/leggi.html Also: : http://www.giustizia.it it/cassazione/leggi99/ leggi99 Also: : http://www.giustizia.it it/cassazione/leggi2000/ leggi2000 Also: : http://www.giustizia.it it/cassazione/leggi2000/ leggi2001 Also: : http://www.giustizia.it it/cassazione/leggi2000/ leggi2002 Also: : http://www.giustizia.it it/cassazione/ /cassazione/serv-novita/ serv-novita Ignore: : delib1_97.html Ignore-RE: m/\bdis bdis_2.*. _2.*.html/ Ignore-RE: m/\b0.* b0.*html/ Ignore-RE: m/\bcodici bcodici\b/ b/ Ignore-RE: m/\baccordi baccordi\b/ b/ Fetch: : *.html Ignore: : * Ignore: : /*/*/*/*/*/*/*/ 11
Indicizzazione: casi particolari Recupero dei documenti giuridici contenuti in banche dati o reperibili con un motore di ricerca interno al sito (ad esempio il sito http://camera.mac mac.ancitel.it). Soluzione più semplice è stata ritenuta la predisposizione di una pagina HTML contenente una serie di queries,, atte a consentire di estrarre per blocchi tutto il materiale; Il sistema suddetto è tuttavia attuabile in certi casi solo con la collaborazione dei gestori dei relativi siti. 12
Catalogo delle Norme statali archivio contenente: gli estremi significativi la classificazione per materia la/e URL delle norme statali pubblicate in Gazzetta ufficiale dal 1948 ad oggi associa le informazioni ai documenti indicizzati fornisce informazioni utili anche per gli atti non presenti in rete contiene - inoltre - il nome uniforme (URN) 13
Titlex Guritel TITLEX2001.mdb CATALOGO NORME W3MIR AUTORITA EMITTENTE NATURA ATTO ARCHIVIO DEI FILES DI LOG DATA PROMULGAZIONE NUMERO UFF./non UFF/NIR TITOLO ATTO URL ESTREMI ATTO CLASSIFICAZIONE TITOLO ATTO VERSIONE AUTORITA EMITTENTE URL URN = NUMERO UF./non UFF/NIR URN 14
c. 46.000 docc. c. 90.000 docc. 15
Gli standard NIR Uso del linguaggio XML (extensible( Markup Language) ) e del modello di dati DTD (Data( Type Definition) ) definiti per la normativa NIR Definizione e uso delle URN (Uniform( Resource Names) ) per le risorse NIR 16
Il linguaggio XML e le DTD di NIR NIR adotta lo standard XML (extensible Markup Language) per la marcatura dei documenti principale esperienza in corso, in Italia, di cooperazione interistituzionale per l introduzione di questo standard nel settore normativo 17
Perché XML? XML è: un linguaggio di marcatura adeguato per rappresentare la struttura e le peculiarità dei documenti giuridici uno standard web 18
Motivi della scelta (1) costituisce terreno comune per: interventi a monte drafting normativo interventi a valle pubblicazione delle norme e progettazione di strumenti per accedere all informazione sugli atti normativi 19
Motivi della scelta (2) costituisce un supporto al consolidamento e alla codificazione permette la disponibilità della legge nel testo vigente agevola la rappresentazione delle relazioni con altri ordinamenti incrementa l usabilitl usabilità delle norme 20
Definizione della DTD nel GdL NIR lavoro teorico con la definizione di una DTD: generale valido per tutti gli atti normativi italiani utilizzabile da tutti i produttori di documenti elettronici contenenti testi normativi standard efficiente e universale grazie alle soluzioni adottate prima sperimentazione nella conversione del Sistema Italgiure. 21
Formazione su XML Considerando l importanza di XML per NIR, è stata svolta un intensa attività di formazione, anche con l aiuto di un prodotto didattico multimediale. Esempio di un frammento di legge marcato in XML (2 commi di un articolo) Esempio di un testo di legge marcato in XML con la DTD base 22
URN (Uniform Uniform Resource Name) standard che fornisce identificatori univoci e persistenti di risorse in rete, indipendenti dalla locazione fisica espressa dall indirizzo URL utile nel progetto per l accesso alle risorse giuridiche in rete Decreto legislativo 23 gennaio 2002, n. 10 urn:nir:stato:decreto.legislativo:2002-01-23;10 23
Standard URN (1) L URN diventa una delle metainformazioni di una risorsa Posizione: può essere inserita all interno della risorsa (formato XML o HTML) può rimanere esterna alla risorsa, ma ad essa correlata (in NIR si utilizza il Catalogo delle norme per associare l URN alla risorsa) 24
Standard URN (2) URN sostituisce URL, come valore dell attributo HREF, nel collegamento ipertestuale alla risorsa referenziata due modalità per l inserimento URN come valore di HREF: manuale automatico per mezzo di parser di riferimenti presenti in una risorsa 25
Standard URN (3) un sistema basato sui nomi uniformi deve prevedere: uno schema di assegnazione dei nomi capace di rappresentare in maniera univoca qualunque risorsa un meccanismo per la risoluzione da nome uniforme a locazione in rete delle risorse corrispondenti 26
Introduzione al Progetto NIR e ai suoi strumenti di sviluppo Fine presentazione continua URN 27