informatica di base per le discipline umanistiche
|
|
- Rossana Pellegrini
- 5 anni fa
- Visualizzazioni
Transcript
1 informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia
2 sesta lezione: la codifica del testo vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia
3 La codifica digitale del testo che tipo di rappresentazione digitale del testo?
4 Il testo e la sua organizzazione intestazione capitolo titolo testo
5 Il testo e la sua struttura linguistica sintagma nominale V andare pass. rem. 3 sing. frase relativa articolo indefinito femminile singolare stanza come luogo stanze = oggetto di riscaldare tutti = soggetto
6 il testo come sequenza di caratteri Le avventure di Pinocchio Capitolo I Come andò che Maestro Ciliegia, falegname, trovò un pezzo di legno, che piangeva e rideva come un bambino. C'era una volta... - Un re! - diranno subito i miei piccoli lettori. - No, ragazzi, avete sbagliato. C'era una volta un pezzo di legno. Non era un legno di lusso, ma un semplice pezzo da catasta, di quelli che d'inverno si mettono nelle stufe e nei caminetti per accendere il fuoco e per riscaldare le stanze. Non so come andasse, ma il fatto gli è che un bel giorno questo pezzo di legno capitò nella bottega di un vecchio falegname, il quale aveva nome mastr'antonio, se non che tutti lo chiamavano maestro Ciliegia, per via della punta del suo naso, che era sempre lustra e paonazza, come una ciliegia matura.
7 Il testo come sequenza di caratteri surrogato parziale del testo originario completa equivalenza solo dal punto di vista dei caratteri che lo compongono perdita di informazione l informazione implicitamente veicolata dalla formattazione del testo relativa a: le coordinate meta-testuali il nome dell autore, il titolo, ecc. la struttura e organizzazione testuale la suddivisione logica in sezioni, capitoli, paragrafi, ecc. nessun guadagno di informazione l informazione sulla struttura linguistica rimane implicita e nascosta (come nel testo originale)
8 livelli di codifica del testo codifica di basso livello (codifica di livello 0) riguarda la rappresentazione binaria della sequenza ordinata dei caratteri codifica di alto livello arricchisce il testo codificato al livello zero con informazione relativa a dimensioni strutturali organizzazione del testo in strutture macrotestuali articolazione del testo in strutture linguistiche La codifica di alto livello permette di rendere esplicita qualsiasi interpretazione, anche di tipo linguistico, si voglia associare al testo
9 il primo passo: il livello 0 Il testo come sequenza di caratteri dietro le quinte
10 la codifica di alto livello Il testo codificato al livello zero si presenta come un manoscritto in scriptio continua
11 dietro all analogia Trascrizione di un testo a partire da un manoscritto in scriptio continua Codifica digitale di alto livello del testo entrambe rendono esplicito ciò che è congetturale e implicito con lo scopo di guidare il lettore (umano vs computer) nell interpretazione del testo
12 La codifica di alto livello compito della codifica di alto livello: dare forma alla sequenza dei caratteri del testo rendendo esplicita l informazione che è veicolata attraverso convenzioni tipografiche, testuali e linguistiche: informazioni sull organizzazione del testo (parti, titoli, paragrafi) la conoscenza linguistica necessaria per la comprensione del testo (per es. la categoria grammaticale di ciascuna parola, o i costituenti sintattici in cui si articolano le frasi del testo) più in generale ogni interpretazione che si voglia affiancare al dato testuale tracciare sentieri di lettura all interno del testo rendere machine readable informazioni sul testo e tratti del testo che altrimenti non sarebbero elaborabili dal computer
13 i caratteri nel computer MAESTRO CILIEGIA A carattere 65 codice (decimale) del carattere codifica binaria del codice del carattere I computer elaborano internamente solo sequenze di bits (0,1)
14 i caratteri nel computer Repertorio di caratteri un insieme di caratteri (es. A, a,!, à, P, ecc.) i caratteri sono entità astratte, da non confondersi con il modo in cui sono realizzati graficamente (gliphs) a, a, a, a sono tutti lo stesso carattere a la stessa realizzazione grafica può corrispondere a caratteri diversi (es. A latino e A cirillico e A greco) Set di caratteri (codice) una tabella che definisce una corrispondenza biunivoca (1-a-1) tra un repertorio di caratteri e un insieme di numeri interi non negativi a ogni carattere è assegnato un codice numerico (punto di codice o code position) Codifica di caratteri algoritmo che determina come i codici dei caratteri sono rappresentati in sequenze di bits (bytes)
15 (torna alla lezione 3) Il codice ASCII Primo standard per l assegnazione di codici a caratteri (dal 1963) set di caratteri riconosciuto da tutti i computer conosciuto come ASCII Standard o ISO-646 Codifica 7 bits ciascun punto di codice è rappresentato con il numero binario corrispondente di 7 bits in realtà 1 byte = 8 bits di cui un bit non è usato per la codifica (bit di parità) 7 bits = 2 7 punti di codice = 128 caratteri rappresentati Sufficiente per rappresentare l inglese mancano i caratteri accentati, umlaut, ecc. per rappresentare altri alfabeti occidentali
16 ASCII standard
17 Il set di caratteri ISO-Latin-1 ISO-Latin-1 (ISO o ASCII esteso) unica estensione standard di ASCII 1 byte = 8 bits = 2 8 punti di codice = 256 caratteri rappresentati sufficiente per lingue europee occidentali (italiano, francese, ecc.) ASCII Standard Caratteri di controllo
18 La famiglia di caratteri ISO set di caratteri standardizzati da ISO (International Standard Organization) Codifica 1 byte = 256 caratteri rappresentati da ciascun set Soprainsiemi dei caratteri ASCII Standard punti di codice (parte comune) ASCII punti di codice codici di controllo (non corrispondono a caratteri grafici) punti di codice (parte variabile) caratteri aggiuntivi per greco, cirillico, lingue slave, arabo, ebraico, ecc. I set di ISO-8859 sono tutti reciprocamente incompatibili Punto di codice 232 ISO (Latin-1) = è ISO (greco moderno) = θ ISO-8859 non copre lingue come giapponese, cinese, ecc.
19 The Universal Character Set UNICODE (ISO-10646) Standard internazionale che permette di rappresentare qualsiasi tipo di carattere appartenente ai sistemi grafici esistenti lingue europee, asiatiche, arabo, ebraico, cirillico, ugaritico, ecc. basato su principi di composizione dinamica dei caratteri ç = c + Assegna un numero di codice univoco ad ogni carattere è = 232 θ = 952 Risolve i problemi di incompatibilità dei sistemi ISO-8859 estende l insieme dei caratteri supportati permette la realizzazione di documenti multilingui Unicode è un soprainsieme di ASCII
20 UNICODE Circa caratteri grafici rappresentati (Unicode v. 4.0) ma i punti di codice disponibili sono più di 1 milione!! Molteplici tipi di codifica: UCS-2, UCS-4, UTF-8, UTF-16, ecc. Codifica comune UTF-8 codifica di Unicode a lunghezza variabile che usa da 1 a 4 bytes per ogni carattere UTF-8 usa 1 byte per la codifica dei caratteri corrispondenti al set ASCII totale compatibilità con la codifica ASCII ( ma non con ISO-latin 1!!!)
21 (torna alla lezione 3) UNICODE
22 la struttura di una parola a d r i a t i c o codice ASCII
23 ordinamento alfabetico ionio adriatico tirreno mediterraneo adriatico ionio mediterraneo tirreno
24 ordinamento alfabetico (II) a <? i a d <? o d r i a <? n i o min r i a t t i i c c o o la stringa che precede alfabeticamente è il risultato di una funzione di minino
25 diagramma di ordinamento inizializzazione lista non ordinata di N stringhe i = 0; NO i = N-1? SI lista ordinata test metti all i-esimo posto la stringa più piccola tra le ultime N-i stringhe istruzione i = i+1; (fai click per continuare)
26 passo di ordinamento k = i; inizializzazione incremento k = k+1; NO k = N? SI lista nuova test 1 istruzioni stringa i-esima < stringa k-esima? NO stringa temp = stringa i-esima; stringa i-esima = stringa k-esima; stringa k-esima = stringa temp; SI test 2 (fai click per continuare)
27 esempio ionio adriatico adriatico adriatico adriatico ionio tirreno tirreno tirreno mediterraneo mediterraneo mediterraneo i = 0 k = 1 stringa i-esima < stringa k-esima? NO stringa temp = stringa i-esima; stringa i-esima = stringa k-esima; stringa k-esima = stringa temp; temp = ionio stringa i-esima = stringa k-esima stringa k-esima = temp (fai click per continuare)
28 esempio ionio adriatico adriatico adriatico adriatico ionio tirreno tirreno tirreno mediterraneo mediterraneo mediterraneo i = 0 k = 2 stringa i-esima < stringa k-esima? NO stringa temp = stringa i-esima; stringa i-esima = stringa k-esima; stringa k-esima = stringa i-esima; SI NO temp ionio k = k+1 k = N? (fai click per continuare)
29 esempio ionio adriatico adriatico adriatico adriatico ionio tirreno tirreno tirreno mediterraneo mediterraneo mediterraneo i = 0 k = 3 stringa i-esima < stringa k-esima? NO stringa temp = stringa i-esima; stringa i-esima = stringa k-esima; stringa k-esima = stringa i-esima; SI NO esci temp ionio k = k+1 k = N? SI (fai click per continuare)
30 corpus, testo e unità testuali
31 definizioni corpus: collezione di testi tra loro collegati da alcune caratteristiche rilevanti rispetto a un obiettivo di studio o ricerca testo: elemento di base, tra le tanti possibili ripartizioni di un corpus, dotato di una sua omogeneità interna di contenuto o di stile unità testuale: frammento di testo individuato sulla base di unità macro-strutturali e linguistiche quali, ad esempio, il capitolo, il paragrafo o la frase
32 dati linguistici controllati fonte di dati primaria per la linguistica formale razionalista di derivazione chomskiana obiettivo dell indagine linguistica è ricostruire le conoscenze che i parlanti hanno della lingua indipendentemente dal modo in cui la usano i fenomeni tipici dell uso linguistico sono considerati rumore da cui è necessario fare astrazione limiti e problemi dei dati controllati le intuizioni dei parlanti non sono sempre chiare e distinte la ragazza che ci sono uscito ieri (???) la maggior parte di noi non leggono abbastanza (???) esperimenti in vitro eccessivo grado di idealizzazione e astrazione rispetto all uso effettivo del linguaggio
33 dati linguistici ecologici I corpora rappresentano fonti di dati linguistici ecologici, ovvero raccolti nei loro habitat naturali lingua scritta libri (saggistica, narrativa, poesia, ecc.), giornali, riviste, pagine Web, produzioni effimere ( , pubblicità, chat, volantini, ecc. lingua parlata (trascritta) notiziari radio-televisivi, conversazioni telefoniche, conversazioni facciaa-faccia, ecc.
34 tipologia ed uso principali usi dei corpora applicativo tipico dell ingegneria del linguaggio, per progettare strumenti: dotati di conoscenze linguistiche direttamente ricavate da dati rappresentativi di un certo dominio o varietà di linguaggio robusti e ben adattati al linguaggio reale analitico per fondare analisi e descrizioni linguistiche sull effettiva distribuzione delle costruzioni e fenomeni all interno di un linguaggio, al fine di valutare ipotesi teoriche sulla sua forma ed organizzazione
35 tipi di corpora corpus specialistico orientato alla descrizione di una particolare varietà del linguaggio (sublanguage) o ad un ristretto dominio applicativo analisi della terminologia biomedica, ecc. linguaggio infantile linguaggio sportivo, economico, ecc. linguaggio patologico corpus generale o di riferimento (reference corpus) trasversale rispetto alle diverse varietà di un linguaggio L plurifunzionale orientato a rappresentare tutti gli aspetti caratteristici di L, proponendosi come risorsa di riferimento per la descrizione di L può essere organizzato in vari sottocorpora specializzati per varietà di L
36 tipi di corpora corpus sincronico descrive un particolare stadio del linguaggio (i testi appartengono tutti ad una stessa finestra temporale) corpus diacronico descrive il mutamento linguistico (i testi appartengono a diverse finestre temporali) corpus monolingue contiene testi di una sola lingua corpus bi/plurilingue corpus parallelo lo stesso testo è rappresentato (in traduzione) in più di una lingua corpus allineato ciascuna frase (parola) della lingua L1 è esplicitamente collegata col suo traducente nella lingua L2 corpus comparabile testi in più lingue (non in traduzione) appartenenti alle stesse tipologie (ciascuna lingua è rappresentata da testi diversi)
37 tipi di corpora corpus di scritto solo testi di linguaggio scritto corpus di parlato solo trascrizioni di linguaggio parlato corpus misto testi scritti e trascrizioni di parlato (in proporzioni variabili) speech database campioni di linguaggio parlato in forma di segnale acustico (più eventualmente la trascrizione ortografica) corpus multimediale testi scritti, video, parlato in forma di segnato acustico, ecc.
38 dimensione del corpus corpus chiuso corpus standard tradizionale la quantità di testi e di parole è prefissata all inizio del progetto corpus statico : fotografa un particolare stadio linguistico corpus aperto (monitor corpus, Sinclair 1991) nuovi testi sono continuamente aggiunti alla collezione, secondo le proporzioni decise in fase progettuale corpus dinamico, ideale per studiare l evoluzione del linguaggio
39 british national corpus (BNC) Corpus del British English ( ) creato da un consorzio accademico (Oxford, Lancaster, ecc.) ed editoriale (Oxford University Press, Longman, ecc.) Dimensione: 100 milioni di parole Tratti caratteristici generale monolingue sincronico misto 90% testi scritti di vari generi 10% testi di parlato trascritto (conversazioni spontanee)
40 parole corpora multilingue comparabili per 14 lingue europee catalano, danese, finlandese, francese, francese belga, greco, inglese, irlandese, italiano, norvegese olandese, portoghese, svedese, tedesco tutti i corpora sono stati costruiti secondo criteri e specifiche uniformi PAROLE-Italiano ( ) realizzato presso l ILC-CNR (Pisa) Dimensione: 21 milioni di parole tratte da testi scritti di vari generi (libri, giornali periodici, miscellanee) attualmente portate a oltre 70 milioni tratti caratteristici generale sincronico (internamente) monolingue dex.htm
41 parole
42 corpora paralleli Canadian Hansard Corpus (2001) 1,3 milioni di frasi francesi-inglesi allineate a livello di frase, tratte dagli atti del Parlamento Canadese
43 corpora paralleli MULTEXT (1996) 5 milioni di parole dal Journal of European Community (francese, italiano, spagnolo, tedesco, inglese) parole allineate a livello di frase (inglese come lingua pivot )
44 sesta lezione la codifica del testo fine sesta lezione (lezione 7)
Linguistica Computazionale
Linguistica Computazionale La codifica digitale del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento di Linguistica
Dettagliinformatica di base per le discipline umanistiche
informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia quinta lezione: la matematica delle parole
DettagliLinguistica Computazionale
Linguistica Computazionale Codifica del testo digitale 30 settembre 2014 Strumenti e risorse per la linguistica computazionale Tre requisiti per la linguistica computazionale e NLP dati linguistici corpora
DettagliLinguistica Computazionale
Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento
DettagliLinguistica Computazionale
Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento
DettagliRappresentazione di dati: caratteri di testo. Appunti a cura del prof. Ing. Mario Catalano
Rappresentazione di dati: caratteri di testo Appunti a cura del prof. Ing. Mario Catalano Come si presenta un testo di un documento da un programma di videoscrittura Testo formattato Per migliorare la
DettagliAnalogico VS Digitale. Numeri e Testi
Analogico VS Digitale Numeri e Testi Il calcolatore: modello architetturale 1. Elaborazione Unità Centrale di Elaborazione Interconnessione 2. Memorizzazione Memoria RAM Hard Disk Collegamenti (BUS/Cavi)
DettagliIDUL Informazione su computer. Informazione su computer CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE.
IDUL 2011 RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE Due tipi di informazione: in forma ANALOGICA (continua) in forma DISCRETA (o simbolica)
DettagliLa codifica digitale dei testi. Daniela Trotta
La codifica digitale dei testi Daniela Trotta dtrotta@unisa.it The lexicographic data that are available in computer form as of today are the following: published dictionaries [ ], electronic dictionaries
Dettagli1.2d: La codifica Digitale dei caratteri
1.2d: La codifica Digitale dei caratteri 2 12 ott 2011 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 12 ott 2011 La codifica dei caratteri Un testo
Dettagli1.2d: La codifica Digitale dei caratteri
1.2d: La codifica Digitale dei caratteri 2 Bibliografia Curtin, 3.6 (vecchie edizioni) Curtin, 2.5 (nuova edizione) CR pag. 9-14 Questi lucidi 3 La codifica dei caratteri Un testo è rappresentato attraverso
DettagliLinguistica Computazionale Corpora
Linguistica Computazionale Corpora Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Ludici Adattati da Alessandro Lenci Dipartimento di Linguistica T. Bolelli Dati
DettagliLinguistica Computazionale Corpora
Linguistica Computazionale Corpora Salvatore Sorce Dipartimento dell Innovazione Industriale e Digitale Ingegneria Chimica Gestionale Informatica Meccanica Ludici Adattati da Alessandro Lenci Dipartimento
DettagliLa rappresentazione delle informazioni
Procedimento di codifica La rappresentazione delle informazioni Come il computer rappresenta le informazioni Il computer per lavorare sui dati, ha bisogno che questi siano espressi come sequenze di 1 e
DettagliModulo 1: Le I.C.T. UD 1.2d: La codifica Digitale dei caratteri
Modulo 1: Le I.C.T. : La codifica Digitale dei caratteri Prof. Alberto Postiglione Corso di Informatica Generale (AA 07-08) Corso di Laurea in Scienze della Comunicazione Università degli Studi di Salerno
DettagliIDUL 2011 CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE
IDUL 2011 RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE Due tipi di informazione: in forma ANALOGICA (continua) in forma DISCRETA (o simbolica)
DettagliLa rappresentazione dei caratteri
Università degli Studi dell Insubria Dipartimento di Scienze Teoriche e Applicate La rappresentazione dei caratteri Necessità della rappresentazione dei caratteri Un calcolatore che fosse unicamente in
DettagliLa codifica digitale del testo
La codifica digitale del testo Codifica digitale La codifica Il computer elabora esclusivamente numeri binari. Le informazioni per essere trattate ed elaborate dal computer devono essere prima trasformate
DettagliI set di caratteri WWW. Fabio Vitali 5 novembre 1999
I set di caratteri Fabio Vitali 5 novembre 1999 Introduzione Qui esaminiamo in breve: Il problema della codifica dei caratteri ASCII (7 bit ed esteso) ISO/IEC 10646 e UNICODE UCS e UTF 2 I set di caratteri
DettagliCODIFICA DI CARATTERI
CODIFICA DI CARATTERI Associando un simbolo dell alfabeto ad ogni numero possiamo codificare tutte le lettere Codifica ASCII (American Standard Code for Information Interchange): Caratteri speciali, punteggiatura,
DettagliLa linguistica dei corpora
La linguistica dei corpora 1 Argomenti trattati nella lezione: DEFINIZIONE ESEMPIO DI UTILIZZO COSTRUZIONE CODIFICA E ANNOTAZIONE STANDARD DI CODIFICA E ANNOTAZIONE ANALISI DI UN CORPUS LE APPLICAZIONI
DettagliLa rappresentazione delle informazioni
La rappresentazione delle informazioni In queste pagine cercheremo di capire come sia possibile rappresentare mediante numeri e memorizzare in un file testi, immagini, video, suoni... Il computer per lavorare
DettagliCalcolatori Elettronici I
Calcolatori Elettronici I Prof. Roberto Canonico Dipartimento di Ingegneria Elettrica e delle Tecnologie dell Informazione A.A. 2018-2019 1 Codice ASCII ASCII (American Standard Code for Information Interchange)
DettagliLa rappresentazione dell informazione. Capitolo 5 Fluency Conoscere e usare l informatica
La rappresentazione dell informazione Capitolo 5 Fluency Conoscere e usare l informatica Quanti sono? Nel mondo ci sono 10 tipi di persone quelli che capiscono il codice binario e quelli che non lo capiscono.
DettagliTabella dei codici ASCII standard
Tabella dei codici standard 0 00000000 0 nul 43 00101011 2B + 86 01010110 56 V 1 00000001 1 soh 44 00101100 2C, 87 01010111 57 W 2 00000010 2 stx 45 00101101 2D - 88 01011000 58 X 3 00000011 3 etx 46 00101110
DettagliIDUL /05/2013. Informazione su computer. Informazione su computer CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE
CONCETTI FONDAMENTALI INTRODOTTI IN QUESTA LEZIONE IDUL 2011 RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE Due tipi di informazione: in forma ANALOGICA (continua) in forma DISCRETA (o simbolica)
DettagliCODIFICA DI CARATTERI
CODIFICA DI CARATTERI Associando un simbolo dell alfabeto ad ogni numero possiamo codificare tutte le lettere Codifica ASCII (American Standard Code for Information Interchange): Caratteri speciali, punteggiatura,
Dettagli19/09/14. Il codice ASCII. Altri codici importanti. Extended ASCII. Tabella del codice ASCII a 7 bit. Prof. Daniele Gorla
Il codice ASCII ASCII è un acronimo per American Standard Code for Information Interchange Nato nell IBM nel 1961, diventa standard ISO (International Organization for Standardization) nel 1968. Codifica
DettagliLE AREE TRATTEGGIATE SONO I MARGINI DI UNA TABELLA WORD E SONO PURAMENTE INDICATIVI: CANCELLARE LE SCRITTE ED INSERIRE I CONTENUTI.
NOME: COGNOME: CLASSE: DATA: _ LE AREE TRATTEGGIATE SONO I MARGINI DI UNA TABELLA WORD E SONO PURAMENTE INDICATIVI: CANCELLARE LE SCRITTE ED INSERIRE I CONTENUTI. NOME: COGNOME: CLASSE: DATA: N O M
DettagliInformatica per le discipline umanistiche 2
Informatica per le discipline umanistiche 2 Rappresentazione dell informazione Rappresentazione dell informazione Informatica: studio sistematico degli algoritmi che descrivono e trasformano l informazione:
DettagliAnnotazione del testo
Università Ca Foscari di Venezia Linguistica Informatica Mod. 1 Anno Accademico 2010-2011 Annotazione del testo Rocco Tripodi rocco@unive.it Ricostruzione Filologia Ricostruire la forma originaria dei
DettagliIDUL 2010. Decidere orario per esercitazioni (con Doodle) Informazione su computer. Informazione su computer
Decidere orario per esercitazioni (con Doodle) IDUL 2010 RAPPRESENTAZIONE DELLE INFORMAZIONI IN FORMA DIGITALE Inizio: settimana del 12 per Bucchiarone; del 19 per Cavulli Esercitazione per i filosofi
DettagliLABORATORIO DI INFORMATICA
LABORATORIO DI INFORMATICA Corso di laurea in Scienze della Formazione Primaria a.a.2014/2015 A cura del Prof. Sergio Miranda 2 LEZIONE N.5 Codifica delle Informazioni LA CODIFICA DEI NUMERI Obiettivo:
DettagliCodifica dell Informazione
Francesco Folino CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati e istruzioni in un formato tale che l esecutore automatico
DettagliCodifica dei caratteri
Codifica dei caratteri Argomenti Codifica ASCII a 7-bit ( US-ASCII ) Codifiche ASCII estese ISO 8859-1 (Latin 1) Standard Unicode Codifica UTF-8 Codifica UTF-16 Codifica UTF-32 Prof. Marco Camurri 98 ASCII
DettagliRappresentazione dell informazione
Rappresentazione dell informazione Informatica@Matematica Simone Martini a.a. 2015-2016 1/21 Parte I Rappresentare l informazione 2/21 Omnia in... numero Unico tipo disponibile alla macchina fisica: parole
DettagliLa rappresentazione dell informazione
Fluency La rappresentazione dell informazione Capitolo 5 Quanti sono? Nel mondo ci sono 10 tipi di persone quelli che capiscono il codice binario e quelli che non lo capiscono. Simboli tasti del telefonino
DettagliUn quadro della situazione. Lezione 6 Aritmetica in virgola mobile (2) e Codifica dei caratteri. Dove siamo nel corso. Organizzazione della lezione
Un quadro della situazione Lezione 6 Aritmetica in virgola mobile (2) e Codifica dei caratteri Vittorio Scarano Architettura Corso di Laurea in Informatica Università degli Studi di Salerno Input/Output
DettagliCodifica dell Informazione
Introduzione all Informatica Fabrizio Angiulli Codifica dell Informazione CODIFICA DI DATI E ISTRUZIONI Algoritmi Istruzioni che operano su dati Per scrivere un programma è necessario rappresentare dati
DettagliSimboli, abbreviazioni e notazioni convenzionali... 21
Indice Premessa... 15 1. Per uno studio della sintassi marcata dell italiano dell uso medio... 15 2. Obiettivi della ricerca e contenuti del volume... 16 3. Nota sugli autori e ringraziamenti... 19 Simboli,
DettagliCorso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale
Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale Paolo Mereghetti DISCo Dipartimento di Informatica, Sistemistica e Comunicazione Rappresentazione dell Informazione Prima
DettagliArgomenti trattati. Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni
Argomenti trattati Informazione Codifica Tipo di un dato Rappresentazione dei numeri Rappresentazione dei caratteri e di altre informazioni Informazione mi dai il numero di Andrea? 0817651831 Il numero
DettagliSommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio (1) Linguaggio (2)
Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,
DettagliConcetti di base dell ICT
Informatica Linguaggio di programmazione Computer Bit Algoritmo Linguaggio macchina Informatica: Informazione automatica Gli anglosassoni usano il termine Computer Science = Scienza dei Calcolatori Computer:
DettagliPag. 1. La Rappresentazione e la Codifica delle informazioni (parte 2) Tipi di dati. Informatica Facoltà di Medicina Veterinaria
1 Università degli studi di Parma Dipartimento di Ingegneria dell Informazione Informatica a.a. 2012/13 Tipi di dati Informatica Facoltà di Medicina Veterinaria La Rappresentazione e la Codifica delle
DettagliProf. Maristella Agosti, Ing. Marco Dussin
Università degli Studi di Padova Facoltà di Lettere e Filosofia Progettazione di siti web (ING-INF/05) LMSGC, mutuato da LMLIN e Sc. Stat. a.a. 2010-11 Indice: Prof. Maristella Agosti, Ing. Marco Dussin
DettagliTecnologie per il web e lo sviluppo multimediale. Rappresentazione delle informazioni
Tecnologie per il web e lo sviluppo multimediale Rappresentazione delle informazioni Luca Pulina Corso di Laurea in Scienze della Comunicazione Università degli Studi di Sassari A.A. 2015/2016 Luca Pulina
DettagliRappresentazione e Codifica dell Informazione
Rappresentazione e Codifica dell Informazione Capitolo 1 Chianese, Moscato, Picariello, Alla scoperta dei fondamenti dell informatica un viaggio nel mondo dei BIT, Liguori editore. ***disclaimer *** Quest
DettagliLinguaggi, Traduttori e le Basi della Programmazione
Corso di Laurea in Ingegneria Civile Politecnico di Bari Sede di Foggia Fondamenti di Informatica Anno Accademico 2011/2012 docente: Prof. Ing. Michele Salvemini Sommario Il Linguaggio I Linguaggi di Linguaggi
DettagliGestione dei caratteri
AA 2012-2013 Tipi di variabili Caratteri 26 lettere maiuscole (A - Z) 26 lettere minuscole (a - z) 10 cifre (0-9) vari simboli: ( )!? \ & * % # $ lettere e simboli speciali, ad esempio á é ç Numeri naturali
DettagliHardware, software, codifica informazioni
1 LEZIONE 2 Hardware, software, codifica informazioni I DUE LIVELLI DELLE TECNOLOGIE INFORMATICHE (1/2) L hardware è la parte del computer che puoi prendere a calci; il software quella contro cui puoi
DettagliLinguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione
Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,
DettagliAnalogico vs digitale
Analogico vs digitale Informazione classificatoria e più che classificatoria Informazione classificatoria: è questo, ma avrebbe potuto essere quest altro altro. Informazione più che classificatoria: riconoscere
DettagliSistemi di elaborazione delle informazioni. Palmino Sacco
Sistemi di elaborazione delle informazioni Palmino Sacco www.radiologiasiena.it sacco@unisi.it LEZIONE 2 Il trattamento delle informazioni www.radiologiasiena.it sacco@unisi.it Nel 1833 un professore di
DettagliLez. 8 La Programmazione. Prof. Pasquale De Michele (Gruppo 2) e Raffaele Farina (Gruppo 1) 1
Lez. 8 La Programmazione Prof. Pasquale De Michele (Gruppo 2) e Raffaele Farina (Gruppo 1) 1 Dott. Pasquale De Michele Dott. Raffaele Farina Dipartimento di Matematica e Applicazioni Università di Napoli
Dettagliinformatica di base per le discipline umanistiche
informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia (per iniziare ) prima lezione introduzione:
DettagliLa rappresentazione dell informazione
La rappresentazione dell informazione Parte I Su questa parte vi fornirò dispense Sui testi di approfondimento: leggere dal Cap. del testo C (Console, Ribaudo):.,. fino a pg.6 La rappresentazione delle
DettagliLa Rappresentazione dell Informazione
La Rappresentazione dell Informazione Parte III I codici Codici a.a. 27-28 Un codice è una funzione che associa ad una sequenza di simboli un significato Codice : {entità} {sequenze di simboli} Un codice
DettagliIl concetto di informazione
Il concetto di informazione Qualunque informazione è definita tramite tre caratteristiche fondamentali: 1. Valore indica il particolare elemento assunto dall informazione 2. Tipo indica l insieme degli
DettagliIl quadro di riferimento delle prove di italiano del Servizio Nazionale di Valutazione
Mimma Siniscalco Il quadro di riferimento delle prove di italiano del Servizio Nazionale di Valutazione Palermo, 25 ottobre 2011 Senso Per chi costruisce la prova: permette di pianificare e guidare il
DettagliCodifica informazione testuale
Rappresentazione del: Codifica informazione testuale contenuto : successione di parole che costituiscono il documento Formato: modo in cui le parole sono organizzate e rappresentate graficamente. Può migliorare
DettagliInformatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno.
Trasferimento Ambiente esterno Controllo Informatica Mario Pavone - Dept. Mathematics & Computer Science - University of Catania mpavone@dmi.unict.it Rappresentazione dell Informazione L informazione viene
DettagliInformatica e Bioinformatica: Rappresentazione dell Informazione
Informatica e Bioinformatica: Rappresentazione dell Informazione Date TBD Sommario Il calcolatore è in grado di elaborare differenti tipi di informazione numeri, caratteri, immagini, suoni, video Informazione
DettagliInformazione e sua rappresentazione: codifica
Corso di Calcolatori Elettronici I Informazione e sua rappresentazione: codifica ing. Alessandro Cilardo Corso di Laurea in Ingegneria Biomedica Il concetto di informazione Qualunque informazione è definita
DettagliLa codifica binaria: concetti fondamentali
La codifica binaria: concetti fondamentali Ingegneria Meccanica e dei Materiali Università degli Studi di Brescia Prof. Massimiliano Giacomin ... Algoritmi, dati e risultati sono informazioni Informatica
DettagliI.4 Rappresentazione dell informazione
I.4 Rappresentazione dell informazione Università di Ferrara Dipartimento di Economia e Management Insegnamento di Informatica Ottobre 13, 2015 Argomenti Introduzione 1 Introduzione 2 3 L elaboratore Introduzione
Dettagliinformatica di base per le discipline umanistiche
informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia (per iniziare ) seconda lezione informazioni
DettagliSistemi di Elaborazione delle Informazioni 6 CFU
Università degli Studi di Palermo Dipartimento di Ingegneria Chimica, Gestionale, Informatica, Meccanica Sistemi di Elaborazione delle Informazioni 6 CFU Anno Accademico 2015/2016 Docente: ing. Salvatore
DettagliSommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio. Messaggio
Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio Messaggio Insieme di sequenze di simboli, le parole,
DettagliCorso di Informatica
CdLS in Odontoiatria e Protesi Dentarie Corso di Informatica Prof. Crescenzio Gallo crescenzio.gallo@unifg.it La Codifica 2 Informazioni Numeri Naturali Relativi Reali Testi Informazioni tradizionali Immagini
DettagliTeoria dell Informazione
Corso di Laurea Magistrale in Scienze dell Informazione Editoriale, Pubblica e Sociale Teoria dell Informazione Cosa è l informazione L informazione è qualcosa che si possiede e si può dare ad un altro
DettagliProgrammi e Oggetti Software
Corso di Laurea Ingegneria Civile Fondamenti di Informatica Dispensa 06 Programmi e Oggetti Software Marzo 2010 Programmi e Oggetti Software 1 Contenuti Cosa è un programma Cosa significa programmare Il
DettagliDefinizioni. Esempi di alfabeti
Definizioni SIMBOLO: entità minima significativa STRINGA: sequenza finita di simboli giustapposti (lunghezza della stringa, stringa vuota) ALFABETO: insieme finito di simboli LINGUAGGIO: insieme di stringhe
DettagliCaratteristiche di un linguaggio ad alto livello
Caratteristiche di un linguaggio ad alto livello Un linguaggio ad alto livello deve offrire degli strumenti per: rappresentare le informazioni di interesse dell algoritmo definire le istruzioni che costituiscono
DettagliLa codifica dell informazione
La codifica dell informazione Ci sono tipi di persone in questo mondo, quelli che capiscono il binario e quelli che non lo capiscono. Michael Gittelsohn (?!) Parte I Sui testi di approfondimento: leggere
DettagliRappresentazione della informazione
Rappresentazione della informazione Rappresentazione digitale dei dati Numeri interi Numeri reali Caratteri (C++: int) (C++ float e double) (C++ char) Memoria del calcolatore è finita L insieme dei numeri
DettagliLA CODIFICA DELL INFORMAZIONE. Prof. Enrico Terrone A. S: 2014/15
LA CODIFICA DELL INFORMAZIONE Prof. Enrico Terrone A. S: 2014/15 Lo schema di Tanenbaum Il livello al quale ci interessiamo in questa lezione è il linguaggio macchina, l unico dove le informazioni e istruzioni
DettagliLa rappresentazione delle Informazioni
La rappresentazione delle Informazioni Nella vita di tutti i giorni siamo abituati ad avere a che fare con vari tipi di informazioni, di natura e forma diversa, così come siamo abituati a diverse rappresentazioni
DettagliLinguistica dei corpora. Daniela Trotta
Linguistica dei corpora Daniela Trotta dtrotta@unisa.it Competenze del linguista computazionale 1. capacità di selezionare e raccogliere i dati linguistici 2. conoscenza di metodi formali 3. padronanza
DettagliRappresentazione digitale delle informazioni
Rappresentazione digitale delle informazioni Informazione oggi Informatica: disciplina che studia l elaborazione automatica di informazioni. Elaboratore: sistema per l elaborazione automatica delle informazioni.
DettagliLA CODIFICA DELL INFORMAZIONE
LA CODIFICA DELL INFORMAZIONE Prof. Enrico Terrone A. S: 20/2 Lo schema di Tanenbaum Il livello al quale ci interessiamo in questa lezione è il linguaggio macchina, l unico dove le informazioni e istruzioni
DettagliSistema di numerazione binario
Sistema di numerazione binario Liberamente tratto da: Wikipedia, l'enciclopedia libera http://www.lezionidimatematica.net/ Il sistema numerico binario è un sistema numerico posizionale in base 2. Posizionale
DettagliCodifica dell'informazione
Codifica dell'informazione Codifica di grandezze numeriche Sono stati i primi ad avere una rappresentazione in informatica Digitale contrapposto ad analogico Digitale = rappresentato con numeri o che opera
DettagliLez. 5 La Programmazione. Prof. Salvatore CUOMO
Lez. 5 La Programmazione Prof. Salvatore CUOMO 1 2 Programma di utilità: Bootstrap All accensione dell elaboratore (Bootsrap), parte l esecuzione del BIOS (Basic Input Output System), un programma residente
DettagliALGORITMI: PROPRIETÀ FONDAMENTALI
ALGORITMI: PROPRIETÀ FONDAMENTALI Non si può risolvere un problema senza prima fissare un insieme di azioni, i di mosse elementari possibili per l'esecutore. Bisogna conoscerne le caratteristiche, le mosse
DettagliArchitettura di un elaboratore. Rappresentazione dell informazione digitale
Architettura di un elaboratore Rappresentazione dell informazione digitale Rappresentazione dell informazione digitale L informatica è la scienza della rappresentazione e dell elaborazione dell informazione.
DettagliFondamenti di Informatica
Fondamenti di Informatica Introduzione al Digitale [Sez: 2.3, 2.4, 2.5] Prof. De Maio Carmen cdemaio@unisa.it Analogico/Digitale Segnale analogico - come un onda (es. sonora, luminosa) che trasporta informazioni,
DettagliProgrammi e Oggetti Software
Corso di Laurea Ingegneria Informatica Fondamenti di Informatica 1 Dispensa 2 Programmi e Oggetti Software Alfonso Miola Settembre 2007 http://www.dia.uniroma3.it/~java/fondinf1/ Programmi e Oggetti Software
DettagliInformatica. Mario Pavone - Dept. Mathematics & Computer Science - University of Catania. Trasferimento. Ambiente esterno.
Trasferimento Ambiente esterno Controllo Informatica Mario Pavone - Dept. Mathematics & Computer Science - University of Catania mpavone@dmi.unict.it Cos è l Informatica La scienza della rappresentazione
DettagliLa rappresentazione delle Informazioni
La rappresentazione delle Informazioni Nella vita di tutti i giorni siamo abituati ad avere a che fare con vari tipi di informazioni, di natura e forma diversa, così come siamo abituati a diverse rappresentazioni
DettagliLaboratorio di Informatica per chimica industriale e chimica applicata e ambientale
Laboratorio di Informatica per chimica industriale e chimica applicata e ambientale LEZIONE 10 Rappresentazione delle informazioni non numeriche 1 Rappresentazione delle informazioni Nella memoria del
DettagliCominciamo ad analizzare la rappresentazione delle informazioni... di Cassino. C. De Stefano Corso di Fondamenti di Informatica Università degli Studi
Un linguaggio ad alto livello deve offrire degli strumenti per: rappresentare le informazioni di interesse dell algoritmo definire le istruzioni che costituiscono l algoritmo Cominciamo ad analizzare la
DettagliIl concetto di calcolatore e di algoritmo
Il concetto di calcolatore e di algoritmo Elementi di Informatica e Programmazione Percorso di Preparazione agli Studi di Ingegneria Università degli Studi di Brescia Docente: Massimiliano Giacomin Informatica
Dettagli