I corpora. Annotazione, tagging, lemmatizzazione. Chiari, I Introduzione ai corpora 1

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "I corpora. Annotazione, tagging, lemmatizzazione. Chiari, I Introduzione ai corpora 1"

Transcript

1 I corpora Annotazione, tagging, lemmatizzazione 1

2 2 La codifica e l etichettatura dei corpora Standard di codifica e modalità di annotazione

3 3 L annotazione o etichettatura Etichettatura linguistica di un corpus è l aggiunta di informazioni di tipo linguistico (o meglio metalinguistico) alle diverse porzioni di un testo. L annotazione è una forma di codifica (esistono diversi tipi di annotazione non linguistica) L annotazione consiste nell attribuzione di una etichetta (tag o mark-up) a una porzione specifica e limitata di testo. Qualunque aspetto dell analisi linguistica può essere etichettato (fonologia e fonetica, morfologia, sintassi, semantica, pragmatica, testo, ecc.) linguaggio di marcatura (markup language) SGML (Standard Generalized Markup Language) XML (Extensible Markup Language) HTML (HyperText Markup Language)

4 Pratiche di annotazione 4 l annotazione morfo-sintattica, detta anche grammatical tagging o spesso POS (part-ofspeech) tagging. a ogni word token viene associata la relativa categoria grammaticale (nome, verbo, aggettivo, ecc.) Palla > N Tornò > V Disambiguazione per tutti quei casi in espressioni linguistiche che sono passibili di diverse letture (morfologiche, morfo-sintattiche, sintattiche e lessicali, ecc.) folle aggettivo maschile singolare (l uomo folle) oppure un sostantivo femminile plurale (le grandi folle) Omografi De Mauro (1994) riferisce per l italiano un tasso di omografi che varia dal 38% al 46%, rispettivamente in testi economico-finanziari e nella lingua parlata, ma stime diverse giungono per alcuni tipi testuali sino a circa 57%.

5 Metodi di annotazione 5 L annotazione manuale di tipo tradizionale è svolta da persone che appongono le specifiche etichette alle porzioni di testo sulla base di valutazioni metalinguistiche più o meno condivise e standardizzate. L annotazione automatica procede senza l intervento umano, attraverso applicazioni del Natural Language Processing basate su regole (rule-based parsing) oppure su sistemi probabilistici (statistical parsing) Annotazione semi-automatica I fase automatica II fase manuale

6 Gli standard di codifica e annotazione linguistica 6 Perché? necessità e l utilità della comparazione di corpora diversi usi dei corpora in ambito scientifico e commerciale Requisiti di standardizzazione separazione e autonomia del materiale grezzo del corpus dalle codifiche e annotazioni linguistiche esplicitazione di tutte le fasi di predisposizione, standardizzazione e annotazione del corpus in un file di documentazione forma standard per la codifica e l annotazione indicazione esplicita dei criteri di annotazione (regole di attribuzione di un etichetta a un token) neutralità e condivisione generale dei criteri linguistici alla base dell annotazione possibilità di eseguire specifiche ricerche sulle annotazioni l indipendenza della fruibilità del corpus e dell annotazione dagli specifici sistemi operativi e da costrizioni sulle caratteristiche dell hardware

7 Text Encoding Initiative (TEI) 7 consorzio nato ufficialmente nel 2000 anche se già operante a tutti gli effetti dal 1987 ACL Association for Computational Linguistics, ALLC Association for Literary and Linguistic Computing, ACH Association for Computers and the Humanities linee guida - TEI Guidelines per i principali problemi connessi alla codifica e all annotazione di corpora formato di marcatura dei documenti SGML codifiche di caratteri ISO 646 (a 7-bit), e Unicode Documenti «testi di ogni lingua, ogni tempo, ogni genere letterario o tipologia testuale, senza restrizioni su forma o contenuto» (Sperberg-McQueen e Burnard 2002)

8 Le etichette 8 È necessario segnalare l inizio e la fine della porzione testuale da marcare Marca di inizio (start tag): è un nome tra parentesi uncinate <name1> Marca di fine (end tag): è come la marca di inizio, preceduta dal segno / </name1> Paragrafo <p> xxyz yzzxx </p> Le marche possono anche essere annidate Tipologie di etichetta Obbligatorie Raccomandate Opzionali e infine: Personalizzate dall utente Il testo è suddiviso in unità testuali (dipendenti dal tipo di etichettatura che si intende effettuare)

9 Esempio di marcatura 9 <anthology> <poem><title>the SICK ROSE</title> <stanza> <line>o Rose thou art sick.</line> <line>the invisible worm,</line> <line>that flies in the night</line> <line>in the howling storm:</line> </stanza> <stanza> <line>has found out thy bed</line> <line>of crimson joy:</line> <line>and his dark secret love</line> <line>does thy life destroy.</line> </stanza> </poem> Da Sperberg-McQueen e Burnard, 2002: 2.3.2

10 DTD (SGML Document Type Definitions) tipo di documento 10 informazioni che descrivono la struttura di un documento appartenente a una data tipologia l individuazione di un insieme di etichette ammesse e di regole di attribuzione delle etichette ai fenomeni testuali definizioni per il corpo del testo (core) e definizioni per l intestazione (TEI header) insieme di etichette di base (base tag-set) TEI header Informazioni sul documento descrizione bibliografica del documento elettronico descrizione della codifica informazioni sulle eventuali correzioni, normalizzazioni, segmentazioni e interpretazioni note non bibliografiche situazione, ambiente, partecipanti, ecc.

11 Esempio di TEI header 11 <teiheader> <filedesc> <titlestmt> <title>thomas Paine: Common sense, a machine-readable transcript</title> <respstmt> <resp>compiled by</resp> <name>jon K Adams</name> </respstmt> </titlestmt> <publicationstmt> <distributor>oxford Text Archive</distributor> </publicationstmt> <sourcedesc> <bibl>the complete writings of Thomas Paine, collected and edited by Phillip S. Foner (New York, Citadel Press, 1945)</bibl> </sourcedesc> </filedesc> </teiheader> Da Sperberg-McQueen e Burnard, 2002: 5.6

12 Etichettatura del parlato 12 <text> quando è caratterizzata da una certa coerenza e coesione, ed è ininterrotta <u> (utterance) enunciato di testo delimitate da silenzi o da passaggi di turno <pause> pause di varia durata <vocal> elementi vocali non linguistici (come le pause piene, tipo ehm) <kinesic> elementi gestuali <event> eventi esterni

13 13 EAGLES Expert Advisory Group on Language Engineering Standards Unione europea annotazioni linguistiche per la descrizione di tutte le lingue appartenenti alla Ue Obiettivi codifica dei testi e annotazione linguistica elaborazione degli strumenti di analisi (software) con particolare attenzione la progettazione di corpora di parlato ottenere riusabilità, interscambiabilità ed estensibilità per corpora differenti

14 Tipologie di etichette di Eagles 14 Obbligatorie L etichettatura morfo-sintattica obbligatoria è quella per le categorie sintattiche (nome, verbo, avverbio, aggettivo, congiunzione), applicabile in modo uniforme al di là della lingua specifica del corpus. L insieme delle etichette è chiuso e definito, e costituito da 13 categorie. Raccomandate Livello di etichettatura raccomandata che riguarda caratteristiche grammaticali language-dependent (come genere, persona, ecc.). Anche in questo caso l insieme delle etichette è chiuso, ampio e distinto a seconda delle etichette obbligatorie di riferimento. Estensioni speciali Livello delle estensioni speciali che indica specifiche grammaticali tipiche di un numero ridotto di lingue europee, oppure annotazioni particolari introdotte a fini specifici. La classe delle etichette è aperta (ed estensibile a seconda dei bisogni di annotazione) (e.g. aspetto verbale, riflessività, ecc.)

15 Corpus Encoding Standard (CES) 15 Progetto conforme a TEI e Eagles Pensato per le elaborazioni del Natural Language Processing, della lessicografia e della traduzione automatica Elabora standard per: dati primari, ossia i corpora elettronici non annotati annotazione linguistica Etichette 1) raccomandazioni di livello metalinguistico; 2) etichette e raccomandazioni per la documentazione dei corpus; 3) etichette e raccomandazioni per l annotazione dei dati primari; 4) etichette e raccomandazioni per l annotazione linguistica

16 CES fasi di standardizzazione 16 Il metalinguaggio di annotazione (mark-up metalanguage) definisce la sintassi delle etichette. Livello sintattico Determina le etichette (tag names) e le regole sintattiche per il loro l uso Livello semantico Predispone le procedure di applicazione di una determinata etichetta a diversi fenomeni linguistici

17 17 Il tagging grammaticale Che cos è? Come funziona?

18 Tagging 18 il part-of-speech (POS) tagging ossia l etichettatura per categorie grammaticali Un tagger è il dispositivo computazionale che opera un POS tagging su materiale testuale. Il tagger riceve in input una frase e restituisce in output le forme grafiche delle parole accompagnate da etichette che segnalano la categoria grammaticale di appartenenza. Le etichette applicabili sono definite da un insieme detto tag-set

19 19 Tagging INPUT La rapidità dello stile e del pensiero vuol dire soprattutto agilità Processing POS TAGGER OUTPUT la: DET il rapidità: N rapidità dello: PRE del stile: N stile e: C e del: PRE del N pensiero significa: V significare soprattutto: AVV soprattutto agilità: N agilità

20 20 il tagger possiede un dizionario di riferimento che serve per individuare quali categorie grammaticali possono corrispondere a ciascuna forma grafica. Disambiguazione Una certa quantità di forme possiedono omografi (assoluti o testuali la prima forma grafica <LA> potrebbe corrispondere a tre etichettature grammaticali possibili: Determinante (articolo), Nome (nota musicale), Pronome (pronome personale). La disambiguazione permette di individuare la categoria appropriata allo specifico co-testo della frase

21 Tagger rule-based e probabilistici 21 Un tagger basato su regole fonda la sua capacità di attribuzione della categoria grammaticale sull accesso a una grammatica nella quale sono state formalizzate le regole di formazione dei diversi possibili sintagmi di una data lingua. I problemi principali di questo tipo di metodologia sono da una parte la complessità nella descrizione della grammatica necessaria, i tempi laboriosi, la necessità di avere in input solo frasi ben formate, e infine l impossibilità di risolvere ambiguità strutturali TAGGIT, adoperato negli anni Settanta per etichettare il Brown Corpus of Standard American English 77% delle occorrenze Un tagger di tipo probabilistico basato su statistiche di frequenza delle parti del discorso e delle loro sequenze. training corpora claws (Constituent Likelihood Automatic Word-tagging System) sul British National Corpus 96-97% delle occorrenze

22 Problemi e applicazioni dell NLP 22 Problemi L ambiguità sintattica il medico visita il paziente con gli occhiali. L ambiguità dei sensi Calcio omonimi assoluti: colpo dato con il piede, quando una parte di una pistola, e quando l elemento chimico) diverse accezioni della stessa parola: colpo e lo sport L ambiguità anaforica l uomo ha parlato alla ragazza del suo cane L input incompleto Applicazioni correttori ortografici e grammaticali, strumenti di etichettatura automatica dei corpora lemmatizzazione dei corpora, traduzione automatica basata su regole e probabilistica strumenti di riconoscimento vocale

23 23 Treetagger POS tagger (italiano e tante altre lingue)

24 Treetagger 24 Helmut Schmid in the TC project at the Institute for Computational Linguistics of the University of Stuttgart German, English, French, Italian, Dutch, Spanish, Bulgarian, Russian, Portuguese, Galician, Chinese, Swahili, Slovak, Latin, Estonian and old French texts PC-Linux, Mac OS-X (Intel-CPU), PC-Linux Treetagger web (italiano) Perugia

25 word pos lemma The DT the 25 Input e output Testo semplice (txt) The TreeTagger is easy to use. TreeTagger NP TreeTagger is VBZ be easy JJ easy to TO to use VB use. SENT. Testo anche pretrattato Output su tre colonne Forma POS lemma

26 26

27 output 27

28 Come è fatto un tagset 28

29 Lessico di riferimento Dizionario macchina 29 morsichiate VER:fin morsicare morsichin VER:fin morsicare morsichino VER:fin morsicare morsico VER:fin morsicare morsico' VER:fin morsicare morsicò VER:fin morsicare morsissima ADJ morso morsissime ADJ morso morsissimi ADJ morso morsissimo ADJ morso morso ADJ morso NOUN morso VER:ppast mordere morta ADJ mortonoun morta VER:ppast morire mortadella NOUN mortadella mortadelle NOUN mortadella mortai NOUN mortaio mortaio NOUN mortaio mortale ADJ mortale NOUN mortale mortali ADJ mortale NOUN mortale mortalissima ADJ mortale mortalissime ADJ mortale mortalissimi ADJ mortale mortalissimo ADJ mortale mortalita' NOUN mortalità mortalità NOUN mortalità mortalmente ADV:mente mortalmente

30 30 Passi 1. tokenizzazione del testo 2. confronto di ogni forma con quelle del Lessico di riferimento 3. ad ogni forma si associano le etichette di POS e il lemma

31 31 Operazioni su 3 casi 1. la forma esiste nel lessico e non è ambigua 2. la forma esiste nel lessico ed è ambigua 3. la forma non esiste nel lessico

32 32 Il training Addestramento il tagger viene addestrato attraverso un file di training corretto manualmente e quindi privo di errori Il training consiste nell estrazione dell informazione statistica relativa alle sequenze più probabili di etichette POS (bigrammi o trigrammi) Il training è in genere relativamente piccolo (fino a occorrenze) Il training non va bene per tutte le tipologie testuali

33 Principali implicazioni Non è possibile scegliere i separatori (vengono stabiliti da TreeTagger) La stessa forma grafica può presentarsi più volte nel vocabolario (governo N, governo V) Non esistono forme grammaticalmente ambigue (la lemmatizzazione è esaustiva) Non si può eseguire la normalizzazione

34 Limiti di TreeTagger TreeTagger non è in grado di effettuare alcun tipo di normalizzazione Ha capacità limitate nel riconoscimento dei nomi propri È in grado di effettuare lessicalizzazioni, ma non possiede alcuna risorsa propria di riferimento al riguardo (richiede un file da parte dellʼ utente) Non fornisce informazioni riguardo lʼ aspetto morfologico delle forme (persona, genere, tempo, modo ecc.)

35 La lemmatizzazione dei testi Operazione ridurre le forme flesse di uno stesso lessema a una forma di citazione (lemma) la lista di frequenza conterrà solo le diverse forme di citazione come entrate: essere, fare, libro, ecc. disambiguazione degli omografi Il DET:def il dottore NOM dottore mi PRO:pers mi raccomandò VER:remo raccomandare di PRE di non ADV non ostinarmi VER:infi ostinarsi a PRE a guardare VER:infi guardare tanto ADV tanto lontano ADJ lontano Chiari, I. (2007), Introduzione alla linguistica computazionale, Laterza, Bari.

36 Lemmatizzazione funzione mettere in evidenza la relazione lessicale tra le parole osservare i lessemi e non le forme testuali ostacoli omografi polirematiche collocazioni ambiguità sintattiche lemmatizzatori automatici strumenti che usano diverse tecniche (disambiguazione sintattica per regole o statistico-probabilistica) per distinguere le forme omografe e riconoscere la struttura sintattica della frase Chiari, I. (2007), Introduzione alla linguistica computazionale, Laterza, Bari.

37 Analisi degli usi con le concordanze Il cotesto informazioni linguistiche essenziali sugli usi della parola individuare sequenze di parole che occorrono più abitualmente a guisa di, restare con un palmo di naso, giacenza di cassa Le concordanze è la presentazione delle parole di un testo, con l indicazione della frequenza con la quale la parola occorre e il contesto linguistico precedente e successivo (co-testo). Funzioni osservare i diversi usi di una parola esaminare i diversi contesti (semantici, sintattici o testuali) in cui occorre una parola analizzare la regolarità con la quale una parola è accompagnata ad altre nel suo cotesto Chiari, I. (2007), Introduzione alla linguistica computazionale, Laterza, Bari.

38 Concordanza di anima nella Divina Commedia [In.1.122] anima fia a ciò più di me degna: [In.2.45] l'anima tua è da viltade offesa; [In.2.58] O anima cortese mantoana, [In.3.88] E tu che se' costì, anima viva, [In.3.127] Quinci non passa mai anima buona; [In.5.7] Dico che quando l'anima mal nata [In.6.55] E io anima trista non son sola, [In.10.15] che l'anima col corpo morta fanno. [In.12.74] saettando qual anima si svelle [In.12.90] non è ladron, né io anima fuia. [Pu.4.3] l'anima bene ad essa si raccoglie, [Pu.18.44] e l'anima non va con altro piede, Chiari, I. (2007), Introduzione alla linguistica computazionale, Laterza, Bari.

39 Presentazione delle concordanze KWIC (keyword in context) La parola chiave (keyword) è la parola di cui si cerca l uso, solitamente si trova nella colonna centrale. Il cotesto (precedente e successivo) è stabilito dall utente: n. fisso di parole (3 3, ecc.) frase o verso Concordanze complete concordanze per tutte le parole del corpus voluminose e lente, più complesse Concordanze specifiche concordanze per specifiche keyword veloci e facili Chiari, I. (2007), Introduzione alla linguistica computazionale, Laterza, Bari.

40 Esempio software di concordanza Chiari, I. (2007), Introduzione alla linguistica computazionale, Laterza, Bari.

41 Tipologie di ricerca per forma specifica (parola testuale, forma flessa) psicologico, si ottengono tutti i token di questo type per lemma psicologico (su corpus lemmatizzato) si ottengono tutte le occorrenze di tutte le forme flesse con l uso di caratteri jolly (wildcards) psicologic*, si ottengono tutte le forme flesse e tutti i derivati con le espressioni regolari psicologic[aoih]?, si ottengono tutte le forme che hanno uno dei caratteri tra parentesi [x] dopo la sequenza, più 0 o un carattere (esclude i derivati) Chiari, I. (2007), Introduzione alla linguistica computazionale, Laterza, Bari.

Concordanze e collocazioni. Analisi del testo letterario 1 Isabella Chiari

Concordanze e collocazioni. Analisi del testo letterario 1 Isabella Chiari Concordanze e collocazioni Analisi del testo letterario 1 Isabella Chiari 1 Analisi degli usi con le concordanze Il cotesto estrazione di informazioni linguistiche essenziali sugli usi della parola individuazione

Dettagli

Strumenti elementari: parte seconda

Strumenti elementari: parte seconda Strumenti elementari: parte seconda Concordanze e il calcolo delle collocazioni 1 Le concordanze Le concordanze permettono di valutare e visualizzare i cotesti delle parole Le concordanze, oltre alle informazioni

Dettagli

Linguistica dei corpora

Linguistica dei corpora Linguistica dei corpora Analisi del testo letterario 1 1 Elena Tognini Bonelli (2001) Linguistica e testi linguistica basata sui corpora (corpus-based) linguistica diretta dai corpora (corpus-driven) integrazione

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Trattamento Automatico della Lingua 24 novembre 2014 Tecnologie del linguaggio Sistemi in grado di accedere al contenuto di informazione attraverso l elaborazione automatica

Dettagli

Lingua, statistica e computazione

Lingua, statistica e computazione Lingua, statistica e computazione Isabella Chiari Facoltà di Scienze Umanistiche Università La Sapienza di Roma Roma, 25 novembre 2005 UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA DIPARTIMENTO DI MECCANICA

Dettagli

Fakulteta za humanistične študije Koper, Univerza na Primorskem, Capodistria, Slovenia, 5 aprile 2007 - Isabella Chiari CORPORA

Fakulteta za humanistične študije Koper, Univerza na Primorskem, Capodistria, Slovenia, 5 aprile 2007 - Isabella Chiari CORPORA Capodistria, Slovenia, 5 aprile 2007 - Isabella Chiari 1 LINGUISTICA DEI CORPORA Storia, metodi, problemi 2 Che cos è un corpus? definizioni 1 Corpus (plur. corpora) 3 definizioni «raccolta completa e

Dettagli

Annotazione del testo

Annotazione del testo Università Ca Foscari di Venezia Linguistica Informatica Mod. 1 Anno Accademico 2010-2011 Annotazione del testo Rocco Tripodi rocco@unive.it Ricostruzione Filologia Ricostruire la forma originaria dei

Dettagli

Sviluppo di Risorse Linguistiche per l Ambiente di Scrittura Assistita (ASA)

Sviluppo di Risorse Linguistiche per l Ambiente di Scrittura Assistita (ASA) Università degli Studi di Pisa Facoltà di Scienze Matematiche Fisiche e Naturali Corso di Laurea Triennale in Informatica Informatica e Linguistica Linguistica Sviluppo di Risorse Linguistiche per l Ambiente

Dettagli

LE CONCORDANZE. Gli spogli lessicali CONCORDANZE - 2. I caratteri jolly. Il formato KWIC 27/03/14. Parte seconda

LE CONCORDANZE. Gli spogli lessicali CONCORDANZE - 2. I caratteri jolly. Il formato KWIC 27/03/14. Parte seconda Lez. 8 Gli spogli lessicali Parte seconda 19/03/14 LE CONCORDANZE È l elenco delle parole contenute in un testo, ordinate alfabeticamente e accompagnate da alcuni riferimenti che ne rendono possibile il

Dettagli

TEI TEI. I marcatori. Sintassi dei marcatori. Tei: macrostruttura 21/03/17

TEI TEI. I marcatori. Sintassi dei marcatori. Tei: macrostruttura 21/03/17 Lez. 7 TEI TEI Text Encoding Initiative La Text Encoding Initiative è un progetto internazionale che ha visto coinvolte le maggiori organizzazioni internazionali dedicate all'informatica Umanistica 21/03/17

Dettagli

Voi fareste lo scambio? XML & Co. XML: le origini. XML: cosa è. XML: caratteristiche. XML: caratteristiche 02/03/2012

Voi fareste lo scambio? XML & Co. XML: le origini. XML: cosa è. XML: caratteristiche. XML: caratteristiche 02/03/2012 Lez. 6 Voi fareste lo scambio XML & Co. Nozioni di base per creare e visualizzare documenti XML 29/02/12 XML: cosa è XML: Extensible Markup Language: è un linguaggio che consente la rappresentazione di

Dettagli

La linguistica dei corpora

La linguistica dei corpora 3. La linguistica dei corpora La linguistica dei corpora non può considerarsi propriamente come una branca della scienza linguistica, bensì un approccio, una serie di metodi e un insieme di strumenti di

Dettagli

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio (1) Linguaggio (2)

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio (1) Linguaggio (2) Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,

Dettagli

Nozioni di base per creare e visualizzare documenti XML

Nozioni di base per creare e visualizzare documenti XML Nozioni di base per creare e visualizzare documenti XML Il concetto di modello Prima della codifica di un qualsiasi documento è necessario studiarne la natura, le caratteristiche e le possibili funzionalità

Dettagli

Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione

Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio (1) Linguaggio (2) Insieme di sequenze di simboli,

Dettagli

Lez. 9. Gli spogli lessicali. Parte seconda 02/11/09

Lez. 9. Gli spogli lessicali. Parte seconda 02/11/09 Lez. 9 Gli spogli lessicali Parte seconda 02/11/09 LE CONCORDANZE È l elenco delle parole contenute in un testo, ordinate alfabeticamente e accompagnate da alcuni riferimenti che ne rendono possibile il

Dettagli

Linguistica Computazionale. 22 settembre 2014

Linguistica Computazionale. 22 settembre 2014 Linguistica Computazionale 22 settembre 2014 Obiettivi del corso Introduzione ai principali metodi di linguistica computazionale e di Natural Language Processing (NLP) Docenti Alessandro Lenci (Dip. di

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Part of Speech Tagging 1 dicembre 2014 Analisi morfo-sintattica (POStagging) Il PoS Tagging è utilizzato per la disambiguazione morfologica. id forma lemma pos tratti 1 Il il

Dettagli

VINCENZO LOMIENTO I testi cristiani antichi e il computer

VINCENZO LOMIENTO I testi cristiani antichi e il computer Auctores Nostri, 4.2006, 657-661 I testi cristiani antichi e il computer 1. Premessa Nel corso del PRIN 2004 «Interpretare e comunicare. Tradizioni di scuola nella letteratura latina tra III e VI secolo»

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento

Dettagli

Valutazione Laboratorio di informatica specialistica per Scienze dell'antichità A.A. 2015/16, Dr. Paolo Monella Valutazione

Valutazione Laboratorio di informatica specialistica per Scienze dell'antichità A.A. 2015/16, Dr. Paolo Monella Valutazione Laboratorio di informatica specialistica per Scienze dell'antichità A.A. 2015/16, Dr. Paolo Monella B C D E F G H I J K L M Matr. Prova teorica Prova pratica Valutaz. complessiva Verbalizz. Domanda 1 2

Dettagli

La codifica digitale dei testi. Daniela Trotta

La codifica digitale dei testi. Daniela Trotta La codifica digitale dei testi Daniela Trotta dtrotta@unisa.it The lexicographic data that are available in computer form as of today are the following: published dictionaries [ ], electronic dictionaries

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale La codifica di alto livello del testo Salvatore Sorce Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Lucidi Adattati da Alessandro Lenci Dipartimento

Dettagli

ISTITUTO COMPRENSIVO CASTELLO DI SERRAVALLE - SAVIGNO

ISTITUTO COMPRENSIVO CASTELLO DI SERRAVALLE - SAVIGNO ISTITUTO COMPRENSIVO CASTELLO DI SERRAVALLE - SAVIGNO via XXV Aprile,52 VALSAMOGGIA 40050 loc. Castello di Serravalle (BO) C.F:91171010373 - Tel. 051 670 48 24 Sito internet www.icccastellodiserravalle.gov.it

Dettagli

014 5 Pragmatica Lingue per scopi speciali. [014 8] Abbreviazioni e simboli Filosofia e teoria

014 5 Pragmatica Lingue per scopi speciali. [014 8] Abbreviazioni e simboli Filosofia e teoria T4 T4 014 301 Filosofia e teoria 014 301 8 Scuole, teorie, metodologie 014 301 82 Linguistica formale Notazione 01 dalla Tavola 1 come di seguito modificata Da non usare per scuole e teorie semantiche;

Dettagli

3. Dalla linearità alla struttura La dipendenza dalla struttura La ricorsività 31

3. Dalla linearità alla struttura La dipendenza dalla struttura La ricorsività 31 Indice Parte I Fare grammatica 9 1. Insegnare ancora la grammatica? 9 2. La tradizione 15 2.1. Analisi grammaticale 16 2.2. Analisi logica 19 2.3. Analisi del periodo 22 2.4. Analisi testuale 24 2.5. Verso

Dettagli

Linguistica Computazionale 2004 Presentazione del Corso

Linguistica Computazionale 2004 Presentazione del Corso 13 febbraio 2004 1 Informazioni generali Docente Marco Baroni Email baroni@sslmit.unibo.it Telefono 0453/374744 Homepage del corso http://www.e-learning.sslmit.unibo.it/compling04/ Orario lezioni Lunedì

Dettagli

Linguaggi di Programmazione

Linguaggi di Programmazione Linguaggi di Programmazione 1 Linguaggio naturale e linguaggio macchina La comunicazione uomo-macchina avviene attraverso formalismi che assumono la forma di un linguaggio. Caratteristiche del Linguaggio

Dettagli

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio. Messaggio

Sommario Linguaggi, messaggi e comunicazione. Introduzione ai Linguaggi di Programmazione. Linguaggio. Messaggio Sommario Linguaggi, messaggi e comunicazione Traduzione di programmi Interpreti e compilatori Introduzione al processo di compilazione 1 2 Linguaggio Messaggio Insieme di sequenze di simboli, le parole,

Dettagli

La padronanza linguistica, Academia Universa Press 2011 PARTE PRIMA FARE GRAMMATICA 1. INSEGNARE ANCORA LA GRAMMATICA?

La padronanza linguistica, Academia Universa Press 2011 PARTE PRIMA FARE GRAMMATICA 1. INSEGNARE ANCORA LA GRAMMATICA? La padronanza linguistica, Academia Universa Press 2011 PARTE PRIMA FARE GRAMMATICA 1. INSEGNARE ANCORA LA GRAMMATICA? 2. LA TRADIZIONE Analisi grammaticale Analisi logica Analisi del periodo Analisi testuale

Dettagli

L esplorazione e l analisi dei corpora. Metodi di indagine e di interrogazione

L esplorazione e l analisi dei corpora. Metodi di indagine e di interrogazione L esplorazione e l analisi dei corpora Metodi di indagine e di interrogazione Liste di frequenza Forma elenco di tutte le forme (types, tipi di parole) indici di frequenza (ossia il numero di occorrenze

Dettagli

Linguistica computazionale: task sul linguaggio naturale"

Linguistica computazionale: task sul linguaggio naturale Linguistica computazionale: task sul linguaggio naturale" Cristina Bosco 2015 Informatica applicata alla comunicazione multimediale NLP e subtask Ci focalizziamo su alcuni subtask rappresentativi:" Information

Dettagli

Esercitazioni: XML e TEI

Esercitazioni: XML e TEI Esercitazioni: XML e TEI Mirko Tavosanis A.a. 2007-2008 Informazione e Scienze Umane Informazione strutturata dizionari thesauri Informazione non strutturata (debolmente strutturata) documenti testuali

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Collocazioni e misure statistiche di associazione 27 ottobre 2014 Le parole in contesto You shall know a word by the company it keeps J. R. Firth (1957) XXXXX andamento_della_x;

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionale Codifica del testo digitale 30 settembre 2014 Strumenti e risorse per la linguistica computazionale Tre requisiti per la linguistica computazionale e NLP dati linguistici corpora

Dettagli

Latino Liceo delle scienze umane Classe prima Trimestre

Latino Liceo delle scienze umane Classe prima Trimestre Classe prima n.2 scritti e n.2 orali, Leggere un testo in lingua latina,prestando attenzione alle regole della pronuncia e alla quantità delle vocali Cogliere analogie e differenze tra la frase italiana

Dettagli

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia (per iniziare ) prima lezione introduzione:

Dettagli

ITALIANO A. S. 2018/2019

ITALIANO A. S. 2018/2019 A. S. 2018/2019 Ascoltare in modo attivo e comprendere l argomento di una conversazione. Ascoltare in modo attivo e comprendere l oggetto e le diverse argomentazioni di una discussione. Ascoltare in modo

Dettagli

CURRICOLO DISCIPLINARE di LATINO LICEO SCIENTIFICO, SCIENZE UMANE

CURRICOLO DISCIPLINARE di LATINO LICEO SCIENTIFICO, SCIENZE UMANE Istituto di Istruzione Secondaria Superiore "Archimede" Rosolini (SR) a.s. 2018/2019 CURRICOLO DISCIPLINARE di LATINO LICEO SCIENTIFICO, SCIENZE UMANE DIPARTIMENTO DI LETTERE, DISEGNO E STORIA DELL ARTE

Dettagli

La linguistica dei corpora

La linguistica dei corpora La linguistica dei corpora 1 Argomenti trattati nella lezione: DEFINIZIONE ESEMPIO DI UTILIZZO COSTRUZIONE CODIFICA E ANNOTAZIONE STANDARD DI CODIFICA E ANNOTAZIONE ANALISI DI UN CORPUS LE APPLICAZIONI

Dettagli

TECNOLOGIE DEL LINGUAGGIO

TECNOLOGIE DEL LINGUAGGIO Internet Festival 10 ottobre 2014 TECNOLOGIE DEL LINGUAGGIO NUOVI MESTIERI, NUOVE RICERCHE Maria Simi Dipartimento di Informatica Università di Pisa Internet Festival 10 ottobre 2014 INTRODUZIONE Il settore

Dettagli

Classificare i nomi propri -Esercitazione-

Classificare i nomi propri -Esercitazione- Classificare i nomi propri -Esercitazione- Lucia Passaro CoLing Lab Laboratorio di Linguistica Computazionale http://colinglab.humnet.unipi.it/ lucia.passaro@for.unipi.it Pisa 29 Novembre 2017 Analisi

Dettagli

1 Modulo operativo: Le abilità linguistiche: ascoltare. 2 Modulo operativo: Le abilità linguistiche: parlare

1 Modulo operativo: Le abilità linguistiche: ascoltare. 2 Modulo operativo: Le abilità linguistiche: parlare 1 Modulo operativo: Le abilità linguistiche: ascoltare 2 Modulo operativo: Le abilità linguistiche: parlare 3 Modulo operativo: Le abilità linguistiche: leggere 4 Modulo operativo: Le abilità linguistiche:

Dettagli

QUADRO DI RIFERIMENTO DI ITALIANO PROVE INVALSI 2009

QUADRO DI RIFERIMENTO DI ITALIANO PROVE INVALSI 2009 QUADRO DI RIFERIMENTO DI ITALIANO PROVE INVALSI 2009 RIFERIMENTI NORMATIVI INDICAZIONI NAZIONALI 2003 (OSA) L. n 53/2003 e D. Lgs 59/2004 INDICAZIONI NAZIONALI PER IL CURRICULO 2007 QUADRO DI RIFERIMENTO

Dettagli

GRAMMATICA - TESTO PAROLE E TESTI IN GIOCO Progettazione didattica annuale per unità e competenze Classi Prime

GRAMMATICA - TESTO PAROLE E TESTI IN GIOCO Progettazione didattica annuale per unità e competenze Classi Prime GRAMMATICA - TESTO PAROLE E TESTI IN GIOCO Progettazione didattica annuale per unità e competenze Classi Prime Unità 1 Suoni, lettere e ortografia fondamentali relative alla fonologia e all ortografia

Dettagli

Linguistica Computazionale. 22 novembre 2016

Linguistica Computazionale. 22 novembre 2016 Linguistica Computazionae 22 novembre 2016 Tecnoogie de inguaggio Sistemi in grado di accedere a contenuto di informazione attraverso eaborazione automatica de inguaggio (Natura Language Processing, Trattamento

Dettagli

Lezione 26/09/2018. Grammatica Italiana LM-85bis Prof.ssa Maila Pentucci

Lezione 26/09/2018. Grammatica Italiana LM-85bis Prof.ssa Maila Pentucci Lezione 26/09/2018 Grammatica Italiana LM-85bis Prof.ssa Maila Pentucci maila.pentucci@unimc.it Organizzazione e informazioni Descrizione del Corso 2018/19 n. 7 CFU (6+1) corrispondenti a n. 46 ore (36+10)

Dettagli

Natural Language Processing

Natural Language Processing Natural Language Processing Introduzione Corso di Linguaggi & Traduttori Università degli Studi di Bari Pierpaolo Basile (Ph.D. Student) Outline Natural Language Processing Perché / Dove Un po di storia

Dettagli

Corpora e linguistica computazionale

Corpora e linguistica computazionale Corpora e linguistica computazionale Cristina Bosco Corso di Informatica applicata alla comunicazione multimediale 2013-2014 Elaborare il linguaggio naturale Il problema della comprensione del linguaggio

Dettagli

Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale (seconda parte)"

Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale (seconda parte) Linguistica computazionale: come accedere all informazione codificata nel linguaggio naturale (seconda parte)" Cristina Bosco 2014 Informatica applicata alla comunicazione multimediale NLP e subtask Ci

Dettagli

Lez. 5 La Programmazione. Prof. Salvatore CUOMO

Lez. 5 La Programmazione. Prof. Salvatore CUOMO Lez. 5 La Programmazione Prof. Salvatore CUOMO 1 2 Programma di utilità: Bootstrap All accensione dell elaboratore (Bootsrap), parte l esecuzione del BIOS (Basic Input Output System), un programma residente

Dettagli

OBIETTIVI SPECIFICI DI APPRENDIMENTO AREE DA SVILUPPARE. Riflettere sulla lingua

OBIETTIVI SPECIFICI DI APPRENDIMENTO AREE DA SVILUPPARE. Riflettere sulla lingua 1 CONTENUTI, ATTIVITÁ COMPETENZE IN USCITA Riflettere sulla lingua 1. Consolidare le principali convenzioni ortografiche. 2. Approfondire la conoscenza di: - articolo (partitivo) - nome (classificazione

Dettagli

ISTITUTO COMPRENSIVO MAZZINI-MODUGNO BARI. Scuola Secondaria di 1 grado - Anno Scolastico 2018/19. Alunni destinatari: classi I

ISTITUTO COMPRENSIVO MAZZINI-MODUGNO BARI. Scuola Secondaria di 1 grado - Anno Scolastico 2018/19. Alunni destinatari: classi I ISTITUTO COMPRENSIVO MAZZINI-MODUGNO BARI UDA DISCIPLINARE N. 1 Disciplina: Italiano Classe: I Titolo: Il testo narrativo - favola, fiaba, fantasy Tempi: settembre, ottobre, novembre Scuola Secondaria

Dettagli

La codifica del testo, XML e la Text Encoding Initiative

La codifica del testo, XML e la Text Encoding Initiative La codifica del testo, XML e la Text Encoding Initiative Corso di Informatica per le discipline classiche LS Filologia, Letteratura e tradizione classica Tecnologie informatiche e scienze umane Proliferazione

Dettagli

Obbiettivi del Corso

Obbiettivi del Corso Trattamento Automatico delle Lingue R. Basili a.a. 2004-2005 2005 Obbiettivi del Corso Introduzione al trattamento dei fenomeni linguistici al calcolatore Applicazioni del TAL Metodi e tecnologie principali

Dettagli

ITALIANO TEMATICHE PORTANTI: TESTO NARRATIVO, TESTO POETICO, TESTO DESCRITTIVO, TESTO ARGOMENTATIVO, TESTO REGOLATIVO,

ITALIANO TEMATICHE PORTANTI: TESTO NARRATIVO, TESTO POETICO, TESTO DESCRITTIVO, TESTO ARGOMENTATIVO, TESTO REGOLATIVO, ITALIANO CLASSE PRIMA TEMATICHE PORTANTI: TESTO NARRATIVO, TESTO POETICO, TESTO DESCRITTIVO, TESTO ARGOMENTATIVO, TESTO REGOLATIVO, NUCLEI FONDANTI MICROCOMPETENZE OBIETTIVI SPECIFICI Racconto personale

Dettagli

LICEO CLASSICO-SCIENTIFICO VITTORIO IMBRIANI POMIGLIANO D ARCO (NA) ANNO SCOLASTICO 2012/2013 PROGRAMMAZIONE DI LATINO CLASSE I SEZIONE E SCIENTIFICO

LICEO CLASSICO-SCIENTIFICO VITTORIO IMBRIANI POMIGLIANO D ARCO (NA) ANNO SCOLASTICO 2012/2013 PROGRAMMAZIONE DI LATINO CLASSE I SEZIONE E SCIENTIFICO LICEO CLASSICO-SCIENTIFICO VITTORIO IMBRIANI POMIGLIANO D ARCO (NA) ANNO SCOLASTICO 2012/2013 PROGRAMMAZIONE DI LATINO CLASSE I SEZIONE E SCIENTIFICO DOCENTE: APPIERTO RENATA Analisi della situazione di

Dettagli

LICEO GINNASIO STATALE G. B. BROCCHI Bassano del Grappa -VI. Progettazione didattico educativa di dipartimento CLASSICO

LICEO GINNASIO STATALE G. B. BROCCHI Bassano del Grappa -VI. Progettazione didattico educativa di dipartimento CLASSICO Pagina 1 di 13 DIPARTIMENTO DISCIPLINA CLASSI INDIRIZZO LETTERE GRECO 1 A E 2 A LICEO CLASSICO OBIETTIVI IN TERMINI DI: COMPETENZE, ABILITÀ, CONOSCENZE E ATTIVITÀ N.B. La tabella evidenzia i contributi

Dettagli

LICEO GINNASIO STATALE G. B. BROCCHI Bassano del Grappa -VI. Progettazione didattico educativa di dipartimento CLASSE

LICEO GINNASIO STATALE G. B. BROCCHI Bassano del Grappa -VI. Progettazione didattico educativa di dipartimento CLASSE Pagina 1 di 8 DIPARTIMENTO DISCIPLINA CLASSE INDIRIZZO LETTERE LATINO 1 A E 2 A LICEO LINGUISTICO-SCIENTIFICO DELLE SCIENZE UMANE OBIETTIVI IN TERMINI DI: COMPETENZE, ABILITÀ, CONOSCENZE E ATTIVITÀ COMPETENZA

Dettagli

analisi grammaticale 528D9E9BA64DE3FCDFF020E843CDC4CB Analisi Grammaticale 1 / 6

analisi grammaticale 528D9E9BA64DE3FCDFF020E843CDC4CB Analisi Grammaticale 1 / 6 Analisi Grammaticale 1 / 6 2 / 6 3 / 6 Analisi Grammaticale Una presentazione delle parti del discorso secondo il metodo analogico e quiz interattivi. di Silvia Di Castro Analisi grammaticale - latecadidattica.it

Dettagli

XML per l editoria elettronica

XML per l editoria elettronica XML per l editoria elettronica Sistemi per il recupero delle informazioni Laurea Magistrale in Editoria e Giornalismo Gabriele Pozzani materiale prodotto dalla Dott.ssa Barbara Oliboni Sommario Documenti

Dettagli

Le unità di analisi. Analisi del testo letterario. Analisi del testo letterario 1 - Isabella Chiari 1

Le unità di analisi. Analisi del testo letterario. Analisi del testo letterario 1 - Isabella Chiari 1 Le unità di analisi Analisi del testo letterario Analisi del testo letterario 1 - Isabella Chiari 1 I livelli dell analisi linguistica Fonetica e fonologia Suoni e classi di suoni k, t, a, ts Sintassi

Dettagli

Come funziona il Part-of-Speech Tagging

Come funziona il Part-of-Speech Tagging Come funziona il Part-of-Speech Tagging Marco Baroni 14 marzo 2005 1 Introduzione Abbiamo usato taggers pre-addestrati che, dato un corpus in input, producono output taggato. In questo handout, studiamo

Dettagli

CHLT LemLat Un progetto di ricerca nel campo della Linguistica Computazionale. Marco Passarotti ILC - CNR Pisa

CHLT LemLat Un progetto di ricerca nel campo della Linguistica Computazionale. Marco Passarotti ILC - CNR Pisa CHLT LemLat Un progetto di ricerca nel campo della Linguistica Computazionale Marco Passarotti ILC - CNR Pisa 1 Linguistica Computazionale La lingua in pasto al computer Serve un nuovo tipo di input Nuova

Dettagli

CURRICOLO DISCIPLINARE di LATINO

CURRICOLO DISCIPLINARE di LATINO Istituto di Istruzione Secondaria Superiore "Archimede" Rosolini (SR) a.s. 2018/2019 CURRICOLO DISCIPLINARE di LATINO LICEO SCIENTIFICO, SCIENZE UMANE, LINGUISTICO DIPARTIMENTO DI LETTERE, DISEGNO E STORIA

Dettagli

Gli strumenti statistici

Gli strumenti statistici Lez. 9 Gli strumenti statistici I metodi di elaborazione statistica e il calcolo dello stile /parte prima 21/03/13 John McHardy Sinclair 1933 2007 Professore di lingua inglese moderna presso la università

Dettagli

Valutazione Laboratorio di informatica specialistica per Scienze dell'antichità A.A. 2016/17, Dr. Paolo Monella Valutazione

Valutazione Laboratorio di informatica specialistica per Scienze dell'antichità A.A. 2016/17, Dr. Paolo Monella Valutazione Valutazione Laboratorio di informatica specialistica per Scienze dell'antichità A.A. 2016/17, Dr. Paolo Monella Valutazione B C D E F G H I J K L M Matr. Prova teorica Prova pratica Valutaz. complessiva

Dettagli

Università di Bergamo Facoltà di Ingegneria. Applicazioni Internet B. Paolo Salvaneschi B3_1 V1.6. HTML parte A

Università di Bergamo Facoltà di Ingegneria. Applicazioni Internet B. Paolo Salvaneschi B3_1 V1.6. HTML parte A Università di Bergamo Facoltà di Ingegneria Applicazioni Internet B Paolo Salvaneschi B3_1 V1.6 HTML parte A Il contenuto del documento è liberamente utilizzabile dagli studenti, per studio personale e

Dettagli

Linguistica Computazionale

Linguistica Computazionale Linguistica Computazionae 22 novembre 2017 Tecnoogie de inguaggio Sistemi in grado di accedere a contenuto di informazione attraverso eaborazione automatica de inguaggio (Natura Language Processing, Trattamento

Dettagli

COMPETENZE DI ITALIANO DA PROVE INVALSI

COMPETENZE DI ITALIANO DA PROVE INVALSI COMPETENZE DI ITALIANO DA PROVE INVALSI COMPETENZE DI ITALIANO TRATTE DAL QUADRO DI RIFERIMENTO DELLA PROVA DI ITALIANO DELL INVALSI AGGIORNATO AL 28 FEBBRAIO 2011. 1. LETTURA. PREMESSA: tipo di testo

Dettagli

Criteri per la definizione della parola grammaticale

Criteri per la definizione della parola grammaticale Criteri per la definizione della parola grammaticale Una parola grammaticale (morfo-sintattica, non fonologica) è definita in base alla co-occorrenza dei seguenti criteri: a) COESIONE: si definisce parola

Dettagli

TRATTAMENTO DI TESTI ITALIANI: STRUMENTI, RISORSE E PROBLEMI

TRATTAMENTO DI TESTI ITALIANI: STRUMENTI, RISORSE E PROBLEMI Isabella Chiari TRATTAMENTO DI TESTI ITALIANI: STRUMENTI, RISORSE E PROBLEMI 1 CORPORA E APPLICAZIONI Perché la linguistica dei corpora è oggi tanto rilevante? Come si integra la linguistica dei corpora

Dettagli

ISTITUTO: Liceo Classico CLASSE: I MATERIA: Italiano

ISTITUTO: Liceo Classico CLASSE: I MATERIA: Italiano ISTITUTO: Liceo Classico CLASSE: I MATERIA: Italiano Modulo n 1 La comunicazione e il testo U.D. 1 La lingua: uno strumento per comunicare - La lingua e le lingue: varietà dell italiano; - La comunicazione

Dettagli

ISTRUZIONI PROGETTO FASE 4

ISTRUZIONI PROGETTO FASE 4 ISTRUZIONI PROGETTO FASE 4 Data consegna: tre giorni (72 ore) prima della verbalizzazione Questo documento contiene le istruzione per l esecuzione della fase 4 del progetto. Per informazioni o domande

Dettagli

PIANO DI LAVORO ANNUALE

PIANO DI LAVORO ANNUALE ISTITUTO D ISTRUZIONE SUPERIORE MAJORANA Via Ada Negri, 14 10024 MONCALIERI (TO) Codice fiscale 84511990016 Sezione Liceale E.Majorana Sezione Tecnico Economica Scientifico - Linguistico A.Marro Via Ada

Dettagli

L italiano di stranieri, l italiano di apprendenti indagati attraverso corpora

L italiano di stranieri, l italiano di apprendenti indagati attraverso corpora L italiano di stranieri, l italiano di apprendenti indagati attraverso corpora Costruzione di corpora 10. Valutazione del lessico 15 aprile 2014 Linguistica italiana II Mirko Tavosanis Ad una prima scorsa

Dettagli

PIANO DI LAVORO INDIVIDUALE a.s Disciplina: LINGUA E CIVILTA LATINA Prof. GUALTIERI CRISTINA Classe 1A OBIETTIVI SPECIFICI DI APPRENDIMENTO

PIANO DI LAVORO INDIVIDUALE a.s Disciplina: LINGUA E CIVILTA LATINA Prof. GUALTIERI CRISTINA Classe 1A OBIETTIVI SPECIFICI DI APPRENDIMENTO Ministero dell Istruzione dell Università e della Ricerca LICEO SCIENTIFICO STATALE Donato Bramante Via Trieste, 70-20013 MAGENTA (MI) - MIUR: MIPS25000Q Tel.: +39 02 97290563/4/5 Fax: 02 97220275 Sito:

Dettagli

11. Il lessico dei testi

11. Il lessico dei testi Modulo B I testi brevi 11. Il lessico dei testi 27 aprile 2016 Linguistica italiana II Mirko Tavosanis A. a. 2015-2016 Analisi quantitativa del testo Vediamo esempi di analisi quantitativa del testo condotta

Dettagli

Introduzione all informatica

Introduzione all informatica Introduzione all informatica INFORMATICA Varie definizioni Scienza degli elaboratori elettronici (Computer Science) Scienza dell informazione Definizione proposta Scienza della rappresentazione e dell

Dettagli

Elementi di Psicologia dello Sviluppo (II modulo) Mirco Fasolo

Elementi di Psicologia dello Sviluppo (II modulo) Mirco Fasolo Elementi di Psicologia dello Sviluppo (II modulo) Mirco Fasolo mirco.fasolo@unimib.it Bibliografia Testi obbligatori - D amico, Devescovi (2003). Comunicazione e linguaggio nei bambini. Carocci: Roma.

Dettagli

Corso di Linguaggi di Programmazione + Laboratorio

Corso di Linguaggi di Programmazione + Laboratorio Corso di inguaggi di Programmazione + aboratorio Capitolo 1 - Introduzione Si ringrazia il Dott. Marco de Gemmis per la collaborazione nella predisposizione del materiale didattico Apprendimento di un

Dettagli

I linguaggi. Informatica

I linguaggi. Informatica I linguaggi Informatica Comunicazione La comunicazione è un processo che consente di scambiare informazioni e coinvolge un mittente, un destinatario, un messaggio ed un canale comunicativo. Affinché la

Dettagli

3) Quale di questi nomi propri non contiene un dittongo? a) Paolo b) Pietro c) Mauro d) Chiara

3) Quale di questi nomi propri non contiene un dittongo? a) Paolo b) Pietro c) Mauro d) Chiara 1) La fonologia: a) studia i suoni in quanto entità concrete fisico-acustiche b) è sinonimo di fonetica c) ha per unità minime i fonemi d) prescinde dalle relazioni tra i suoni in una determinata lingua

Dettagli

AIP. L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE

AIP. L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE AIP Seminario residenziale Psicologia del discorso e analisi dei discorsi L ANALISI AUTOMATIZZATA dei DATI TESTUALI: IL SOFTWARE ALCESTE Silvia Gattino e Stefano Tartaglia Dipartimento di Psicologia Università

Dettagli

LATINO E GRECO. TEMPI DI RICONSEGNA DEGLI ELABORATI SCRITTI E DEI TEST OGGETTIVI: entro 15 giorni.

LATINO E GRECO. TEMPI DI RICONSEGNA DEGLI ELABORATI SCRITTI E DEI TEST OGGETTIVI: entro 15 giorni. LATINO E GRECO TEST D INGRESSO Non essendovi prerequisiti specifici, il test d ingresso è quello già somministrato per italiano. OBIETTIVI DA CONSEGUIRE NEL BIENNIO CONOSCENZE: - Morfologia (articolo per

Dettagli

Istituto Tecnico - Settore Tecnologico Indirizzo: Grafica e comunicazione

Istituto Tecnico - Settore Tecnologico Indirizzo: Grafica e comunicazione Ministero dell Istruzione, dell Università e della Ricerca I.I.S. CATERINA CANIANA Via Polaresco 19 24129 Bergamo Tel: 035 250547 035 253492 Fax: 035 4328401 http://www.istitutocaniana.it email: canianaipssc@istitutocaniana.it

Dettagli

AppuntiBicoccaAppuntiBicoccaAppu ntibicoccaappuntibicoccaappuntibic occaappuntibicoccaappuntibicoccaa ppuntibicoccaappuntibicoccaappunt

AppuntiBicoccaAppuntiBicoccaAppu ntibicoccaappuntibicoccaappuntibic occaappuntibicoccaappuntibicoccaa ppuntibicoccaappuntibicoccaappunt AppuntiBicoccaAppuntiBicoccaAppu ntibicoccaappuntibicoccaappuntibic occaappuntibicoccaappuntibicoccaa ppuntibicoccaappuntibicoccaappunt Struttura delle parole ibicoccaappuntibicoccaappuntibicoc Riassunto

Dettagli

REPUBBLICA ITALIANA - REGIONE SICILIA ISTITUTO DI ISTRUZIONE SECONDARIA SUPERIORE MANDRALISCA LICEO GINNASIO STATALE

REPUBBLICA ITALIANA - REGIONE SICILIA ISTITUTO DI ISTRUZIONE SECONDARIA SUPERIORE MANDRALISCA LICEO GINNASIO STATALE REPUBBLICA ITALIANA - REGIONE SICILIA ISTITUTO DI ISTRUZIONE SECONDARIA SUPERIORE MANDRALISCA LICEO GINNASIO STATALE e I.P.S.S.E.O.A. - CEFALU Via Maestro Vincenzo Pintorno 27 - e-mail: PAIS00200N@istruzione.it

Dettagli

Lez. 8. Gli spogli lessicali. Parte seconda 18/03/13

Lez. 8. Gli spogli lessicali. Parte seconda 18/03/13 Lez. 8 Gli spogli lessicali Parte seconda 18/03/13 LE CONCORDANZE È l elenco delle parole contenute in un testo, ordinate alfabeticamente e accompagnate da alcuni riferimenti che ne rendono possibile il

Dettagli

COMPETENZA CHIAVE COMUNICAZIONE NELLA MADRELINGUA

COMPETENZA CHIAVE COMUNICAZIONE NELLA MADRELINGUA COMPETENZA ITALIANO COMPETENZA CHIAVE COMUNICAZIONE NELLA MADRELINGUA Definizione: è la capacità di esprimere e interpretare pensieri,sentimenti e fatti in forma sia in forma orale che scritta (comprensione

Dettagli

Completamente Analisi Grammaticale

Completamente Analisi Grammaticale Completamente Analisi Grammaticale 1 / 6 2 / 6 3 / 6 Completamente Analisi Grammaticale Analisi L' analisi grammaticale è quell'operazione che associa ciascuna parola presente in una frase, ad una parte

Dettagli

Introduzione. TALN Corpus-based computational linguistics. Rapporto tra forme, classificazioni e lemmi. Liste e classi di frequenza del lessico

Introduzione. TALN Corpus-based computational linguistics. Rapporto tra forme, classificazioni e lemmi. Liste e classi di frequenza del lessico TALN Stu Statistici TALN Corpus-based computational linguistics Seminario del corso Trattamento Automatico del Linguaggio Naturale (a. a. 01 02) 2 Introduzione Gli strumenti informatici ed i meto statistici

Dettagli

Linguis'ca computazionale, treebank e altre risorse

Linguis'ca computazionale, treebank e altre risorse Linguis'ca computazionale, treebank e altre risorse Cris%na Bosco Corso di Informa%ca applicata alla comunicazione mul%mediale 2016-2017 Di cosa parleremo Task di LC Risorse linguis%che (diverse dai corpora)

Dettagli

PIANO DELLE UNITÀ DI APPRENDIMENTO

PIANO DELLE UNITÀ DI APPRENDIMENTO PIANO DELLE UNITÀ DI APPRENDIMENTO Scuola Primaria di Vestreno Classe IV a.s. 2014/15 Insegnante:Sabrina Rabbiosi DISCIPLINA : Italiano TITOLO ASCOLTO E RACCONTO UDA 1 Comprendere e produrre testi orali

Dettagli

Comunicare intervenendo con pertinenza e con rispetto dei tempi. Distinguere un testo in prosa da un testo poetico.

Comunicare intervenendo con pertinenza e con rispetto dei tempi. Distinguere un testo in prosa da un testo poetico. ACQUISIZIONE ED ESPANSIONE DEL LESSICO RICETTIVO E PRODUTTIVO SCRITTURA LETTURA ASCOLTO E PARLATO ITALIANO classe prima Ascoltare per un tempo adeguato e comprendere il messaggio in modo globale, distinguendo

Dettagli

Progetto e sperimentazione di un modello di Clause Identification per la lingua italiana

Progetto e sperimentazione di un modello di Clause Identification per la lingua italiana Università degli Studi di Siena Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica Curriculum Sistemi Informatici Multimediali Progetto e sperimentazione di un modello di Clause

Dettagli

Strumenti linguistici per le applicazioni imprenditoriali. Dizionari Elettronici e Grammatiche Locali

Strumenti linguistici per le applicazioni imprenditoriali. Dizionari Elettronici e Grammatiche Locali Strumenti linguistici per le applicazioni imprenditoriali Dizionari Elettronici e Grammatiche Locali Dizionari Elettronici Dizionari Elettronici Grammatiche Locali Dizionari Elettronici Dizionari Elettronici

Dettagli

Unità Didattica 2 I Linguaggi di Programmazione

Unità Didattica 2 I Linguaggi di Programmazione Unità Didattica 2 I Linguaggi di Programmazione 1 Linguaggio naturale e linguaggio macchina La comunicazione uomo-macchina avviene attraverso formalismi che assumono la forma di un linguaggio. Caratteristiche

Dettagli

OBIETTIVI FORMATIVI E DI ORIENTAMENTO E APPRENDIMENTO latino classico biennio

OBIETTIVI FORMATIVI E DI ORIENTAMENTO E APPRENDIMENTO latino classico biennio OBIETTIVI FORMATIVI E DI ORIENTAMENTO E APPRENDIMENTO latino classico biennio Competenze chiave di Cittadinanza Competenze generali di Asse Linguaggi (dalle Indicazioni Nazionali e dagli Assi Culturali)

Dettagli

Il codice linguistico

Il codice linguistico Laboratorio Linguistico Il Testo narrativo Il codice linguistico www.nicolanapolitano.altervista.org App Generation Writers I. C. San Francesco Nicola Napolitano Anguillara Sabazia - RM Le funzioni e la

Dettagli