Aspetti problematici fresco, scuola, riso polisemia e omonimia a gambe levate, tirare le cuoia, a giorni alterni, nudo e crudo polirematiche o multiword expressions cane/gatto/scimmia/topo mangiare/divorare giallo/rosso/nero/bianco lessico (asse paradigmatico) relazioni nel 1 Parola e Parole: polirematiche Fresco fresco = recente? forte = potente? morbido = soffice? sì e no (cioè, non sempre) quali sono possibili contesti discriminanti? ricordate le concordanze? http://corpora.dslo.unibo.it caffè forte computer potente frutta fresca notizia fresca # caffè potente computer forte frutta recente notizia secca You should tell a word by the company it keeps (Firth) Collocazioni You should tell a word by the company it keeps (Firth) collocazioni: combinazioni di parole che si trovano regolarmente vicine sull asse sintagmatico (co-occorrono molto spesso) molto spesso quanto? più spesso di quanto ci si aspetterebbe se la cooccorrenza fosse casuale
Collocazioni caffè forte w 1 = caffè w 2 = forte P(w 1 ) = la probabilità di incontrare w 1 in un dato corpus P(w 2 ) = la probabilità di incontrare w 2 in un dato corpus P(w 1 w 2 ) = la probabilità di incontrare la sequenza w 1 w 2 se P(w 1 w 2 ) = P(w 1 )P(w 2 ) la probabilità di cooccorrenza di w 1 e w 2 è semplicemente il prodotto della probabilità di occorrenza delle singole parole se P(w 1 w 2 ) > P(w 1 )P(w 2 ) (oltre una certa soglia) possiamo essere di fronte ad una collocazione (previa considerazione fattori linguistici) NB: oltre una certa soglia è questione di significanza statistica (test: mutual information, t-test, χ-square,...) http://clic.cimec.unitn.it/marco/webbit/index.html (Marco Baroni) http://corpora.dslo.unibo.it Collocazioni [A collocation is defined as] a sequence of two or more consecutive words, that has characteristics of a syntactic and semantic unit, and whose exact and unambiguous meaning or connotation cannot be derived directly from the meaning or connotation of its components. non-sostituibilità non-composizionalità non-modificabilità (Choueka 1988) 2
Composizionalità Principio di composizionalità (Frege?): il significato di un espressione complessa è una funzione del significato delle sue parti seppur quasi sempre vero nelle lingue artificiali (es. linguaggi di programmazione), per il linguaggio naturale non è così scontato... un uomo cammina? coltello da cucina? enjoy a book? maglione di lana NB: casi in cui il totale è maggiore della somma delle parti Multiword expressions (lessemi complessi o polirematiche) una multiword expression (MWE) è: scomponibile in parole semplici (solitamente) lessicalmente, sintatticamente, semanticamente, pragmaticamente, e/o statisticamente idiosincratica una combinazione di parole vicine (o meno) che ha una certa caratteristica (sintattica, semantica, statistica,...) che non può essere predetta sulla base delle parole che la compongono e/o sulla base dei processi combinatori della lingua Che sono? Parole? Sintagmi? Frasi? [... ] there is no unified phenomenon to describe but rather a complex of features that interact in various, often untidy, ways and represent a broad continuum between non-compositional (or idiomatic) and compositional groups of words. (Moon 1998) queste locuzioni costituiscono una zona intermedia tra lessico-lessico (gatto) e la sintassi-sintassi (Ieri sono andato al cinema) (Casadei 2003) 3
Esempi di MWEs aria fritta, avere le mani bucate, mordi e fuggi, al posto di, mano a mano, fuori di testa, un pugno nell occhio, prendere in giro, darsi da fare, senso unico, tirare le cuoia, a ufo, lasciare a desiderare, macchina da scrivere, cabina telefonica, al passo, vuotare il sacco, caso mai, essere alla frutta, campato in aria, doppio senso, a causa di, grazie al cielo, fare la doccia, prendere una decisione, nella misura in cui, fresco di laurea, pronto soccorso, carta carbone, dal momento che, buco nero, tutto di un colpo, dare retta, scala mobile, per lo più, acqua e sapone, di fronte a, mamma mia, piantare grane, prodotto interno lordo, alla fin fine criteri di raggruppamento? Indicatori di possibile polirematicità Rigidità lessico-grammaticale: rigidità formale, realizzazione sintattica preferita, restrizioni su aspetto, modo, diatesi, restrizioni sulla modificazione, etc. MWE rigida: macchina da scrivere (*macchina elettrica da scrivere) tirare le cuoia (*le cuoia sono state tirate da X) MWE non-rigida: darsi da fare (darsi molto da fare, darsi un gran da fare) prendere una decisione (fu presa una decisione) non-mwe rigida:? Non-composizionalità semantico/pragmatica: discrepanza tra la semantica/pragmatica delle parti e quella dell insieme MWE non-composizionale: tirare le cuoia MWE composizionale: pronto soccorso senso unico Irregolarità sintattica MWE sintatticamente corretta: tirare le cuoia cabina telefonica MWE sintatticamente scorretta: by and large per lo più Situazionalità: l espressione è associata ad una data situazione MWE situazionale: good morning all aboard MWE non-situazionale: first off Linguaggio figurato: l espressione MW è una metafora, metonimia, iperbole, etc MWE con significato figurato: aria fritta tirare le cuoia MWE senza significato figurato: senso unico cabina telefonica 4
Parafrasi: l espressione MW può essere parafrasata con un entrata lessicale unica MWE con parafrasi a parola unica: prendere una decisione = decidere vuotare il sacco = confessare (?) MWE senza parafrasi a parola unica: fare la doccia non-mwe con parafrasi a parola unica: togliersi i vestiti = spogliarsi Altre osservazioni frequenti: 63.000 polirematiche italiane + 1.800 in altre lingue (latino, inglese, francese,...)(gradit, De Mauro, Grande dizionario italiano dell uso) tipi molto diversi di espressioni polirematiche e composti? ( pesce palla e pescepalla ) polirematiche e collocazioni? ( frutta fresca, tragica scomparsa ) 5