informatica di base per le discipline umanistiche



Documenti analoghi
informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche

informatica di base per le discipline umanistiche

Linguistica Computazionale

Analisi dei Dati Tabelle e Grafici

Scale Logaritmiche. Matematica con Elementi di Statistica, Anna Torre a.a

Esercizi. 1. Disegnare il grafico qualitativo della seguente funzione:

Parole e frequenze. Alessandro Lenci

Scale Logaritmiche. Matematica con Elementi di Statistica a.a. 2015/16

Analisi dei Dati Tabelle e Grafici

Trasformazioni Logaritmiche

FUNZIONI ESPONENZIALI

Correzione secondo compitino, testo A

Utilizzo di index() per determinare la colonna delle x

Analisi dei Dati Tabelle e Grafici

y = è una relazione tra due variabili, che ad ogni valore della

informatica di base per le discipline umanistiche

Distribuzione Normale

Interpretando i dati delle indagini PMI. Esplorando la correlazione degli Indici economici selezionati dalle indagini PMI

Linguistica Computazionale

Classi: 4A inf Sirio Disciplina: MATEMATICA Ore settimanali previste: 3

Daniela Lera A.A

Correzione secondo compitino, testo B

Rappresentazione di Dati: Scala lineare Scala logaritmica. Grafici Lin Lin Grafici Lin Log Grafici Log Log

Linguaggi e Grammatiche Liberi da Contesto

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

TRE Università degli Studi

Laboratorio di Fisica I A.A. 2018/ /12/2018

Dispensa sulla funzione gaussiana

Proprietà delle funzioni. M.Simonetta Bernabei & Horst Thaler

Distribuzioni di Probabilità

informatica di base per le discipline umanistiche

1) D0MINIO. Determinare il dominio della funzione f (x) = ln ( x 3 4x 2 3x). Deve essere x 3 4x 2 3x > 0. Ovviamente x 0.

Funzione esponenziale

Programma Didattico Annuale

xg x x 3 e essendo x positiva per dominio 3 e

Distribuzione Normale

VERIFICA DI MATEMATICA Simulazione La funzione esponenziale e logaritmica - Soluzioni

LICEO SCIENTIFICO "R. NUZZI" - ANDRIA Anno Scolastico 2015/16 MATEMATICA

informatica di base per le discipline umanistiche

Esercitazione 9 - Funzioni

Domanda e offerta. consumatori di un bene/servizio per ciascun livello di prezzo del bene/servizio preso

ITI M. FARADAY PROGRAMMAZIONE DIDATTICA A.s CLASSI: QUARTE Materia: MATEMATICA e COMPLEMENTI Ore settimanali previste: 4 Matematica

Il metodo della regressione

MODULO 1: EQUAZIONI E DISEQUAZIONI 15 ore 1 quadrimestre

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

MODULO 1 - Esponenziali e logaritmi

UNITA DIDATTICA. Conoscenze. Abilità

Esercizi di ricapitolazione

LOGARITMI. Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA. L uguaglianza: a x = b

Perché il logaritmo è così importante?

COME SI STUDIANO MOLTISSIME MISURE?

IIS Algarotti, Venezia a.s. 2017/18 Classe 1C Turistico Materia: Fisica PROGRAMMA SVOLTO

MATEMATICA E STATISTICA

a rappresenta l intercetta o termine noto della retta, ossia il valore della y quando x = 0.

Linguaggi di Programmazione Corso C. Parte n.3 Linguaggi Liberi da Contesto e Linguaggi Contestuali. Nicola Fanizzi

Laboratorio di Fisica I Anno Accademico

Distribuzione Normale

4. CALCOLO DIFFERENZIALE PER FUNZIONI DI UNA VARIABILE REALE.

Programma dettagliato di matematica per le classi prime

L analisi dei dati. Primi elementi. EEE- Cosmic Box proff.: M.Cottino, P.Porta

Funzioni di una variabile reale

Regressione Lineare Semplice e Correlazione

PROGRAMMA DI MATEMATICA APPLICATA Classe III SIA sez. A A.S. 2015/2016

100 domande sul corso di Fisica Ambientale

MATEMATICA E STATISTICA

Classi: 4A inf Serale Disciplina: MATEMATICA Ore settimanali previste: 3

Corso di Informatica modulo Informatica di Base 6 CFU. I suoni Rappresentazione digitale

Esercizi sulle equazioni logaritmiche

Fisica per Medicina. Lezione 2 - Matematica e Cinematica. Dr. Cristiano Fontana

Distribuzioni campionarie. Antonello Maruotti

GRAFICI DI PROBABILITÀ Prof. Antonio Lanzotti

LICEO SCIENTIFICO RINALDO.D AQUINO MONTELLA ITIS BAGNOLI IRPINO PROGRAMMA SVOLTO A.S Materia: MATEMATICA Classe : 3 A Prof.

UNITÀ DIDATTICA 2 LE FUNZIONI

Esercizi di Ricapitolazione

Programma svolto nell'a.s. 2014/2015. Disciplina: Matematica. Classe: 3D Docente: Prof. Ezio Pignatelli. Programma sintetico.

Segnali e trasformate

LOGARITMI. log = = con >0, 1; >0 = >0, 1, >0. log =1 >0, 1. notebookitalia.altervista.org

Lezione 18 (8 gennaio) Limiti

La distribuzione delle frequenze. T 10 (s)

informatica di base per le discipline umanistiche

Funzioni Esponenziale e Logaritmica. Prof. Simone Sbaraglia

Controlli Automatici LA Segnali e trasformate

LICEO SCIENTIFICO G. VERONESE PROGRAMMAZIONE DELLA CLASSE 4 DSA a.s Prof. Agostino Buseghin MATEMATICA

Indici di eterogeneità e di concentrazione

Amministrazione, finanza e marketing - Turismo Ministero dell Istruzione, dell Università e della Ricerca

Le funzioni elementari. Corsi di Laurea in Tecniche di Radiologia... A.A Analisi Matematica - Le funzioni elementari - p.

APPLICAZIONE DELLA DEVIATA GAUSSIANA STANDARD

RELAZIONE FINALE DEL DOCENTE. Materia: MATEMATICA E COMPLEMENTI DI MATEMATICA Classe 4BPT A. S. 2015/2016

Proprietà delle funzioni. M.Simonetta Bernabei, Horst Thaler

COMPLESSITÀ COMPUTAZIONALE DEGLI ALGORITMI

Esame di Matematica e Abilità Informatiche - 12 Luglio Le soluzioni

Programma dettagliato di matematica per le classi seconde

Esercitazioni di ISTITUZIONI di MATEMATICA 1 Facoltà di Architettura Anno Accademico 2005/2006

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Tipi di variabili. Indici di tendenza centrale e di dispersione

Transcript:

informatica di base per le discipline umanistiche vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia

sesta lezione: la dinamica del testo vito pirrelli Istituto di Linguistica Computazionale CNR Pisa Dipartimento di linguistica Università di Pavia

come cresce il lessico di un testo? il lessico di un testo cresce quando introduciamo nel testo una parola mai usata prima intuitivamente la crescita di un lessico è rapida all inizio, in quanto ogni parola che usiamo ha la tendenza ad essere nuova (raramente ci sono ripetizioni nella stessa frase) aumentando il numero di frasi, tuttavia, aumenta la probabilità di riusare parole già usate il ritmo di crescita del lessico di un testo tende quindi a diminuire all aumentare del numero di frasi...

come cresce il lessico di un testo (prime 1000 parole) (torna indietro ) coefficiente angolare intercetta coefficiente angolare (continua )

come cresce il lessico di un testo (prime 1000 parole, interpolazione a potenza) (torna indietro ) (fine excursus) (fine excursus)

come cresce il lessico di un testo? (II) esistono classi di parole che è praticamente impossibile non ripetere all interno di un testo anche molto breve queste classi sono formate dalle cosiddette parole grammaticali (articoli, preposizioni, ausiliari ecc.), che costituiscono l impalcatura morfosintattica di una frase queste classi sono, tipicamente, relativamente ristrette (contengono pochi elementi) e chiuse, cioè non sono soggette ad espandersi attraverso processi produttivi del lessico come la derivazione o la composizione (per saperne di più clicca sulle parole evidenziate!)

come cresce il lessico di un testo? (III) un altro fattore evidente che ritarda la crescita esponenziale del lessico all interno dello stesso testo è la coerenza lessicale : la necessità, cioè,di ripetere concetti che sono legati al dominio o alla situazione specifica di cui parla il testo

la frequenza media la frequenza media di una parola nel testo è data dal rapporto tra la lunghezza del testo e la grandezza del suo lessico: C / V all inizio ogni parola è usata in media poco più di una sola volta (freq media 1) non appena ripetiamo una stessa parola, tuttavia, la freq media cresce (freq media > 1) in generale freq media tende a crescere per due ragioni: le parole grammaticali si ripetono, andando ad aggiungersi a C ma lasciando V invariato; il vocabolario a sua volta, come abbiamo visto, rallenta il suo ritmo di crescita col passare del testo

come cresce freq media? il ritmo di crescita di freq media tende a rallentare col passare del testo perché? la frequenza cresce linearmente al crescere del testo se il peso del lessico fosse costante, la crescita di freq media resterebbe lineare, ma avrebbe un ritmo inferiore (la retta che descrive questo andamento sarebbe più inclinata verso l asse delle x) se il peso del lessico aumentasse in modo lineare, freq media sarebbe costante dal momento che il lessico cresce in modo non lineare (con una potenza di poco inferiore all unità) solo una crescita di frequenza non lineare (con esponente di poco inferiore a 2) potrebbe consentire a freq media di crescere linearmente

(torna indietro ) crescita di freq media in un testo di 70.000 parole

(torna indietro ) curve di crescita del lessico (continua )

(torna indietro ) crescita di freq media (fine excursus)

cresce tutto così? no! la lunghezza media di una parola tende a stabilizzarsi col passare del testo, cioè tende ad assumere un valore costante dopo una serie di oscillazioni casuali (legge dei grandi numeri)

campionamento casuale analogamente se invece di monitorare lo stesso testo nel tempo, se ne estraggono tanti campioni casuali, e se ne calcola per ciascuno lun media, il valore più volte attestato tenderà a riprodurre lun media di tutto il testo...

campionamento casuale (II)... tanto meglio, quanto maggiore è la lunghezza dei campioni:

la distribuzione gaussiana 68.27%

la legge di Zipf, 3434. 2421 di 2258 il 1309 e 1297 la 1165 a 914 che 864 e' 847 in 830 per 789 all interno di una porzione un di testo, 693 esiste una correlazione L' 647 del 587 inversa tra le frequenza di una parola e la sua posizione I 585 con 467 relativa (rango) in una lista si di parole 467 che va dalla più le 466 frequente alla meno frequente ha 456 una 449 non 441 della 435 : 400 da 393 al 331-323 sono 291 dei 262 Piu' 260 dell' 251 ( 241 Ma 239 ) 238 Nel 238 anche 213 gli 213 alla 208 hanno 186 dal 181 anni 173 delle 159 all' 158 come 149 stato 145 Lo 143 f = C r α

Zipf (II)

il logaritmo

la funzione a x (esponenziale)

la scala logaritmica

Zipf (III) log( f ) = log( C) α log( r) y = 0.8797x + 3.4481

la struttura del lessico (classi di frequenza) chiamiamo V i la classe di parole che appaiono con frequenza i volte ciascuna nel testo allora V = V 1 + V 2 +...+ V max, dove max è la frequenza massima con cui una parola appare nel nostro testo

sesta lezione la dinamica del testo fine sesta lezione (lezione 7)